Sei qui: Home 5 SEO 5 Cos’è l’indicizzazione sui motori di ricerca? Come indicizzare un sito web

Cos’è l’indicizzazione sui motori di ricerca? Come indicizzare un sito web

da | 11 Mar 2021 | 2 commenti

Hai sentito parlare di indicizzazione, ma probabilmente non sai nel dettaglio che cosa significa, perché è vitale per un progetto online e soprattutto come avviene?

Per indicizzazione si intende:

L’inserimento di un sito web o un blog all’interno di un database, un indice.

In questo caso quello di Google.

In questo articolo ti spiego nel dettaglio cos’è l’indicizzazione sui motori di ricerca, quali sono le fasi con cui il motore di ricerca ottiene, cataloga e premia i contenuti ed infine ti parlerò della differenza tra questa attività ed altre correlate come l’ottimizzazione e il posizionamento.

Dopo questo articolo Google non avrà più segreti per te.

Che cosa significa indicizzazione sui motori di ricerca?

Hai appena creato un sito web, ma non è visibile negli indici di Google? O ancora stai raccogliendo tutte le informazioni che ti occorrono per creare e dedicarti a tutte quelle attività che possono dare una visibilità al tuo sito web?

Dopo la creazione di un sito, l’indicizzazione è il punto di partenza.

L’indicizzazione sui motori di ricerca è un processo mediante il quale i motori di ricerca organizzano tutte le informazioni del web all’interno appunto di un indice.

Per capire al meglio questo processo è giusto comprendere quali sono tutte le fasi che avvengono una volta creato e lanciato il tuo progetto online.

Le funzioni principali del motore di ricerca sono tre:

  1. Scansione: attraverso lo spider vengono scoperte nuove informazioni, quindi scansionare e nuove pagine, articoli e media. Questa è la fase iniziale in cui i contenuti vengono scoperti.
  2. Indicizzazione: i contenuti vengono organizzati all’interno di un indice settore per settore, l’attività di cui parleremo soprattutto in questo articolo.
  3. Posizionamento o ranking: il motore di ricerca organizza i contenuti che ha precedentemente scansionare indicizzato in un ordine preciso in base a tutta una serie di criteri, definiti i fattori di pagerank.

E l’ottimizzazione?

A differenza dell’attività citate sopra, l’ottimizzazione è quella disciplina del web marketing composta da un insieme di attività volte a posizionare una determinata query – l’insieme di parole chiave di una ricerca – sul motore di ricerca andando a seguire tutte quelle che sono le attività SEO.

Quindi, potremmo dire che le tre funzioni citate sopra sono strettamente connesse alla “macchina”, infatti è il motore di ricerca a scansionare, indicizzare e posizionare un sito web.

Mentre l’ottimizzazione è un insieme di attività svolte dai SEO Specialist (come me) volte a far crescere la visibilità di un brand, aumentare il suo traffico organico e portare conseguentemente più clienti all’azienda.

Scansione

scansione sui motori di ricerca

La scansione è il processo iniziale con cui il motore di ricerca scopre nuovi contenuti e viene effettuata dai cosiddetti crawler, definiti anche bot (nel caso di Google: Google bot).

Considera che farò spesso riferimento a Google, perché almeno per quanto riguarda l’Italia che è il paese che ci interessa viene utilizzato al 98%, quindi seppur gli altri motori di ricerca debbano essere considerati non hanno comunque lo stesso valore.

Per dare l’idea di come avviene la scansione il crawler viene chiamato anche spider, bisogna pensare ad una sorta di ragno che entra all’interno del sito e recupera tutti i contenuti come: testi, immagini, video, documenti PDF.

Tutto questo lavoro viene svolto la ricerca di nuovi URL creando poi così database di nuovi contenuti o ancora di contenuti vecchi, ma aggiornati.

Indicizzazione

indicizzazione di un sito sui motori di ricerca

Nella fase successiva i motori di ricerca elaborano tutte queste informazioni che lo spider ha raccolto e formano un enorme database con tutti i contenuti che rappresentano utilità.

Quest’ultima parola è di fondamentale importanza perché il motore di ricerca decide di inserire un sito web all’interno dell’indice se il suo contenuto effettivamente utile e se segue tutta una serie di best practice.

Tutti i contenuti che possono essere catalogati in una forma di spam vengono scartati.

Come avviene l’indicizzazione sui motori di ricerca?

Matt Cutts ha spiegato in modo esaustivo come avvengono la scansione e l’indicizzazione di un sito web, in questo video spiega in modo molto basilare semplice quello che accade quando un utente fa una ricerca web.

Come dice il numero uno della SEO, quando si fa una ricerca in realtà non si sta facendo una ricerca su Internet, ma all’interno dell’indice di Google, cioè all’interno dell’insieme dei risultati che Google ha catalogato.

Tutto parte degli spider che recuperano alcune pagine web e seguono i link al loro interno per recuperare tutte le informazioni in essi contenuti, dal punto di vista grafico potremmo davvero definirla come una ragnatela. Una volta recuperate tutte le informazioni vengono indicizzate, ovviamente stiamo parlando di miliardi di pagine memorizzate in migliaia di computer.

Quando fai una ricerca su Google, il motore di ricerca ti restituisce tutti i contenuti che ha catalogato che contengono quella specifica query e le organizza sulla base di tre fattori fondamentali pertinenza, qualità e autorevolezza.

Ti darà la possibilità di visualizzare anche le ricerche correlate degli utenti, di solito varianti della parola chiave utilizzata o ancora temi di approfondimento.

Analisi del documento

Quando parliamo di indicizzazione facciamo riferimento ad un’attività fatta da una macchina, quindi facendo l’esempio di un documento di testo il programma lo legge come una sequenza di byte, non come un insieme di parole.

Il linguaggio viene codificato da un apposito programma che ha il compito di identificare sequenze di caratteri che rappresentano parole e numeri ai quali dare un preciso significato e dunque restituirli poi nelle ricerche.

Negli ultimi anni gli sviluppatori hanno lavorato sempre di più a rendere il sistema più vicino al linguaggio naturale, classificando in modo più “umano” i documenti all’interno dell’indice.

In dettagli l’elaborazione del linguaggio si occupa di identificare:

  • La lingua con cui viene redatto un documento, questo è uno dei passaggi più importanti perché va a denti ficcare la lingua di ogni documento.
  • Informazioni aggiuntive su ogni parola per capire al meglio il senso del contenuto, come sinonimi e parole che compongono il contesto.
  • I formati dei file, a cui il motore di ricerca deve riuscire ad accedere come: codice html, file di testo in ASCII, PDF, SML, Microsoft Word, Excel e Powerpoint oltre che tutta una serie di formati legati al linguaggio utilizzato dei server. Esistono poi invece tutta una serie di formati di file compressi come ZIP, RAR, GZIP etc.

Un ruolo fondamentale per l’indicizzazione è svolto dal riconoscimento dei tag HTML che servono proprio per organizzare la struttura delle pagine web e definire gli elementi del contenuto che rivestono un ruolo più importante.

I tag non sono altro che dei dati strutturati che aiutano a far comprendere al motore di ricerca le informazioni relative ad una pagina web, per visualizzare i tag di una pagina è possibile effettuare con il tasto destro ispeziona pagina prendersi conto della struttura della pagina HTML.

Per approfondimenti sul codice HMTL:

3 passaggi di base per indicizzare un sito web sui motori di ricerca

Le informazioni di seguito per indicizzare un sito web sui motori di ricerca servono per farti avere una panoramica completa di come accelerare il processo di scansione e indicizzazione del tuo sito, ovviamente il mio consiglio è quello di affidarti ad un professionista che conosca bene tutte queste attività.

Soprattutto nel caso in cui tu abbia un sito aziendale le strade sono due: formarsi per imparare tutto ciò che occorre o rivolgersi ad un professionista per non rischiare dei danni irreparabili, infatti non è raro che alcuni siti web vengono eliminati dall’indice di Google a causa di errate manipolazioni.

Ti invito dunque a seguire queste informazioni per avere una panoramica generale di alcune attività di base da compiere.

Sitemap

sitemap

Una volta che hai creato il tuo schema per la struttura del sito, hai fatto realizzare tutte le pagine e le ultime modifiche sono state effettuate sei pronto per comunicare al motore di ricerca l’esistenza del tuo sito.

A questo punto subentra quella che viene definita sitemap, la mappa del sito, cioè quel documento collocato all’interno della cartella principale del sito in cui vengono elencati tutti i contenuti del tuo sito web.

In questo modo, nel momento in cui il BOT entra all’interno delle pagine e trova la sitemap, ha modo di avere subito a portata di mano una sorta di piantina per orientarsi all’interno del tuo sito, agevolandogli così la navigazione.

Se vuoi approfondire l’argomento ti invito a leggere l’articolo che ho scritto su:

Ok Nadia, ma quindi adesso con questa sitemap che cosa ci faccio?

Semplice, e come quando registri al catasto una nuova casa, le invii direttamente al motore di ricerca grazie ad uno strumento – che semplifica la vita a tutti noi che facciamo questo lavoro – che si chiama Google Search Console.

All’interno di Google Search Console è presente una sezione dedicata, che si chiama sitemap, in cui ti basta semplicemente copiare incollare l’urlo della tua mappa e inviarlo Google. Ora ti starai chiedendo quando inviare una sitemap a Google, ho già pensato alle risposte e i casi sono due:

  • Quando hai creato un nuovo sito web ed è pronto per essere indicizzato
  • Quando hai fatto fare il restyling del sito e vuoi che dunque Google vada a scansionare nuovamente le tue pagine

 

inviare sitemap google search console

File Robots.txt

Se hai già letto altri articoli di questo blog saprai che non entro mai troppo nel tecnico, ma cerco di fare sempre degli esempi che possano essere comprensibile a tutti.

Ecco, in questo caso il file Robots.txt è un file di testo che crei inserisci sempre all’interno della cartella principale del sito e che va visto come una sorta di annuncio attaccato la porta in cui comunichi chi può entrare e chi no.

Il file Robots.txt è appunto un file che dà delle direttive ai crawler, per fare in modo di scansionare o meno determinate pagine. La grammatica del file Robots è molto semplice, ma come per tutte le cose bisogna avere un minimo di dimestichezza per poterlo modificare, quindi non farlo se non ti senti sicuro.

Per visualizzare il file robot di un sito, ti basta digitare il nome del sito /robots.txt ed ecco che ti appariranno le istruzioni del file di quel sito.

Le istruzioni più comuni sono le seguenti:

  • L’intestazione del file, il nome con cui definiamo lo spider: User-agent
  • In riferimento a tutti i crawler del web: *
  • Il comando per dire un elemento che deve essere letto dallo spider: Allow
  • Il comando per dire un elemento che non deve essere letto dallo spider: Disallow
  • L’url su cui si trova la sitemap del sito

 

Differenza tra scansione, indicizzazione, ottimizzazione e posizionamento

A questo punto, dovresti avere una visione più completa su che cos’è l’indicizzazione, ma per essere ancora più esaustiva voglio fornirti alcune definizioni che spesso portano a confondere chi non si occupa di questa materia.

Abbiamo visto che la scansione è il momento in cui il crawler dei motori di ricerca scopre nuovi contenuti, l’indicizzazione è invece la fase in cui li inserisce all’interno di un indice, un enorme database in cui sono presenti miliardi di pagine web.

Ci sono poi altre due parole correlate che sono: ottimizzazione e posizionamento (definito anche ranking).

L’ottimizzazione sui motori di ricerca è l’insieme di quelle attività volte a migliorare l’area tecnica, dei contenuti e dell’autorevolezza di un sito per fare in modo che possa migliorare il suo posizionamento organico nelle ricerche di Google.

Il posizionamento, invece anche se è strettamente connesso all’ottimizzazione riguarda i motori di ricerca, infatti è sempre questo a decidere che posizione dare ad un determinato risultato. Quello che possiamo fare noi SEO, e quello di influenzare questa scelta.

A questo punto rispondo tutta una serie di domande frequenti che vengono poste sul web e riguardano questo argomento.

Domande frequenti

Cos'è l'indicizzazione di Google?

Quando si parla di indicizzazione ci si riferisce ad un termine un po’ generico, perché riguarda le attività svolte da una macchina che determinano l’inserimento di un contenuto all’interno di un indice. Con indicizzazione di Google invece si intende l’attività svolta dal Google BOT per l’inserimento di dati all’interno del database di Google.

Voglio che i motori di ricerca indicizzino il mio sito.

Per indicizzare il tuo sito devi intanto essere sicuro di aver ultimato tutte le varie modifiche, una volta fatto poi collegarti a questa pagina per segnalare direttamente il nuovo URL al Google. Dopodiché, configura il tuo nuovo account di Google Search Console e invia la Sitemap.

Come faccio a sapere se un sito è stato indicizzato?

Se hai creato un nuovo sito web e hai il dubbio che non sia ancora indicizzato sui motori di ricerca, per verificare l’indicizzazione ti basta andare sulla barra di ricerca Google e scrivere:

site:www.nomedelsito.it

Se il sistema ti restituisce le pagine del tuo sito significa che si trova negli indici di Google. Considera che anche se hai inviato la mappa del sito ci vuole un po’ di tempo affinché il sistema lo riconosca.

Perché il mio sito non esce su Google?

Questa è una delle domande più frequenti fatte da chi giustamente non conosce questo settore, le situazioni e le risposte possibili possono essere molte.

Eccone alcune:

  • Il tuo sito non è stato indicizzato correttamente
  • L’indicizzazione è avvenuta correttamente, quindi non ti resta che aspettare
  • Il sito è stato indicizzato, ma ancora non è posizionato per alcuna parola chiave di riferimento per la tua attività (quindi dovresti valutare un servizio di ottimizzazione di un professionista)
  • Il sito indicizzato, ma esce soltanto con la parola chiave brand cioè con il nome dell’attività. Questo è sicuramente un punto di partenza, perché significa che il sito è presente. Da questo punto in poi è necessario avviare tutte le attività di ottimizzazione per fare in modo di posizionare il sito per le parole chiavi più importanti della tua attività.
  • Il sito era indicizzato e adesso è scomparso, I motivi possono essere diversi, ma quando un sito viene deindicizzato significa che ha violato una delle regole di Google. Questo avviene per esempio per i siti spam.

 

Quali sono i motori di ricerca principali?

In questo articolo mi sono concentrata sull’indicizzazione di un sito web su Google, ma le regole generali valgono anche per gli altri motori di ricerca come Yahoo, Bing e Yandex.

Cosa sono gli strumenti SEO?

Oltre alle competenze acquisite informazioni ed esperienza, i SEO Specialist utilizzano tutta una serie di strumenti SEO, sul web li trovi con il nome di SEO tool. Ovviamente, avere questi strumenti può aiutare tantissimo, ma vanno anche saputo utilizzare in un certo modo.

Tra i migliori strumenti ci sono:

  • Semrush, il programma per fare SEO numero uno al mondo per tutti i tipi di mercato proprio perché è possibile fare ricerche su diverse lingue e quindi aree geografiche;
  • Seozoom, la suite italiana di web marketing, a mio avviso ideale soprattutto per i blogger che vogliono ottimizzare i loro contenuti utilizzando uno strumento semplice.

Come strumenti esistono in ogni caso anche dei programmi gratuiti, che ti consentono di fare delle ricerche che seppur limitate ti danno delle informazioni di base, come per esempio Google trends

Se vuoi approfondire ecco la mia Guida su Google trends

Anche se con questo articolo ho risposto ad alcune delle tue domande, immagino che tu ne abbia ancora molte, quindi ti invito a lasciare un commento qua sotto e mi farà piacere risponderti e consigliarti le soluzioni migliori per la crescita del tuo sito web.

Se invece hai bisogno di un Consulente SEO a Milanoda remoto in tutta Italia ti rimando alla pagina dedicata: SEO Milano.

Un saluto

Nadia

Nadia Kasa

Nadia Kasa

Blogger & SEO Specialist

Ciao! Ti do il benvenuto nel mio blog dove troverai tanti consigli su come creare un sito e soprattutto come farlo crescere grazie alla SEO, l’ottimizzazione per motori di ricerca.
Se hai bisogno di un alleato per posizionare il tuo sito dai un'occhiata al mio servizio di Consulenza SEO.

Il Programma SEO per Posizionare il Tuo Sito Web su Google

👉 Aumenta il traffico organico sul tuo sito web con uno Strumento Facile

👉 Progetta la tua Strategia di Posizionamento come le grandi aziende

👉 Ottieni più clienti in target con il tuo sito web grazie al supporto di Semrush

GRATIS PER 14 GIORNI

Leggi anche questi articoli:

Hai qualche domanda? Lascia un commento.

Mi fa piacere rispondere alle tue domande e sapere cosa ne pensi dell’articolo, lascia un commento.

2 Commenti

  1. Nino Faccì

    Ciao Nadia, grazie intanto per quest’altra ottima guida che fa proprio al caso mio, visto che, proprio in questi giorni, mi trovo a familiarizzare col concetto di sitemap, realizzando tra l’altro che è un po’ diverso da come me lo immaginavo all’inizio, quando sentendo parlare per la prima volta di “mappa del sito”, avrei piuttosto pensato ad un semplice elenco delle pagine principali, come quello delle categorie nel tuo footer, o ancora più ingenuamente, alla mappa di localizzazione.

    Arrivo però alle mie domande:

    1) sarebbe possibile ottenere una sitemap del proprio sito, prima della sua effettiva messa online? (mi riferisco nel mio caso a siti realizzati in locale e che non hanno quindi ancora un dominio da segnalare a Google Search Console)

    2) se una sitemap è così importante, perché poi nessun sito (ad eccezione di pochissimi) ci tiene a pubblicare in home un link alla sua versione .html? ( sebbene questa sia poi abbastanza facile da ottenere, quando per esempio volessimo andare a “scansionare” la sitemap di un sito/blog concorrente).

    Rispondi
    • Nadia Kasa

      Ciao Nino,
      la sitemap xml è una pagina in cui vengono catalogati i contenuti del sito (pagine, archivi etc.) e serve soprattutto ai motori di ricerca per avere un quadro completo di tutto ciò che è presente nel sito, per fare una metafora è come se fosse la cartina che ti consegna l’architetto per il progetto di una casa su misura. La sitemap in html invece è più una sorta di pagina di orientamento per l’utente, da SEO Specialist ti dico che la prima ci deve essere, mentre la seconda rappresenta una scelta soggettiva.
      Invece per rispondere alla domanda del sito in locale, considera che puoi realizzare la tua sitemap anche con plugin SEO, quindi quello non è un problema, ovviamente la sua utilità si presenterà quando il sito verrà scansionato dal Bot, quindi dall’effettiva messa online.
      Un saluto

      Rispondi

Invia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.

error: Il contenuto è protetto