• About Author

  • Tutta l'Informazione Ninja nella tua mail

  • Verifica l’indicizzazione del sito con gli strumenti più efficaci

    28 Luglio 2022

    Verificare l’indicizzazione di un sito web è un’operazione molto importante in quanto potrebbe aiutarti a correggere eventuali penalizzazioni o a colmare lacune che alcune pagine potrebbero presentare. Un’operazione essenziale non solo nelle prime fasi di lancio e di messa online di un nuovo progetto, ma per l’intera durata del progetto stesso. Prima di procedere è necessario fare una dovuta precisazione: migliorare l’indicizzazione non vuol dire in alcun modo ottimizzare, piuttosto l’analisi dell’indicizzazione può essere considerata una prima azione da compiere per preparare il sito web a una eventuale ottimizzazione in ambito SEO (cioè in ambito di Search Engine Optimitation). L’ottimizzazione nel senso più stretto del termine, infatti, riguarda le operazioni di posizionamento, che si concretizzano in interventi specifici realizzati da un professionista per perfezionare la strategia SEO in atto sul portale di riferimento per il raggiungimento degli obiettivi prestabiliti. Per questi motivi ancor prima di approfondire la tematica dell’articolo di oggi, risulta di assoluta importanza comprendere sino in fondo le differenze presenti nei termini: indicizzazione e posizionamento. Procederemo per piccoli passi per offrirti un quadro chiaro e completo.

    Differenza tra indicizzazione e posizionamento

    Qual è la differenza tra indicizzazione di un sito web e posizionamento? Siamo certi che più volte ti sarai posto questa domanda. Nonostante la profonda differenza che corre tra le due operazioni, è semplice constatare una certa confusione quando si parla di SEO, tra gli addetti ai lavori e non solo. Capire sino in fondo la differenza tra indicizzazione e posizionamento è un ulteriore passo da compiere per comprendere tutte le dinamiche che si celano dietro queste due operazioni apparentemente semplici.   

    Cominciamo dall’indicizzazione. 

    Si tratta di un’operazione svolta da tutti i motori di ricerca e indispensabile per scovare nuovi contenuti in rete (testi, immagini e più in generale pagine web), che vengono automaticamente inseriti all’interno di un database, per l’appunto un indice. Si tratta di un’attività alquanto meccanica, di sola lettura del sito web. Ma attenzione: far indicizzare pagine strategicamente rilevanti è indispensabile per poter conseguentemente migliorare il posizionamento dello stesso sito web.  L’interesse nell’indicizzazione di un sito web è certamente del proprietario del sito ma, nello stesso tempo e in ugual misura, del motore di ricerca. Ma quale potrebbe essere l’interesse di un motore di ricerca nell’indicizzare un nuovo portale? La risposta è alquanto semplice. Ogni motore di ricerca ha una costante esigenza di mantenere alto il suo livello qualitativo e di rinnovare costantemente le risorse pubblicate al suo interno, cioè nel suo indice. Per questi motivi lo stesso Google mette a disposizione di tutti coloro che ne hanno bisogno delle linee guida e dei suggerimenti su come poter migliorare la pubblicazione e l’indicizzazione di un nuovo sito web (e non solo). Come già accennato, l’indicizzazione è un’operazione automatica che quotidianamente viene svolta da tutti i motori di ricerca presenti in rete. Pertanto, un sito ben costruito con contenuti ottimizzati e un hosting performante possono migliorare e velocizzare la scansione del portale, permettendo di indicizzare un numero crescente di pagine in un tempo relativamente ristretto.  Contrariamente, la scansione potrebbe richiedere più tempo e porre delle difficoltà all’operazione di indicizzazione del sito web, delle pagine e dei contenuti in esso contenuti. Per evitare tale risultato un esperto SEO potrebbe intervenire nella site map e con l’uso di specifici tag evitare alcune pagine ‘problematiche’ vengano scansionate, ottimizzando in questo modo l’intera operazione di lettura del sito web da parte dei motori di ricerca.  

    Il posizionamento invece, in cosa consiste? 

    Il posizionamento consiste in operazioni molto differenti, basandosi su concetti molto diversi da quelli che sinora abbiamo avuto modi di analizzare e che in questa occasione proveremo solo ad accennare. Chi lavora sul posizionamento si concentra sulle query e sulle keywords e sul cosiddetto posizionamento organico, escludendo conseguentemente qualsiasi influenza dalle campagne a pagamento che è possibile progettare ad esempio su Google, solo per citarne uno).  Il posizionamento, dunque, si basa su operazioni che solo uno specialista del settore riuscirebbe a realizzare, metodologie sempre in costante evoluzione che vanno di pari passo con lo sviluppo e l’avanzamento degli algoritmi alla base dei motori di ricerca.  

    Ma qual è il vero fine del posizionamento? 

    Se sin qui ti è tutto chiaro, ti sarai certamente posto questo interrogativo. Se alla base c’è l’ottimizzazione delle pagine del sito web e l’attuazione di una strategia ampia e articolata, l’obiettivo ultimo delle operazioni di indicizzazione e posizionamento consisterà non solo nell’aumentare il traffico organico verso il portale, ma nella realizzazione dell’obiettivo della strategia stessa, cioè l‘aumento del fatturato mediante un ampliamento dell’autorevolezza e della visibilità del brand.      Vuoi usare l’indicizzazione e il posizionamento per far crescere il tuo brand? Scopri il corso SEO Energy di Ninja Academy 

    Come verificare l’indicizzazione di un sito

    Prima di poter procedere con la verifica dell’indicizzazione di un sito web, è essenziale comprendere i meccanismi che si celano dietro questa operazione e i termini che, nel gergo, vengono utilizzati per poter scandire le fasi che ne regolano l’attuazione.  I termini da tenere bene a mente quando si parla di indicizzazione di un sito web sono 3: crawling, web spider e Google Bot. Il primo indica la vera e propria azione di scansione del web da parte dei motori di ricerca per scoprire nuovi contenuti. E si realizza principalmente attraverso gli hyperlink, cioè quella rete di collegamenti ipertestuali che per l’appunto legano pagine diverse dello stesso sito o di siti web differenti.  Il secondo, web spider, identifica il software che concretamente realizza la scansione e, infine il terzo, Google Bot, identifica il software proprietario di Google che permette la scansione di siti web alla continua caccia di nuove pagine e nuovi contenuti da indicizzare e conseguentemente da posizionare nei propri risultati di ricerca.   

     

    Verificare l’indicizzazione attraverso gli operatori ‘Site e Related’

    Ma come poter verificare l’indicizzazione di un sito web ed eventuali sotto-domini collegati? Il metodo più semplice e veloce è attraverso l’utilizzo dell’operatore “site”. Occorrerà andare sul motore di ricerca (nella maggior parte dei casi Google) e scrivere nelle barra di ricerca il dominio di cui vorresti verificare l’indicizzazione seguito. La ricerca verrà espressa in questi termini:  – site:www.sito.it  – site:sottodominio.sito.it  Semplice, non trovi?  Attraverso questa operazione in pochi minuti sarà possibile scoprire quali pagine sono state indicizzate e quali no. Ma oltre al “site” esistono anche altri operatori che potrebbero aiutarti nella verifica dell’indicizzazione del sito web, come operatore “Cache” e “Related”.  Se il primo, l’operatore Cache, ti consente di verificare come una pagina è stata letta dallo spider del motore di ricerca e come è stata inserita nel suo database, permettendoti di scoprire anche la data esatta di quando questa operazione è stata portata a termine; l’operatore Related invece consente di trovare pagine simili a quella del dominio indicato nella barra di ricerca.  Ultimo, ma non per importanza, è lo strumento offerto dallo stesso Big G. cioè il Google Search Consolle, che fornisce tutta una serie di strumenti per poter verificare in maniera chiara l’indicizzazione del sito web, le pagine convalidate e quelle che contrariamente presentano problemi o che nel tempo potrebbero crearne di nuovi. 

    – Altri operatori utili in ambito SEO 

    Oltre agli operatori precedentemente elencati ne esistono degli altri che consentono di filtrare e perfezionare le nostre ricerche online. Spesso per indagare su una query di ricerca e ottenere le risposte per noi più interessanti, bisognerà utilizzare “le chiavi giuste”. Usarle è molto semplice: basterà digitarle direttamente nella barra di ricerca di Google senza dimenticare la punteggiatura corretta solitamente ignorata dai motori di ricerca, ma contrariamente utile nel caso di ricerche con operatori.  Anche in questo caso Google fornisce una guida sugli operatori più comuni e su come utilizzarli per filtrare i risultati di ricerca. Gli operatori di ricerca avanzata sono circa 10, ma in questa occasione ne vedremo solo alcuni.  – Le virgolette: la corrispondenza esatta (“”) Come dicevamo la punteggiatura viene ignorata per quanto riguarda i termini di ricerca, ma questo non accade con gli operatori. Le virgolette aiutano a trovare una corrispondenza esatta, restringendo in questo modo i risultati di ricerca alle corrispondenze che effettivamente ci saranno più utili per analizzare l’indicizzazione di un sito web. Difatti, inserendo le virgolette la ricerca avverrà esattamente così come è stata scritta, senza alcun miglioramento suggerito dallo stesso operatore di ricerca. Ultimo, ma non per importanza, è la possibilità di trovare dei contenuti duplicati presenti nel sito, elementi che potrebbero in qualche modo danneggiare la strategia SEO in atto.  – Il trattino meno e più: l’esclusione (-) e l’inclusione (+)  Il trattino meno serve a escludere termini specifici della nostra ricerca. Pertanto si tratta di un operatore che ci aiuta a perfezionare ulteriormente la nostra ricerca, permettendoci di lavorare direttamente sull’esclusione. Diametralmente opposto è invece l’operatore più, che permette invece di includere delle parole chiave nella query che stiamo proponendo al motore di ricerca. Quindi si tratta di un operatore che banalmente lavora in senso opposto al trattino meno.  – Operatore inurl: e intitle Sono operatori simili nella loro funzionalità e molto utili per il nostro obiettivo. Infatti ‘inurl’ permette di scovare le pagine che hanno determinate parole chiave all’interno della propria URL, mentre ‘intitle’ permette di compiere la stessa operazione ma all’interno del tag Title di una pagina web. Due operatori che nella loro semplicità possono aiutarti notevolmente a comprendere l’indicizzazione del sito web e indispensabili nell’attuare eventuali interventi.  

    Gli interventi da pianificare nel caso di una mancata lettura

    Ma cosa fare se la verifica dell’indicizzazione di un sito web non ha mostrato i risultati sperati? Cosa potremmo migliorare nel caso tutte, o solo alcune pagine, non siano state indicizzate come avevamo pianificato?  In questi casi ci sono alcuni interventi che dovresti pensare di effettuare immediatamente sul sito web.  

    1. Controllare la site map del portale

    Se la verifica dell’indicizzazione del sito web non è andata come speravi, probabilmente la site map potrebbe essere compromessa o non completa. Ma cos’è una site map? Si tratta di un documento che indica allo spider di turno tutte le pagine del sito web, evidenziando quelle più e meno importanti per l’indicizzazione del sito web. Il primo passo da compiere è quello di verificare che la site map sia stata creata correttamente (per poterlo fare è necessario visitare un link così costituito https://iltuosito.it/sitemap.xml) e nel caso esistesse, verificare quali pagine sono stateidnciate all’interno del file.  Ma come poter realizzare questo documento? Manualmente o automaticamente: molto dipende da come il sito web è stato realizzato, ma indipendentemente da come è stata costituta in taluni casi, soprattutto quando viene ignorata dai Bot, sarà necessario indicare il link della site map all’interno della Google Search Consolle, nell’apposita sezione della dashboard. Ma cos’è la Google Search Consolle? Provo subito a spiegartelo.  

    2. Collegare il sito web alla consolle del Big G.

    La consolle offerta gratuitamente da Google, cioè la Google Search Consolle, è uno strumento indispensabile per poter analizzare, comprendere e migliorare l’indicizzazione di un sito web. Un collegamento, questo con la consolle, che ti consigliamo di realizzare soprattutto in quei progetti dove la verifica dell’indicizzazione del sito web è un’operazione richiesta e necessaria.   Questo strumento offre la possibilità di controllare uno specifico URL, un intervento importante per porre l’attenzione del motore di ricerca su una pagina web male indicizzata o senza alcuna indicizzazione. Dunque, accedendo al “controllo URL” e dopo aver atteso la verifica dei link da parte di Google, sarà possibile chiedere un’indicizzazione specifica per l’URL.  In questo modo è possibile invitare il motore di ricerca (in questo caso Google) a prestare attenzione a specifiche sezioni del sito web ignorate, per un motivo o per un altro, dal Google Bot. Un’operazione che è possibile ripetere nel tempo e di grande importanza per il monitoraggio e la verifica dell’indicizzazione del sito web.

     

    I vantaggi di utilizzare la Search Engine Consolle

    Come già accennato, la consolle è uno strumento assolutamente utile per tutti coloro che hanno l’esigenza di monitorare e analizzare l’indicizzazione di un portale web. Ma quali sono nello specifico i vantaggi di collegare un sito web alla Search Consolle di Google? I vantaggi offerti dalla piattaforma sono molteplici, alcuni dei quali utilissimi nell’analizzare nel dettaglio come il tuo sito viene recepito dallo spider di Google. Vediamo nello specifico alcuni dei vantaggi di tale piattaforma: – Si tratta di un tool gratuito, senza alcun costo aggiuntivo nel tempo. Aspetto fondamentale quanto raro oggi;Offre la possibilità di scoprire nuove parole chiave rilevanti nel tuo settore merceologico; – Permette di settare alert per eventuali errori che nel tempo potrebbero sorgere all’interno del sito web; – Si tratta di uno strumento facile da settare sin dal primo utilizzo; – Permette di analizzare nello specifico come il sito e le sue pagine correlate sono state indicizzate dal Google Boot.  

    3. Verificare che il file robot.txt sia funzionante

    Ultimo, ma non per importanza, è il controllo che è possibile inoltrare sul file robots.txt, un elemento altrettanto valido per indicizzare e ben posizionare il sito web tra i risultati di ricerca del big G.  È possibile verificare l’esistenza di questo sito nella directory principale del portale web ed è possibile realizzarlo – anche in questo caso – in due metodologie differenti: manualmente, scrivendo il codice del file semplicemente a mano e inserendo le informazioni indispensabili per i web spider, come ad esempio l’indicizzazione della site map del sito web. Oppure automaticamente, attraverso dei plugin specifici per i CMS più diffusi (es. WordPress). Come scrivere un file robots.txt in maniera semplice Come già accennato, è possibile realizzare un file robot.txt in maniera automatica attraverso l’utilizzo di plugin specifici, o manualmente scrivendo il codice che occorre. Ma eccoti subito un esempio da cui partire per la composizione del file robot.txt del tuo sito web: User-agent:* allow: “permetti” disallow: “non permetti” Queste tre voci sono i tre punti di partenza per la compilazione di un corretto file, ma vediamo nello specifico a cosa queste voci si riferiscono. La prima, (User-agent:*) è rivolta essenzialmente ai motori di ricerca, ed indica quali di loro è rivolto il file robot.txt. L’asterisco presente nel testo indica la volontà di rivolgersi a tutti i moduli di ricerca, e dunque a nessuno in particolare.    Le voci che seguono, cioè l ‘allow’ e il ‘disallow’ indicano le sezioni e le risorse che vorremmo che il motore di ricerca indicizzi correttamente. Elementi di assoluta importanza per permettere ai BOT di leggere scansionare l’intero sito web o una parte di esso. Ma esistono dei codici aggiuntivi che potremmo adoperare, ad esempio per bloccare la lettura dell’intero sito potremmo inserire un codice così composto: User-agent:* Disallow:/ Per far sì che il BOT legga indiscriminatamente tutto il sito web potremmo inserire: User-aget:* Allow:/ Per far sì che solo alcune delle pagine o delle risorse del sito web vengano escluse è possibile utilizzare un codice così composto: User-agent:* Disallow: /page.html Disallow: /photo.jpg Per far sì che invece vengono escluse specifiche cartelle è possibile utilizzare un codice così composto: User-agent:* Disallow:/folder/ Disallow:/css/ Questi sinora mostrati sono solo alcuni degli esempi di come poter realizzare un file robots.txt funzionale per l’indicizzazione del sito web. Ti consigliamo di approfondire l’argomento e di realizzare il file più adatto al tuo portale. Vuoi conoscere tutte le tecniche per una SEO Strategy infallibile? Scopri il corso SEO Energy di Ninja Academy