manuale seo gardening su amazon

Il sito non si trova su Google. Cosa fare?

sito-non-si-trova-su-google
libro webmaster con wordpress

Può capitare che un nuovo sito web non sia immediatamente indicizzato da Google. Per immediatamente intendo qualche giorno, tutt’al più, nei casi limite, un paio di settimane. Di solito non accade mai che un nuovo sito non si trova su Google trascorso questo breve periodo di tempo. Ma possono accadere situazioni in cui, dopo diverse settimane, google non voglia saperne di indicizzare il nostro sito. Perché? Quali possono essere le cause? Come risolvere?

Quando il sito non si trova su Google

Come ci si accorge che un sito non è stato indicizzato da Google? Basta fare una semplice ricerca con il nome del dominio. Per fare un esempio potrei cercare il mio blog su Google scrivendo flavioweb. Se Google mi restituisce dei risultati significa che è stato indicizzato. Altrimenti dovrei iniziare a preoccuparmi.

Un altro modo, più professionale, è scrivere il nome del dominio preceduto dall’operatore site. In questa maniera: site:flavioweb.net.

In questo caso Google mi restituisce tutte le pagine del sito che ha inserito nel suo indice, presumibilmente nell’ordine in cui ha giudicato autorevoli le pagine stesse, dalla più autorevole alla meno autorevole.

Ma se provando con uno di questi due metodi, invece di uscire l’elenco delle pagine, non uscisse nulla, allora significa che Google non ha indicizzato il sito.

Perché il sito non si trova su Google

La ragione per cui un sito non si trova su Google è dovuta solitamente ad un blocco impostato sul file robots.txt. Qualcuno forse non saprà nemmeno cosa sia questo file. Si tratta di un semplicissimo file di testo all’interno del quale possono essere definite delle regole per bloccare l’accesso al crawler dei motori di ricerca per impedire l’indicizzazione di una o più pagine. Ma come direte voi, bloccare l’indicizzazione? E chi farebbe mai una cosa simile? In realtà questa pratica è molto utilizzata per negare l’indicizzazione di pagine sensibili, che devono stare sul sito ma che non devono essere pubbliche (anche se poi Google alla fine fa come gli pare).

Ma torniamo al Robots.txt.

Il blocco dell’indicizzazione di tutte le pagine del sito, quello che poi determina il fatto che il sito non si trova su Google, può avvenire in maniera del tutto casuale, involontaria ed automatica. Non ricordo qualcuno che abbia impostato una regola di blocco totale volontariamente. Al limite è stata impostata durante la fase di costruzione del sito e poi ci si è dimenticati di toglierla.

Quando la causa del fatto che il sito non si vede su Google è il file robots, Google ce lo dice, restituendo sulla pagina di ricerca su cui abbiamo fatto le verifiche precedentemente spiegate, un messaggio chiaro ed inequivocabile, come nell’immagine successiva.

 

il-sito-non-si-trova-su-google

Sito non si trova su Google

 

Come si risolve?

Come permettere a Google di indicizzare il sito

Per prima cosa, andiamo a leggere il contenuto del file robots.txt. Lo troviamo nella root principale del sito (potremmo anche non trovarlo ma di questo parleremo a breve).

Quindi colleghiamoci al server tramite un client FTP come Filezilla. portiamoci nella directory principale del sito e scarichiamo sul nostro computer il robots.txt.

scaricare-il-file-robots-txt

scaricare il file robots txt

 

Adesso apriamolo con un editor di testo qualsiasi che possa consentirci di salvare nel formato txt.

Se troviamo la situazione come vediamo nell’immagine seguente, allora abbiamo trovato subito la causa del fatto che il sito non si trova su Google.

file robots che blocca indicizzazione sito

file robots che blocca indicizzazione sito

Spieghiamo perché.

La prima istruzione, User-agent: * , indica che la regola vale per tutti i crawler di tutti i motori di ricerca.

La seconda istruzione, Disallow: /, fa si che tutti i motori di ricerca non possano accedere alla root del sito e quindi al sito intero. In questa maniera, né Google, né gli altri motori di ricerca, potranno scansionare le pagine del sito e, di conseguenza, indicizzarle.

Se troviamo questa situazione, basterà rimuovere lo slash che segue il Disallow , salvare di nuovo il file (come robots.txt) e ricaricarlo sul sito.

User-agent: *
Disallow:

Quando il robots.txt non c’è

Può succedere che il file robots.txt non sia presente. Con WordPress ad esempio è così. Andiamo a spiegare proprio come comportarsi con questa fattispecie.

Per prima cosa portiamoci sulla bacheca di WordPress. Poi su Impostazioni —> Lettura.

Controlliamo che NON sia spuntata la voce “Scoraggia i motori di ricerca ad effettuare l’indicizzazione di questo sito”. Se fosse spuntata, eliminiamo il flag e salviamo.

visibilita ai motrori di ricerca

togli la spunta a visibilita ai motrori di ricerca

Non Basta

Può darsi che la spunta non ci sia e nonostante questo il sito non si trova su Google. Può darsi che invece ci sia e dovete toglierla. I entrambi i casi, per esperienza, questo non basta.

Creiamo il file robots.txt

Mettiamoci al lavoro per risolvere definitivamente il problema e, con un semplice editor di testo, creiamo un nuovo file robots.txt.

Inseritevi queste istruzioni e salvatelo con il nome robots.txt

User-agent: *
Disallow:

Adesso caricatelo sul server con Filezilla, mettendolo nella root del sito (di solito, a seconda dell’hosting utilizzato, può avere il nome di public_html, www, httpdocs). Sappiate comunque che deve stare nello stesso percorso dove risiedono i file di wordpress (es. wp-config.php e gli altri).

Attendete una decina di minuti o più, dopodiché portatevi sulla Search Console per verificare che il nuovo file robots sia stato “digerito” e che non blocchi l’accesso agli spider di Google.

Lo potete verificare nella sezione Scansione —>  Tester dei files robots.txt

Se cliccando sul pulsante “Testa” vi restituisce la scritta “Consentito“, significa che il file robots.txt è ok.

test file robots

test file robots

Aiutiamo Google ad indicizzare il nostro sito

Terminata questa procedura, dovremo attendere qualche giorno prima che il sito inizi ad essere indicizzato. Nei giorni seguenti, man mano che passano, vedremo comparire su Google le nostre pagine, un po’ per volta, non tutte insieme.

Possiamo però cercare di velocizzare il processo di indicizzazione in due semplici modi:

  • Segnalando le pagine a Google con l’add url presente sulla Search Console
  • Creando nuovi punti d’ingresso al sito per Googlebot

Fare l’Add Url sulla Search Console

Portatevi nella sezione Scansione —> Visualizza come Google della Search Console.

visualizza come google

L’add url si fa da “visualizza come google”

Iniziate dalla home page. Lasciate la casella di testo vuota e cliccate sul pulsante “Recupera“. La url sarà visualizzata di seguito con accanto il pulsante “Richiesta d’indicizzazione” che dovrete cliccare. Al termine del processo, avrete segnalato a Google la pagina ed in breve tempo il suo crawler la visiterà per aggiungerla all’indice.

Ripetete questa procedura per le altre pagine, avendo cura di inserire nel campo che segue alla url della home page, il resto della url. Per esempio, se la mia pagina avesse una url del tipo https://flavioweb.net/questo-è-il-resto-della-url/, vi inseriremo “questo-è-il-resto-dellla-url/“. E successivamente ripetiamo la procedura di prima per inviarla.

Creare nuovi punti di ingresso

Creare nuovi punti di ingresso al crawler dei motori di ricerca, significa ottenere qualche link da altri siti. Se il sito è nuovo, sarebbe impensabile e controproducente mettere in campo una strategia di link building spregiudicata.

Limitiamoci ad inserire il nostro sito su qualche directory di discreta/buona qualità. Posso segnalarti Google my Business, Bing Places, Hotfrog, Coobiz, Foursquare e Misterimprese se hai un’attività commerciale. Se questo non è il tuo caso potresti sfruttare Logindot, Entireweb, Webwiki, Nuovosito.com, tutta roba che non aiuta sicuramente molto nel posizionamento, ma che male non fa.

Quando il crawler di Google e degli altri motori di ricerca scansionerà le pagine di queste directory, troverà anche il link al nostro sito. Questo link equivale ad un nuovo punto d’ingresso utile a raggiungere il nostro scopo.

Fatto questo, lasciamo in pace il sito per una quindicina di giorni e poi torniamo a controllare la situazione. Se tutto va come deve andare, troverete il vostro sito indicizzato. Non vi rimane che iniziare a lavorarci per ottenere un buon posizionamento su Google.


LIBRI SEO DA NON PERDERE

Riassunto
Il sito non si trova su Google? Potrebbe essere colpa del file robots
Titolo
Il sito non si trova su Google? Potrebbe essere colpa del file robots
Descrizione
A volte accade che, messo online il nuovo sito, questo non si trovi su Google. Il problema spesso è il file robots. Vediamo come risolvere.
Autore
Publisher
flavioweb.net
Logo
manuale seo gardening su amazon
About the author

Flavio

Mi trovo nel campo del web dal 2006. Nel tempo mi sono specializzato soprattutto nell'indicizzazione,  nel posizionamento di siti internet e nell'utilizzo dei social media principali a fini di marketing.

Commenta per primo

Inserisci il tuo commento

La tua email non sarà pubblicata


*


*

code