Quando google scansiona il nostro sito e trova dei contenuti duplicati, può penalizzarne il posizionamento. Per contenuti duplicati intendo tutte quelle pagine che riportano nella totalità, o in buona parte, gli stessi elementi.
Stranamente il problema dei contenuti duplicati si presenta anche con la home page e questo perché essa può essere visualizzata con tre diverse URL:
- www.miosito.xx
- miosito.xx
- www.miosito.xx/index.html
Noi sappiamo benissimo che è la medesima pagina, ma per Google sono 3 pagine indipendenti e con i contenuti duplicati!
Fortunatamente si può risolvere il problema con poche righe di codice scritte nel file .htaccess. Vediamo come…
Indice dei contenuti
OTTIMIZZIAMO IL NOSTRO SITO EVITANDO I CONTENUTI DUPLICATI AUTOGENERATI
Prerequisito fondamentale è avere il proprio sito appoggiato su un server apache (se avete il sito fatto con un cms tra wordpress, joomla! o drupal sicuramente siete su apache).
Decidiamo quale url canonica avere tra quella con www o senza www.
Fatto tutto questo, andiamo a scaricare dal server il file htaccess. Se non è presente possiamo crearlo noi con un semplice editor di testo.
DA www a NON www
Se abbiamo già il file .htaccess sul server, scarichiamolo tramite un client ftp. Se non lo abbiamo apriamo il blocco notes e scriviamoci sopra le seguenti istruzioni:
#indico che l’indirizzo della home page è miosito.xx. Quindi la chiamata a www.miosito.xx sarà reindirizzata sempre a miosito.xx
RewriteEngine on
RewriteCond %{HTTP_HOST} ^www.miosito.xx [NC] RewriteRule ^(.*)$ http://miosito.xx/$1 [L,R=301,NC]#indico che se avviene la chiamata alla url www.miosito.xx/index.html sarà reindirizzata alla URL miosito.xx
RewriteCond %{THE_REQUEST} ^.*/index.html
RewriteRule ^(.*)index.html$ http://miosito.xx/$1 [R=301,L]
Spieghiamo il codice: nella prima parte abbiamo forzato il server a restituire la url senza www, andando ad effettuare una redirect 301 verso questa versione. Nella seconda parte abbiamo forzato la url www.miosito.xx/index.html con un redirect 301 verso la url miosito.xx
Fatto questo salviamo il file (se lo stiamo creando ex-novo facciamo “salva con nome”, chiamiamo il file .htaccess e in “salva come” diamo “tutti i tipi di file”).
A questo punto carichiamo il nostro .htaccess sulla root del server tramite il nostro client ftp .
Non è finita qui. Scarichiamo il file index.html dal server (sempre tramite un client ftp – “filezilla” andrà alla perfezione) ed apriamolo con l’editor di testo.
Andiamo sulla <head> della pagina e indichiamo la url canonica in questo modo:
<link rel=”canonical” href=”http://miosito.xx”/>
La URL canonica è la URL che vogliamo far riconoscere a Google come la pagina che contiene i contenuti originali.
Ora, sempre tramite client ftp, ricarichiamo sul server il file index.html e il file.htaccess.
La Verifica delle URL
Andiamo sul browser e portiamoci su questo tool di verifica dei contenuti duplicati. Scriviamo sulla casellina di testo l’indirizzo del nostro sito e clicchiamo sul bottone “submit your domain”.
Se avremo fatto tutto il lavoro per bene ci apparirà una schermata senza errori come questa e avremo evitato che google interpreti e penalizzi la nostra bella home page.
Da NON www A www
Tutti i passaggi riguardo la creazione del file .htaccess rimangono uguali. Cambiano solo le istruzioni da scrivere che saranno:
#indico che l’indirizzo della home page è www.miosito.xx. Quindi la chiamata a miosito.xx sarà reindirizzata a www.miosito.xx
RewriteEngine on
RewriteCond %{HTTP_HOST} ^miosito.xx [NC] RewriteRule ^(.*)$ http://www.miosito.xx/$1 [L,R=301,NC]#indico che se avviene la chiamata alla url www.miosito.xx/index.html sarà reindirizzata alla URL www.miosito.xx
RewriteCond %{THE_REQUEST} ^.*/index.html
RewriteRule ^(.*)index.html$ http://www.miosito.xx/$1 [R=301,L]
Poi seguire gli stessi passaggi du cui sopra.
DIFFERENZA TRA URL WWW e NON WWW
Sinceramente non ho mai saputo o notato delle differenze che facciano preferire una versione rispetto all’altra. L’importante è che ne sia indicata una come canonica e che le altre vengano reindirizzate a questa.
CASO HTACCESS CON JOOMLA!
Quando si installa questo CMS nella root viene creato un file chiamato htaccess.txt. In ambito SEO è molto importante andare a modificare questo file e rinominarlo .htaccess.
Quindi a chi utilizza Joomla! consiglio di scaricare questo file ed implementarlo con le istruzioni sopra riportate per evitare la duplicazione dei contenuti e poi salvarlo con un editor di testo rinominandolo .htaccess (nel modo in cui ho spiegato sopra). Infine caricate il file sulla root del server e cancellate senza paura il file htaccess.txt.