Usiamo .htaccess per evitare contenuti duplicati

evitare il contenuto duplicato

Quando google scansiona il nostro sito e trova dei contenuti duplicati, può penalizzarne il posizionamento. Per contenuti duplicati intendo tutte quelle pagine che riportano nella totalità, o in buona parte, gli stessi elementi.

Stranamente il problema dei contenuti duplicati si presenta anche con la home page e questo perché essa può essere visualizzata con tre diverse URL:

  • www.miosito.xx
  • miosito.xx
  • www.miosito.xx/index.html

Noi sappiamo benissimo che è la medesima pagina, ma per Google sono 3 pagine indipendenti e con i contenuti duplicati!

Fortunatamente si può risolvere il problema con poche righe di codice scritte nel file .htaccess. Vediamo come… 

OTTIMIZZIAMO IL NOSTRO SITO EVITANDO I CONTENUTI DUPLICATI AUTOGENERATI

htaccess-redirect-301

Prerequisito fondamentale è avere il proprio sito appoggiato su un server apache (se avete il sito fatto con un cms tra wordpress, joomla! o drupal sicuramente siete su apache).

Decidiamo quale url canonica avere tra quella con www o senza www.

Fatto tutto questo, andiamo a scaricare dal server il file htaccess. Se non è presente possiamo crearlo noi con un semplice editor di testo.

DA www a NON www

Se abbiamo già il file .htaccess sul server, scarichiamolo tramite un client ftp. Se non lo abbiamo  apriamo il blocco notes e scriviamoci sopra le seguenti istruzioni:

#indico che l’indirizzo della home page è miosito.xx. Quindi la chiamata a www.miosito.xx sarà reindirizzata sempre a miosito.xx
RewriteEngine on
RewriteCond %{HTTP_HOST} ^www.miosito.xx [NC]
RewriteRule ^(.*)$ http://miosito.xx/$1 [L,R=301,NC]

#indico che se avviene la chiamata alla url www.miosito.xx/index.html sarà reindirizzata alla URL miosito.xx

RewriteCond %{THE_REQUEST} ^.*/index.html

RewriteRule ^(.*)index.html$ http://miosito.xx/$1 [R=301,L]

Spieghiamo il codice: nella prima parte abbiamo forzato il server a restituire la url senza www, andando ad effettuare una redirect 301 verso questa versione. Nella seconda parte abbiamo forzato la url www.miosito.xx/index.html con un redirect 301 verso la url miosito.xx

Fatto questo salviamo il file (se lo stiamo creando ex-novo facciamo  “salva con nome”, chiamiamo il file .htaccess e in “salva come” diamo “tutti i tipi di file”).

A questo punto carichiamo il nostro .htaccess sulla root del server tramite il nostro client ftp .

Non è finita qui. Scarichiamo il file index.html dal server (sempre tramite un client ftp – “filezilla” andrà alla perfezione) ed apriamolo con l’editor di testo.

Andiamo sulla <head> della pagina e indichiamo la url canonica in questo modo:

<link rel=”canonical” href=”http://miosito.xx”/>

La URL canonica è la URL che vogliamo far riconoscere a Google come la pagina che contiene i contenuti originali.

Ora, sempre tramite client ftp, ricarichiamo sul server il file index.html e il file.htaccess.

La Verifica delle URL

Andiamo sul browser e portiamoci su questo tool di verifica dei contenuti duplicati. Scriviamo sulla casellina di testo l’indirizzo del nostro sito e clicchiamo sul bottone “submit your domain”.

Se avremo fatto tutto il lavoro per bene ci apparirà una schermata senza errori come questa e avremo evitato che google interpreti e penalizzi la nostra bella home page.

analisi-contenuti-duplicati

Da NON www A www

Tutti i passaggi riguardo la creazione del file .htaccess rimangono uguali. Cambiano solo le istruzioni da scrivere che saranno:

#indico che l’indirizzo della home page è www.miosito.xx. Quindi la chiamata a miosito.xx sarà reindirizzata a www.miosito.xx
RewriteEngine on
RewriteCond %{HTTP_HOST} ^miosito.xx [NC]
RewriteRule ^(.*)$ http://www.miosito.xx/$1 [L,R=301,NC]

#indico che se avviene la chiamata alla url www.miosito.xx/index.html sarà reindirizzata alla URL www.miosito.xx

RewriteCond %{THE_REQUEST} ^.*/index.html

RewriteRule ^(.*)index.html$ http://www.miosito.xx/$1 [R=301,L]

Poi seguire gli stessi passaggi du cui sopra.

DIFFERENZA TRA URL  WWW e NON WWW

Sinceramente non ho mai saputo o notato delle differenze che facciano preferire una versione rispetto all’altra. L’importante è che ne sia indicata una come canonica e che le altre vengano reindirizzate a questa.

CASO HTACCESS CON JOOMLA!

Quando si installa questo CMS nella root viene creato un file chiamato htaccess.txt. In ambito SEO è molto importante andare a modificare questo file e rinominarlo .htaccess.

Quindi a chi utilizza Joomla! consiglio di scaricare questo file ed implementarlo con le istruzioni sopra riportate per evitare la duplicazione dei contenuti e poi salvarlo con un editor di testo rinominandolo .htaccess (nel modo in cui ho spiegato sopra). Infine caricate il file sulla root del server e cancellate senza paura il file htaccess.txt.

About the author

Flavio

Mi trovo nel campo del web dal 2006. Nel tempo mi sono specializzato soprattutto nell'indicizzazione,  nel posizionamento di siti internet e nell'utilizzo dei social media principali a fini di marketing.