Usiamo .htaccess per evitare contenuti duplicati

evitare il contenuto duplicato

Quando google scansiona il nostro sito e trova dei contenuti duplicati, può penalizzarne il posizionamento. Per contenuti duplicati intendo tutte quelle pagine che riportano nella totalità, o in buona parte, gli stessi elementi.

Stranamente il problema dei contenuti duplicati si presenta anche con la home page e questo perché essa può essere visualizzata con tre diverse URL:

  • www.miosito.xx
  • miosito.xx
  • www.miosito.xx/index.html

Noi sappiamo benissimo che è la medesima pagina, ma per Google sono 3 pagine indipendenti e con i contenuti duplicati!

Fortunatamente si può risolvere il problema con poche righe di codice scritte nel file .htaccess. Vediamo come… 

OTTIMIZZIAMO IL NOSTRO SITO EVITANDO I CONTENUTI DUPLICATI AUTOGENERATI

htaccess-redirect-301

Prerequisito fondamentale è avere il proprio sito appoggiato su un server apache (se avete il sito fatto con un cms tra wordpress, joomla! o drupal sicuramente siete su apache).

Decidiamo quale url canonica avere tra quella con www o senza www.

Fatto tutto questo, andiamo a scaricare dal server il file htaccess. Se non è presente possiamo crearlo noi con un semplice editor di testo.

DA www a NON www

Se abbiamo già il file .htaccess sul server, scarichiamolo tramite un client ftp. Se non lo abbiamo  apriamo il blocco notes e scriviamoci sopra le seguenti istruzioni:

#indico che l’indirizzo della home page è miosito.xx. Quindi la chiamata a www.miosito.xx sarà reindirizzata sempre a miosito.xx
RewriteEngine on
RewriteCond %{HTTP_HOST} ^www.miosito.xx [NC]
RewriteRule ^(.*)$ http://miosito.xx/$1 [L,R=301,NC]

#indico che se avviene la chiamata alla url www.miosito.xx/index.html sarà reindirizzata alla URL miosito.xx

RewriteCond %{THE_REQUEST} ^.*/index.html

RewriteRule ^(.*)index.html$ http://miosito.xx/$1 [R=301,L]

Spieghiamo il codice: nella prima parte abbiamo forzato il server a restituire la url senza www, andando ad effettuare una redirect 301 verso questa versione. Nella seconda parte abbiamo forzato la url www.miosito.xx/index.html con un redirect 301 verso la url miosito.xx

Fatto questo salviamo il file (se lo stiamo creando ex-novo facciamo  “salva con nome”, chiamiamo il file .htaccess e in “salva come” diamo “tutti i tipi di file”).

A questo punto carichiamo il nostro .htaccess sulla root del server tramite il nostro client ftp .

Non è finita qui. Scarichiamo il file index.html dal server (sempre tramite un client ftp – “filezilla” andrà alla perfezione) ed apriamolo con l’editor di testo.

Andiamo sulla <head> della pagina e indichiamo la url canonica in questo modo:

<link rel=”canonical” href=”http://miosito.xx”/>

La URL canonica è la URL che vogliamo far riconoscere a Google come la pagina che contiene i contenuti originali.

Ora, sempre tramite client ftp, ricarichiamo sul server il file index.html e il file.htaccess.

La Verifica delle URL

Andiamo sul browser e portiamoci su questo tool di verifica dei contenuti duplicati. Scriviamo sulla casellina di testo l’indirizzo del nostro sito e clicchiamo sul bottone “submit your domain”.

Se avremo fatto tutto il lavoro per bene ci apparirà una schermata senza errori come questa e avremo evitato che google interpreti e penalizzi la nostra bella home page.

analisi-contenuti-duplicati

Da NON www A www

Tutti i passaggi riguardo la creazione del file .htaccess rimangono uguali. Cambiano solo le istruzioni da scrivere che saranno:

#indico che l’indirizzo della home page è www.miosito.xx. Quindi la chiamata a miosito.xx sarà reindirizzata a www.miosito.xx
RewriteEngine on
RewriteCond %{HTTP_HOST} ^miosito.xx [NC]
RewriteRule ^(.*)$ http://www.miosito.xx/$1 [L,R=301,NC]

#indico che se avviene la chiamata alla url www.miosito.xx/index.html sarà reindirizzata alla URL www.miosito.xx

RewriteCond %{THE_REQUEST} ^.*/index.html

RewriteRule ^(.*)index.html$ http://www.miosito.xx/$1 [R=301,L]

Poi seguire gli stessi passaggi du cui sopra.

DIFFERENZA TRA URL  WWW e NON WWW

Sinceramente non ho mai saputo o notato delle differenze che facciano preferire una versione rispetto all’altra. L’importante è che ne sia indicata una come canonica e che le altre vengano reindirizzate a questa.

CASO HTACCESS CON JOOMLA!

Quando si installa questo CMS nella root viene creato un file chiamato htaccess.txt. In ambito SEO è molto importante andare a modificare questo file e rinominarlo .htaccess.

Quindi a chi utilizza Joomla! consiglio di scaricare questo file ed implementarlo con le istruzioni sopra riportate per evitare la duplicazione dei contenuti e poi salvarlo con un editor di testo rinominandolo .htaccess (nel modo in cui ho spiegato sopra). Infine caricate il file sulla root del server e cancellate senza paura il file htaccess.txt.

AD

About the author

Flavio

Mi trovo nel campo del web dal 2006. Nel tempo mi sono specializzato soprattutto nell’indicizzazione,  nel posizionamento di siti internet e nell’utilizzo dei social media principali a fini di marketing.