Htaccess e SEO, la necessità di soppesare ogni stringa

Il file .htaccess dei server apache, a dirla tutta, non è una componente prettamente SEO, ma le funzioni che espleta risultano fondamentali per il posizionamento sui motori di ricerca. Per ovvie ragioni, legate alle tematiche di questo blog, mi soffermerò sull’utilizzo SEO del file .htaccess.
I server apache ogni qual volta ricevono una richiesta, prima di eseguirla, controllano l’esistenza o meno di questo file nella cartella del file richiesto o nelle cartelle precedenti. Se l’.htaccess contiene delle regole particolari il server le interpreta in run-time e si configura in modo da rispettare le direttive presenti all’interno del file stesso. Attraverso la configurazione di questo file è possibile riscrivere per intero le URI di un sito, gestire i redirect, proteggere delle dir. con username e password o settare ogni tipo di errore in maniera personalizzata.
In un progetto web ex-novo, con allegata attività SEO, il file .htaccess serivrà principalmente per impostare il corretto funzionamente degli errori (ad esempio la pagina di errore 404) o per generare URI “parlanti” nel caso in cui, un esempio fra tanti, il sito sia dinamico e gestito con URL parametriche.
Le cose cambiano di molto nel caso in cui ci ritroviamo a riprogettare in toto un sito già esistente e con una certa anzianità. In questo secondo caso il file .htaccess può assumere grandezze importanti e deve essere utilizzato, soprattutto, per comunicare lo spostamento di alcune pagine ad un nuovo indirizzo ai motori di ricerca. Questa segnalazione si effettua mediante un redirect 301 (Es: Redirect 301 /vecchia-pagina.php http://www.nome-sito.com/nuova-pagina.php). Segnalare uno spostamento con un 301 serve (in linea teorica) a trasferire anzianità, posizione e PR (al prossimo aggiornamento), dal vecchio file al nuovo.
Compilare il file .htaccess nella seconda casistica è un lavoro molto più lungo e complicato. Necessita grande concentrazione, una fase preliminare di pianificazione e diversi controlli sia prima della messa online che successivamente. L’obiettivo è quello di perseguire un sottile equilibrio fra file recuperati e un’importante mole di header location 404.
Ecco come procedo generalmente con i 301 nel secondo caso. Prima definisco l’albero semantico che dovrà avere il nuovo sito, per essere posizionato per le key di interesse, poi ecco i file che scelgo di includere:
- individuo le vecchie url, già indicizzate, che potrebbero rientrare nell’albero semantico e le includo nel file
- includo nell’.htaccess tutte le vecchie pagine che hanno backlink, le trovo segnalate nel Web Master Central Tool di Google
- includo anche le pagine che hanno PR e quelle che dall’Analytics risultano essere le più visitate
Infine lascio che tutte le pagine poco rilevanti per le key di interesse restituiscano un errore 404.
E’ incredibile come mi senta più vicino ad Indiana Jones oggi, che ai tempi in cui lavoravo veramente come Archeologo.
Tu che file scegli di includere nell’.htaccess e con quale criterio fai le tue scelte?
Francesco ha scritto questo post il 20th novembre, 2008 | File Under SEO | -


























Vuoi pubblicare i tuoi post qui?
novembre 20th, 2008 a 14:17
Sicuro che lo includo!
A meno di non trovarmi di fronte a qualche migliaio di URL, tendo anche a considerare TUTTE le URL vecchie nel caso di reindirizzamenti di tipo 301.
Al limite, si smarca tutto con delle regole.
novembre 25th, 2008 a 00:13
Anche io tendo a recuperare tutte le vecchie url. Tralascio solo le pagine che fuoriescono dall’albero semantico del nuovo sito, in quel caso lascio che il server restituisca un 404.
Lavoro tanto sporco (=faticoso) quanto essenziale.
Ciao ciao