Migliori Robot txt per l'hosting drupal
Ogni giorno, milioni di persone usano Google Image Search per trovare le immagini, prodotti e persone. Se stai usando Drupal, è probabile che non stai ricevendo nulla di tutto questo traffico.
file robots.txt di Drupal contiene un grave errore. Sorprendentemente, l'errore è stato lì per anni, e pochissime persone sembrano sapere.
Date un'occhiata a questo estratto dal file robots.txt Drupal di default. Riuscite ad individuare il problema?
Per impostazione predefinita, ogni immagine si carica al tuo sito Drupal viene memorizzato da qualche parte all'interno della directory "siti". E, per impostazione predefinita, Drupal sta bloccando ogni motore di ricerca di guardare all'interno della vostra cartella "Siti". In altre parole, le immagini non sono sempre indicizzati!
Se hai un sito Drupal con le immagini che si desidera che altre persone per trovare, questo è un problema serio. (Ho scoperto questo per caso la scorsa settimana, quando ho notato nessuna delle immagini sul mio sito Effetti di testo Photoshop sono stati ottenere indicizzati da Google).
Per illustrare quanto sia comune questo problema è, diamo un rapido sguardo a blog di Dries Buytaert. Dries è, naturalmente, il creatore di Drupal, ma è anche un ottimo fotografo. In realtà, Dries ha caricato migliaia di foto al suo blog, tra cui centinaia di immagini da DrupalCon e decine di grafici e diagrammi penetranti. Ma quante di queste immagini è Google in realtà indicizzato?
Solo 13. Purtroppo, il file robots.txt di Dries contiene lo standard "Disallow: / sites /" linea.
Se Dries è influenzata, probabilmente sono, anche. L'esecuzione di un sito e-commerce? Tutta la vostra linea di prodotti poteva mancare da Google Image Search. Avere un blog di fotografia? Yahoo e Bing sono probabilmente ignorando tutto ciò che pubblichi.
Se nessuno può cercare le immagini, si sta letteralmente allontanarsi traffico. E non solo il traffico di ricerca di immagini: di alta qualità, le immagini indicizzabili sono una caratteristica fondamentale di qualsiasi sito di alto rango. Se le immagini non sono indicizzabili, si sta facendo un grave errore di SEO.
Peggio ancora, questo problema non riguarda soltanto le immagini. PDF, file Flash, documenti di testo e altri arrivi vanno tutti nella stessa cartella "Siti". Google sa come indicizzare questi file, ma il file robots.txt è fermare GoogleBot freddo.
Fortunatamente, la soluzione è semplice: basta rimuovere "Disallow: / sites /" dal file robots.txt. Il file si trova nella directory principale di Drupal e può essere modificato con un editor di testo standard. Google dovrebbe raccogliere le modifiche entro un paio di giorni e iniziare a indicizzare i file poco dopo.
Fissaggio del file robots.txt dovrebbe essere una priorità per il prossimo rilascio punto di Drupal. Questo è un grosso problema con una soluzione semplice. Fortunatamente, qualcuno ha già creato un problema su Drupal.org. Purtroppo, è stato irrisolto per oltre un anno. Cambiamo questo.
Aggiornamento: Una correzione per Drupal 6 è stato rilasciato il 12 dicembre. Se stai usando Drupal 6.20 o successivo (incluso Drupal 7), questo problema non è più li interessa.
Hai trovato questo articolo utile? Guarda il mio Drupal recensione di hosting.
Scritto da John il 2010-08-30