Optimisation : Robots.txt

A quoi sert le fichier ROBOTS.TXT ? En fait, ce fichier vous permet d’avoir vos pages web indexĂ©es par la plupart des robots utilisĂ©s par les moteurs de recherche. De plus, il va aussi vous permettre d’interdire l’accès Ă  certaines de vos pages aux moteurs de recherche.

En le plaçant Ă  la racine de votre site internet (/home/), ce fichier donnera simplement des instructions au spider (moteur du moteur de recherche) du moteur en lui indiquant ce qu’il peut faire et ce qu’il ne doit pas faire .

Quand un robot arrive sur un site pour indexer ses pages ou simplement pour voir les pages ajoutĂ©es (par exemple, http://www.votre_site.com/), il va automatiquement rechercher le fichier “robots.txt” Ă  la racine du site (http://www.votre_site.com/robots.txt), avant de rechercher n’importe quelle autre page.
Si ce fichier existe, il commencera par lire les instructions qu’il contient et suivra les commandes Ă  la lettre.
Si, de surcroĂ®t, il ne trouve pas de fichier ” robots.txt ” Ă  la racine de votre site, il commencera son travail de lecture et d’indexation de vos pages afin de les ajouter Ă  sa base de donnĂ©es, considĂ©rant que rien ne lui est interdit.
Intéressant donc, si vous avez des pages à ne pas indexer, car elles seront tout de même référencée si un lien pointe vers elles.

Le style de contenu du fichier robots.txt se présente de la façon suivante (à écrire en général en minuscules) :
User-agent: *
Disallow: /cgi-bin/
Disallow: /temps/
Disallow: /prive/
Disallow: /repertoire/prive.htm

Clairement, voici la signification du contenu :
- User-agent: * signifie que l’accès est accordĂ© Ă  tous les robots.
- Disallow: signifie simplement que l’accès est refusĂ© aux robots.
- Disallow: /cgi-bin/ : l’accès est refusĂ© aux robots dans le dossier cgi-bin
- Disallow: /temps/ : l’accès est refusĂ© aux robots dans le dossier temps
- Disallow: /prive/ : l’accès est refusĂ© aux robots dans le dossier personnel
- Disallow: /repertoire/prive.htm : l’accès est refusĂ© aux robots pour la page prive.htm dans le dossier repertoire

Ne jamais laisser de lignes vierges ou blanches (la touche entrĂ©e) le robot l’interprèterait comme Ă©tant la fin du fichier.
L’Ă©toile (*) quand Ă  elle, est acceptĂ©e uniquement dans le champ User-agent.
Comme dans le langage PHP, le signe “#” est considĂ©rĂ© comme Ă©tant une ligne Ă  ne pas prendre en compte et sert Ă  inclure des commentaires.
Attention Ă  toujours mettre le signe ” # ” au dĂ©but d’une ligne pour faire un commentaire.

Share on Facebook  
 
 

Espace de discussion