Le sitemap pour une meilleur indexation
Classé dans : Référencement
Le sitemap existe depuis un certain mais depuis peu son utilisation a été grandement simplifiée car les principaux moteurs de recherche se sont mis d’accord sur un protocole commun pour détecter et utiliser ce fichier. Il serait donc dommage de s’en priver.
Structure d’un fichier sitemap
Voici la structure d’un fichier sitemap comprenant une seule url
<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>http://www.example.com/</loc> <lastmod>2005-01-01</lastmod> <changefreq>monthly</changefreq> <priority>0.8</priority> </url> </urlset>
- La balise loc permet d’indiquer l’emplacement de la page
- La balise lastmod est optionnelle et permet de signaler la date de dernière modification de la page
- La balise changefreq est optionnelle et signale la fréquence de mise à jour de la page
- La balise priority permet de définir l’importance de cette page par rapport aux autres. On peut supposer que les moteurs de recherche utilise ce critère dans le cas où deux pages d’un même site répondraient à la requête d’un visiteur.
Le fichier robots.txt
Pour indiquer au moteur de recherche l’emplacement de votre fichier sitemap il suffit d’ajouter cette ligne à votre fichier robots.txt
Sitemap: http://www.monsite.com/monsitemap.xml
Le fichier robots.txt devra quant à lui se trouver à la racine de votre site.
Intérêt du fichier sitemap
Le rôle du fichier sitemap est de faire gagner du temps et de la bande passante aux moteurs de recherche comme aux webmaster.
Grâce à votre fichier sitemap vous serez capable de faire savoir aux moteurs de recherche que vous venez de mettre en ligne une nouvelle page. Les robots d’indexation n’auront plus, alors, qu’à scanner votre sitemap pour les repérer, il ne leur sera plus nécessaire de “crawler” tout le site pour les dénicher.
De la même manière si vous utiliser la balise lastmod vous pourrez indiquer aux robots d’indexation qu’elle page a été modifiée récemment pour qu’ils aillent la télécharger à nouveau.
Enfin la balise changefreq empèchera les robots de passer trop souvent sur une même page inutilement en leur indiquant à qu’elle fréquence cette page est mise à jour. Ils leurs suffira alors de passer voir cette page à la fréquence indiquée pour être sûr de ne pas rater de modification.
Le sitemap ça améliore le référencement
J’entends déjà les cri de certains qui diront que le sitemap ne permet QUE d’améliorer l’indexation et n’offre aucun bonus en matière de positionnement ou de référencement. A cela je dirais tout d’abords qu’il faut pas s’ennerver (:D) hein, et qu’ensuite ils ont raison.
En théorie, le sitemap n’améliore que l’indexation et un site avec ou sans sitemap ne sera pas mieux positionné, c’est vrai. Mais en pratique, le sitemap améliore indirectement le positionnement d’un site.
En effet, plus vos pages seront rapidement connus des moteurs de recherche plus elles auront de chance d’apparaitre dans les resultats. Ainsi, si l’une de vos pages réponds à la question d’un internaute il prendra peut être le temps de faire un lien vers cette dernière (par l’intermédiaire, d’un forum, blog, etc..). Vous gagnerez donc un backlink gratuitement, ce qui ne serait pas arrivé si l’internaute avait trouvé la réponse ailleurs. Etre rapidement présent dans les résultats des moteurs (quelque soit la position) est donc important.
Ensuite, sans sitemap les robots d’indexation peuvent “rater” une mise à jour. Prenons un exemple:
Si votre page a été modifiée 4 fois en 1 mois, mais que le robots de Google ne soit repassé qu’en fin de mois, il n’aura alors détecté qu’une seule mise à jour. La fréquence de mise à jour sera donc bien plus faible que si le robots avait été systématiquement informé de chaque nouvelle modification de cette page. La fréquence de mise à jour d’une page étant un facteur important dans le classement des résultats de recherche, il serait dommage de négliger ce point.
N’essayez pas de tricher
Même si je trouve l’idée du sitemap excellente elle me fait beaucoup penser au balise meta à l’époque ou les webmaster en abusaient.
Il est en effet possible de donner des informations fausses aux robots d’indexation par l’intermédiaire d’un sitemap. Je pense notamment aux balise lastmod et changefreq. Il me parait dans tous les cas évident que les robots ne sont pas stupide au point de prendre pour argent content ce qui est indiqué dans un sitemap. Ils iront dans tous les cas vérifier si ce qui y est dit est vrai. Qu’elle sera alors leurs réaction si les infos données dans le sitemap ne sont pas vrai… Il peuvent ne pas en tenir compte ou peut être croire que le webmaster essai de les manipuler et dans ce cas une sanction peut tomber. Par conséquent utiliser un sitemap pour tenter de manipuler les robots est une très mauvaise idée.
Il est malheureusement possible que, sans vouloir, vous fournissiez de fausses informations dans votre sitemap. C’est pourquoi je vous conseille de n’utiliser lastmod et changefreq que si vous êtes sûr de ne pas vous tromper. Dans mon cas pour un site “statique” où les pages sont rarement mises à jour je n’indique que la localisation des pages (balise loc), j’utilise d’ailleurs pour cela Yoodamap. Pour les sites dynamique je me permet d’utiliser les balises optionnelles en faisant attention. Pour mes blogs j’utilise le plugin wordpress sitemap generator et pour mes autres sites dynamiques un petit script maison.
Pour aller plus loin: sitemaps.org
D’autres points à vérifier pour otpimiser votre site
Tags : sitemap
- Permalien
- maniT4c
- 14 août 2008 11:57
- Commentaires (22)

19 août 2008 à 9:58
J’en avais déjà entendu parler, mais n’avais jamais réellement essayé. Mais avec ce plug-in Wordpress je vais m’empresser de le faire
Merci pour ce post
16 septembre 2008 à 23:04
Wordpress est une excellent plateforme pour le SEO. Avec ses différents plugins il est possible de produire facuilement un site qui est optimisé pour être “Google Friendly”. Un site bien monté avec des mot-clé bien choisi représentent 50% du travail de référencement.
L’autre 50% consiste à créer des liens vers le site que l’on veut promouvoir, soit par un blog pou des vidéos sur Youtube, soit en laissant des messages sur les blogues des autres.
21 octobre 2008 à 5:18
Dès que j’aurais un peu de temps je passerais mon Tumblr sous Wordpress qui avec tout ce que j’entends apparait comme être la meilleure des plateformes.
22 octobre 2008 à 18:00
Oui ça c’est vrais pour le référencement wordpress c’est le top!
23 octobre 2008 à 1:29
Ouais le sitemap c’est vraiment important pour le référencement.
4 novembre 2008 à 11:35
merci pour ce tutu , car moi Je n’ai jamais grimpé au dessus du PR0 jusqu’a ce que j’ai pu faire mon propre sitemap et depuis…..
23 novembre 2008 à 12:51
Merci pour ce post
18 décembre 2008 à 6:55
Merci beaucoup pour cette information sur le fichier sitemap. Je ne savais pas qu’il était si important pour le réferencement.
30 janvier 2009 à 13:21
Nous n’avons jamais utilisé de site Map pour indexer des sites, pourtant avec plus de 50 000 urls (exemple, dico en ligne). Une bonne arbo est bien plus efficace…
30 janvier 2009 à 16:39
En effet Word press facilite le ref, mais le site map n’est pas a négliger, n’oublier pas de bien structurer vos pages… En gros suivez les instructions W3C…
10 février 2009 à 12:01
Très important les sitemaps, depuis que j’en utilise j’indexe beaucoup plus de pages et plus vite !
12 février 2009 à 15:24
Attention le sitemap est déconseillé pour les “gros” site, si vous avez plus de 50 000 pages il faut éviter le sitemap!
Pour ceux qui utilisent WordPress utiliser des plugins spéciaux pour pouvoir mettre en place un sitemap, c’est super utile!
23 février 2009 à 13:19
Il existe aussi le logiciel gratuit Xenu, qui au dela de creer votre site map, permet aussi de détecter les url en 404 ou autre erreur du meme type.
23 février 2009 à 15:15
Merci pour ces précieuses informations. En effet, contrôlé les allés et venus des rebots permets de s’assurer de la bonne indexation de son site web.
5 mars 2009 à 19:36
sitemap pour une meilleure indexation personnellement je ne vois pas de différence sur le référencement.
9 mars 2009 à 14:45
J’ai google sitemap generator, GG n’as pas l’air de l’apprecier. Vais essayer celui ci. Au fait, pour duplicate maintenant, ne pas oublier le meta-canonical …
Cordialement
9 mars 2009 à 17:16
@gros tu pourrais détailler le meta-canonical ? je ne crois pas connaitre !
10 mars 2009 à 22:43
@Ben, écoutes oui. Le meta canonical permettrait à nos blogs de limiter le duplicate content en proposant aux moteurs de recherche la version originale de l’article, par exemple.
http://referenceur.wordpress.com/2009/02/14/canonical-urls-une-meta-pour-eviter-le-duplicate-content/ et voir sur WRI aussi…
Cordialement.
12 mars 2009 à 15:33
Moi, j’ai essayé sans sitemap et ca marche tres bien
8 mai 2009 à 10:30
moi j ai essayé et j attend toujours.
25 mai 2009 à 14:40
Le genre de truc que j oubli tout le temps, c’est décidé cette semaine je le fait !
27 mai 2009 à 0:56
en réponse à @conseil-sante: les sitemap de plus de 50.000 entrées ne posent pas de problèmes particuliers, il faut juste faire un plan (en fait, un xml avec juste les url des autres sitemap…)cela demande un peu plus de temps et d’énergie en développement, mais cela fonctionne très bien et c’est recommandé par google.