Vous souhaitez améliorer le référencement naturel de votre site internet et publiez de nouveaux contenus régulièrement ? Pour aider Google à trouver vos nouvelles pages plus facilement et plus rapidement, il est vivement conseillé de créer un fichier sitemap XML. Définition, mode d’emploi et bonnes pratiques, on vous dit tout dans cet article.

Qu’est-ce qu’un Sitemap XML ?

Un sitemap.xml est un fichier destiné aux robots d’indexation, ou “crawlers”, des principaux moteurs de recherche tels que Google et Bing, et qui liste les différents contenus d’un site web.
Contrairement au sitemap HTML situé en pied de page d’un site web qui sert de plan de site aux visiteurs humains, il est écrit en langage informatique XML, conçu exclusivement pour être interprété par les crawlers.

Voici un exemple de ce à quoi ressemble un fichier sitemap au format XML :

exemple de sitemap au format XML
Exemple de sitemap au format XML

Le plan de site XML est divisé en 3 parties imbriquées. En premier, la balise <urlset> qui regroupe toutes les URL du site, la seconde est la balise <url> qui contient les données liées à chaque URL, à savoir l’emplacement du contenu à indexer qui doit être précisé au sein de la balise <loc> . Il existe aussi des balises facultatives : la balise <lastmod>  qui indique à quelle date a eu lieu la dernière modification sur une page, <priority> qui attribue un ordre d’importance aux différents contenus (note de 0 à 1), ou encore la balise <changefreq>  qui renseigne la fréquence estimée à laquelle la page est mise à jour (journalier, mensuel…).

Les sitemaps sont limités en terme de poids et de nombre d’URL. Si votre fichier excède 50 Mo ou dépasse les 50 000 URL il sera nécessaire de diviser celui-ci en plusieurs parties.

En effet, il est possible d’avoir plusieurs sitemaps pour un seul site web.
Par exemple, vous pouvez choisir d’en éditer un spécifiquement pour les photos ou vidéos, un pour les articles de blog, un pour l’année 2019, etc.
Vous pouvez dans ce cas créer un fichier sitemap-index, qui listera l’ensemble de vos fichiers sitemap.

Exemple de fichier sitemap index XML
Exemple de fichier Sitemap Index XML

À quoi sert un fichier sitemap XML ?

En clair, le sitemap a pour but de guider les crawlers vers les pages que vous souhaitez voir indexées. Il est à noter que ces robots peuvent effectuer quoiqu’il en soit un travail d’indexation sans avoir besoin de sitemap XML, et se repèrent très bien dans l’arborescence limpide d’un site web parfaitement articulé.
Mais en pratique, un site volumineux contient souvent des pages profondément enfouies dans une architecture complexe, ce qui rend le travail des crawlers plus laborieux et lent.
Grâce au sitemap, les moteurs de recherche reçoivent une information claire et exhaustive sur les pages qui existent, celles qui viennent d’être mises en ligne, mises à jour, etc.

Les crawlers accordent un temps de d’inspection limité à chaque site (c’est le « budget crawl »), plus ou moins long selon la notoriété de ceux-ci, le nombre de contenus, la fréquence de mise à jour etc… Ainsi, vous avez tout intérêt à mâcher le travail en amont afin que les robots ne s’éternisent pas inutilement dans les abysses de votre site.
Un sitemap XML a donc un impact positif sur le SEO dans le sens où il facilite l’indexation rapide des nouveaux contenus et des contenus mis à jour par les robots des moteurs.

Cependant, les contenus renseignés dans ce plan de site sont toujours soumis à l’évaluation des algorithmes et ne seront proposés en résultats moteur que s’ils ont été analysés comme pertinents et intéressants.

Indirectement, soumettre un sitemap à Google est aussi un moyen de faire un audit d’indexation de site web. Si vous constatez que le nombre d’URL indexées est supérieur au nombre d’URL renseignées sur le sitemap, cela signifie que Google a référencé des pages que vous ne souhaitiez pas indexer. A l’inverse, il arrive souvent que le nombre de pages référencées soit largement inférieur au nombre de pages indiquées sur le sitemap. Pour palier à ces anomalies, veillez à ne pas donner de consignes contradictoires aux crawlers sur vos différents fichiers dédiés aux moteurs de recherche. Il se peut également qu’il s’agisse de contenus récents qui n’ont pas encore été identifiés, ou au contraire que des pages récemment supprimées soient toujours indexées.

Vous souhaitez optimiser votre site web ? Demandez un audit SEO complet  ! cliquez ici

Comment créer un sitemap XML ?

Si vous êtes maintenant convaincus de l’intérêt de créer un sitemap XML, encore faut il savoir comment s’y prendre.
Pour cela, il existe des outils dédiés qui permettent d’éditer un sitemap qui s’actualise automatiquement à chaque nouveauté (mise à jour, suppression, publication…), notamment le plug-in Yoast SEO ou encore Google XML Sitemaps pour les sites gérés par WordPress. Vous pouvez aussi passer par un site tel que XML-Sitemaps.com, qui est gratuit pour les sites web de moins de 500 pages mais qui ne permet pas à votre plan de site de s’actualiser systématiquement. Il faudra donc l’uploader à la racine de votre site internet à a chaque mise à jour.

Dès lors que vous aurez choisi l’outil qui vous convient le mieux, vous serez amenés à y inscrire les URL de toutes les pages que vous souhaitez porter à l’attention des crawlers. Les extensions citées ci-dessus sont a priori configurées pour recenser toutes les URL d’un site, mais il est possible d’en modifier les paramètres pour retirer les pages que vous ne souhaitez pas indexer, comme les CGU ou mentions légales qui n’ont pas grand intérêt à être mises en lumière.

Si vous ne souhaitez pas indexer une page, vous pouvez l’indiquer au fichier robots.txt qui se charge de suggérer aux robots les pages qui doivent être analysées ou non. Attention néanmoins, car ne pas renseigner une page dans un sitemap et suggérer sa non-indexation sur le fichier robots.txt ne garantissent pas qu’elle sera bien ignorée par Google. Il s’agit en effet d’une indication et non d’un “ordre” donné au moteur de recherche. Pour complètement interdire l’indexation d’un contenu, il faut cocher la meta-directive noindex en amont de sa publication.

Comment soumettre un sitemap aux moteurs de recherche ?

Dernière étape, il ne reste plus qu’à envoyer votre sitemap.xml là où il fera son travail.

Plusieurs méthodes sont possibles.

Via le fichier robots.txt

Renseignez l’URL de votre fichier sitemap.xml au sein de votre fichier robots.txt en ajoutant la ligne de code suivante :
Sitemap: https://www.monsite.com/sitemap.xml

Cette méthode permet à tous les moteurs de recherche de détecter votre fichier sitemap.

Via la Search Console

Vous pouvez également passer par la Search Console pour indiquer aux robots de Google ou se situe votre fichier sitemap.xml. Dans ce cas, vous accéderez à de nombreuses informations complémentaires, vous indiquant par exemple le nombre d’URL proposées dans le fichier, indexées par Google, ou le nombre d’erreurs rencontrées. En revanche, si vous ne renseignez pas l’URL de votre fichier sitemap dans le fichier robots.txt, les autres moteurs de recherche secondaires ne pourront pas le détecter. La search console est donc complémentaire.

Search console : ajout d'un sitemap

Pour ajouter votre sitemap de cette façon, vous devez posséder un compte Google Search Console associé à votre site web. Si ce n’est pas le cas, créez-en un.
Dans un second temps, cherchez la rubrique “Sitemaps” dans le menu vertical à gauche de l’interface, puis vous verrez s’afficher un champ intitulé “Add a new sitemap” dans lequel vous renseignerez l’URL de votre plan de site. Cliquez sur “Envoyer” et votre fichier sera entre les mains des crawlers.
Pas d’inquiétude si vous ne voyez pas de résultats immédiats ! Les robots parcourent des millions de pages quotidiennement et peuvent mettre quelques jours à s’intéresser à votre cas.
Vous pouvez suivre l’indexation des URL de votre sitemap à travers un rapport accessible via la Search Console. Celui-ci vous renseignera sur les pages qui ont déjà été analysées et vous permettra de repérer d’éventuels soucis à corriger.

Si un sitemap XML est un excellent point de départ pour optimiser son référencement naturel, il n’est pas suffisant à lui-même pour faire grimper un site web en tête des résultats de recherche.

Pour mettre en place une stratégie SEO complète et accroître efficacement votre visibilité en ligne, contactez notre agence SEO.