Comment créer un sitemap XML qualitatif et pertinent ?

Le sitemap est un outil en ligne très pratique pour aider les robots des moteurs de recherche à découvrir l’ensemble des pages de votre site. Il peut être considéré comme une des étapes essentielles du travail d’optimisation de votre référencement naturel. Pour faire très simple, il s’agit d’une sorte de sommaire ou de table des matières présentant l’ensemble des pages de votre site ainsi que quelques informations de base comme la date de modification par exemple.

Nous allons nous intéresser ensemble à la fameuse question : comment créer un sitemap.xml qualitatif et pertinent ?

Grâce au plan de site XML, les robots peuvent comprendre la structure et la hiérarchisation de vos pages plus rapidement. Un sitemap est d’autant plus important que le site se compose d’un grand nombre de pages et d’une arborescence complexe. Au sein de notre agence SEO bordelaise, nous recommandons la mise en place de sitemaps spécifiques pour les sites composés de plusieurs milliers de pages, nous restons plus classique pour les sites de plus petite taille. Dans tous les cas, l’ajout de sitemap ne peut être que positif, il ne représentera en aucun cas une prise de risque pour votre visibilité.

Pour optimiser votre sitemap, les informations transmises aux spiders doivent respecter un certain nombre de règles et de normes. On vous a préparé une liste des principes de base pour créer un sitemap pertinent !

Qu’est-ce qu’un sitemap ?

Un sitemap a pour objectif principal d’aider les robots de crawl des moteurs de recherche, aussi appelés spiders, à découvrir plus facilement vos pages.

Il s’agit d’une page au format XML présentant l’ensemble des URL d’un site internet. Elle se trouve dans le fichier robots.txt. Certains éléments complémentaires comme la priorité des pages ou la fréquence de mise à jour permettent aux robots de mieux hiérarchiser les pages qu’ils vont devoir explorer.

Comme évoqué précédemment, un plan de site XML est très utile pour les gros sites web. Il permet d’optimiser le budget de crawl et de favoriser les pages commercialement importantes. Un sitemap permet aussi de mieux appréhender l’état de l’indexation d’un site.

Comment générer votre sitemap ?

Si vous utilisez un CMS, il est très facile de trouver un plug-in de génération de sitemap automatique. On peut citer le plus utilisé de tous : Google XML Sitemaps pour WordPress. Cette option de « générateur » est aussi présente dans les solutions SEO complètes comme Rank Math ou Yoast.

Si votre site n’est pas construit avec un CMS grand public, ce n’est pas un problème. Il est tout à fait possible de coder un sitemap XML à la main. Attention, il est essentiel de créer un sitemap, ou un lot de sitemaps, se mettant à jour automatiquement. Les moteurs de recherche les plus utilisés comme Google et Bing fournissent des recommandations sur les éléments à présenter dans ce type de documents.

Le format du fichier sitemap

En plus des informations sur le format XML et l’encodage UTF-8, il est important d’inclure la date de la dernière modification, la fréquence de mise à jour, ainsi que la priorité de la page sur une échelle allant de 0,0 à 1,0.

Le protocole et la méthode sont semblables d’un site à un autre, la structure recommandée est la suivante :

sitemap xmlExemple de code d’un sitemap classique (voir en bas de l’article pour le code à copier-coller)

Le format du fichier index de sitemaps

Un index de sitemaps est tout simplement un sitemap présentant des sitemaps. Il permet d’indiquer les URL de l’ensemble des segments de votre site. Un générateur de sitemaps ou un plug-in similaire à Yoast vous permettra d’automatiser la gestion de votre index. C’est sans doute la solution la plus simple pour ceux d’entre nous qui n’ont pas les compétences techniques nécessaires.

index sitemapExemple de code d’un index de sitemaps (voir en bas de l’article pour le code à copier-coller)

Structurez votre sitemap par section

Il est intéressant de structurer votre sitemap par section. Cette astuce permet de surveiller l’indexation de votre site en fonction des sections. Cela a l’avantage de mieux comprendre les URL valides et celles exclues dans la Google Search Console.

Pour simplifier l’organisation d’un sitemap par section, il suffit de mettre en place un index, une sorte de sommaire en ligne présentant l’ensemble des parties et sous-parties de votre site.

Inclure uniquement les pages importantes

Pour rappel, le sitemap a pour objectif premier la simplification de l’exploration de vos pages par les robots des moteurs de recherche. Nous recommandons donc de ne pas inclure les pages sans aucun intérêt SEO.

Favorisez les pages stratégiquement importantes de votre site, on les appelle généralement les « money-page », car ce sont les pages qui participent directement ou non à la monétisation de votre site. Ce sont également les pages qui vous demanderont sans doute le plus de travail, autant les mettre en avant.

Petite astuce supplémentaire, vérifiez bien que l’ensemble des pages présentes dans le sitemap sont en code d’état HTTP 200. Si vous trouvez quelques pages en redirections 301, 302, etc. ou en erreurs 404, 410, etc., pensez à les supprimer du sitemap.

Inclure uniquement des pages que vous souhaitez indexer

Pour diverses raisons liées à votre stratégie SEO, un certain nombre de pages peuvent être marquées en no-index. Cela signifie que vous demandez explicitement aux robots de Google de ne pas présenter ces pages dans les résultats de recherche.

Pour les mêmes raisons, évitez de mettre les URL proposant une balise canonique vers une autre page. Tout comme les pages en no-index, elles représenteraient en quelque sorte des erreurs et donc une perte de crawl budget inutile.

Soumettre votre sitemap à Google (et aux autres moteurs de recherche)

Google Search Console

Si ce n’est pas déjà fait, nous vous invitons à créer une page sur Google Search Console (anciennement Google Webmaster Tool) et à valider la propriété avec la méthode la plus adaptée à votre projet.

Une fois votre compte GSC validé, rendez-vous dans le menu dans la sidebar. Dans la partie « Index », vous trouverez l’élément « Sitemaps ». Une fois sur la page, il ne vous reste plus qu’à renseigner l’URL de votre sitemap dans le champ prévu à cet effet. Si vous faites appel à des webmasters pour gérer la partie technique de votre site, vérifiez avec eux la bonne application du protocole.

Petite astuce finale, pensez à ajouter votre sitemap dans votre fichier robots.txt sous la forme
sitemap: https://votre-site.fr/votre-sitemap.xml

Ressources

Sitemap

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.votresite.fr/</loc>
<lastmod>2021-01-01</lastmod>
<changefreq>weekly</changefreq>
<priority>0.8</priority>
</url>
</urlset>

Index de sitemaps

<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>http://www.votresite.fr/sitemap1.xml.gz</loc>
<lastmod >2021-01-01T19:21:15+00:00</lastmod>
</sitemap>
<sitemap>
<loc>http://www.votresite.fr/sitemap2.xml.gz</loc>
<lastmod>2021-01-02</lastmod>
</sitemap>
</sitemapindex>

Posté dans : Métier du web