sitemap.xml, comment faire?

Qu’est ce qu’un sitemap?

Un sitemap est un fichier xml, encodé en UTF-8,  qui se situe généralement à la racine de votre site web (sitemap.xml) et qui est une carte à jour de celui ci : il va répertorier toutes les URLs de votre site et va permettre aux moteurs de recherche de le crawler plus rapidement et facilement, surtout s’il contient plusieurs milliers de pages.
C’est intéressant aussi sur les pages profondes car les parseurs ne parcourent pas forcément toutes vos pages à chaque passage.

Si certaines URLs n’ont pas de linking interne ou externe, vous pourrez les référencer grâce au sitemap.
Pour des économies de bande passante, vous avez la possibilité de compresser vitre sitemap.xml au format gzip afin d ‘obtenir un fichier de type sitemap.xml.gz

Comment ça marche?

Certaines balises sont obligatoires et d’autre facultatives / non prises en compte par les moteurs de recherche.

Les balises obligatoires :

  • Votre fichier sitemap doit commencer et se terminer par la balise <urlset> et </urlset>
  • Chaque page doit se trouver entre une balise parente <url>
  • Chaque url de votre site doit être spécifiée dans avec la balise enfant <loc> .
    Vous devez spécifier l’URL complète en fonction de son protocole : commençant par http://…, https://.., ftp://…, …

Les balises facultatives :

  • La balise <lastmode> va vous permettre de spécifier la date de dernière modification de votre page au format AAAA-MM-JJ
  • La balise <changefreq> vous permet d’indiquer aux moteurs la fréquence habituelle de modification de la page concernée. Les valeurs possibles sont : always, hourly, daily, weekly, monthly, yearly, never.
    Always peut être utilisé pour les pages qui sont modifiées à chaque consultation et never pour les pages qui ne changeront plus.
  • La balise <priority> permet de donner une priorité, une importance aux URLs. Les valeurs vont de 0,0 pour la priorité la plus faible à 1,0 pour la priorité la plus forte. (ça ne change rien au positionnement)

Quelles sont les contraintes d’un fichier sitemap.xml?

Il ne doit pas avoir plus de 50 000 URLs et ne doit pas dépasser 10 Mo. Si vous dépassez au moins une de ces 2 valeurs, vous devez créer plusieurs un (ou plusieurs) index de sitemap.

Je vous invite à consulter le site sitemap.org si vous dépassez au moins 1 de ces 2 valeurs.

Existe t il des services gratuit de génération de sitemap.xml pour des petits sites ?

Vous pouvez générer gratuitement votre sitemap jusqu’à 500 pages grâce à my-sitemap.com/ ou à xml-sitemaps.com/
En quelques minutes ils vous génèrent le fichier à jour qu vous pouvez télécharger et placer sur votre hébergement en FTP.
Attention, la limite de ces services, hormis le nombre d’URLs restreintes, est que des pages qui ne possèdent pas de linking interne ne seront pas présentes

Comment vérifier que mon sitemap est valide et bien formé?

  • Des services comme valideome.org ou vous permettent de les tester en ligne.
  • L’extension firefox Web Developer vous permet de valider des flux : outils > valider flux

Comment indiquer aux moteurs la présence de mon fichier sitemap.xml?

Vous pouvez déclarer dans votre fichier robots.txt l’URL de votre sitemap de la manière suivante :

Sitemap: http://liens-geeks.com/sitemap.xml

Dans Google Search Console, vous pouvez indiquez l’URL de votre fichier sitemap à Google via le menu configuration du site > Sitemaps.
Cet outil en ligne vous permet aussi de tester sa validité.
Un graphique sera généré et vous indiquera le nombre de pages détectées et le nombre de pages présentes  dans l’index du moteur Google

Jérôme pasquelin - jeromeweb

Entrepreneur et Geek depuis plus de 20 ans.

Entrepreneur et Geek depuis plus de 20 ans.

Post Comment