Skip to content
Back to Blog
xml sitemapsitemap.xmltechnical seogoogle search consolecrawling

Créer un sitemap XML manuellement

Construisez un sitemap.xml valide à la main sans plugin : la syntaxe urlset exacte, les balises lues par Google, la validation et la soumission à Search Console.

SZ
Founder, Molixa
13 min read
Partager
Créer un sitemap XML manuellement
Table of contents8 sections

Pour créer un sitemap XML manuellement, vous écrivez un fichier sitemap.xml simple qui liste chaque URL importante de votre site dans un élément <urlset>, vous l'enregistrez à la racine de votre site, et vous le soumettez dans Google Search Console. Aucun plugin, CMS ou outil de build requis. Le fichier n'est que du texte, et une fois que vous comprenez les quatre balises qui comptent, vous pouvez rédiger à la main un sitemap valide en quelques minutes.

Ce guide s'adresse aux personnes travaillant sur des sites codés à la main, des générateurs de sites statiques ou des frameworks où vous n'avez pas de bouton de sitemap en un clic. Vous obtiendrez la syntaxe exacte, les balises que Google lit réellement (et celles qu'il ignore silencieusement), comment valider avant de soumettre, et quand un seul fichier ne suffit plus.

Ce qu'est réellement un sitemap XML#

Un sitemap XML est une liste lisible par machine des URL que vous souhaitez faire connaître aux moteurs de recherche. Il n'améliore pas le classement à lui seul. Il aide les robots à découvrir les pages plus rapidement et à comprendre la structure de votre site, ce qui est surtout important pour les nouveaux sites, les grands sites et les pages mal liées en interne.

Considérez-le comme une table des matières que vous remettez à Googlebot. Le robot décide toujours ce qu'il indexe, mais vous avez supprimé l'excuse "nous n'avons jamais trouvé cette page". Pour les petits sites bien liés, Google trouve généralement tout de lui-même, mais un sitemap élimine les incertitudes et accélère la découverte des contenus frais.

Point clé : un sitemap est une aide à la découverte, pas une garantie d'indexation. Lister une URL ne force pas Google à l'indexer. Une page peut figurer dans votre sitemap et être marquée "Explorée, non indexée" si Google la juge de faible valeur.

Le sitemap.xml minimal valide#

Voici le plus petit sitemap qui passe la validation. Chaque sitemap manuel est une variation de ce squelette.

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>https://example.com/</loc>
  </url>
  <url>
    <loc>https://example.com/a-propos</loc>
  </url>
  <url>
    <loc>https://example.com/blog/premier-article</loc>
  </url>
</urlset>

Trois règles font fonctionner ce fichier, et enfreindre l'une d'elles est la cause habituelle d'une erreur "le sitemap n'a pas pu être lu" :

  • La déclaration XML et l'espace de noms xmlns sur <urlset> sont obligatoires. Si vous omettez l'espace de noms, les analyseurs rejettent le fichier.
  • Chaque <loc> doit être une URL absolue complète incluant le protocole (https://), pas /a-propos ou example.com/a-propos.
  • Le fichier doit être encodé en UTF-8 et les URL doivent être correctement échappées (plus d'informations sur le piège de l'esperluette ci-dessous).

Les quatre balises du sitemap, classées par importance pour Google#

C'est la partie que la plupart des tutoriels se trompent. Le protocole sitemap définit quatre balises enfants dans chaque <url>, mais Google les traite très différemment en 2026.

BaliseSignificationGoogle l'utilise-t-il ?
<loc>L'URL de la pageOui. Obligatoire. C'est tout l'intérêt.
<lastmod>Date de dernière modification significativeOui, si elle est précise et honnête.
<changefreq>Fréquence de changement de la pageNon. Google a déclaré ignorer cette balise.
<priority>Importance relative, de 0.0 à 1.0Non. Google ignore aussi celle-ci.

La documentation de Google confirme qu'il lit <loc> et utilise <lastmod> comme signal de crawl, tandis que <changefreq> et <priority> sont des valeurs effectivement mortes. D'autres moteurs peuvent encore les consulter, donc les inclure est inoffensif, mais ne perdez pas une seconde à ajuster une priorité de 0,8 contre 0,7. Cela ne change rien pour Google.

La seule balise qui mérite votre attention est <lastmod>. Définissez-la avec une vraie date ISO 8601 comme 2026-06-25 ou 2026-06-25T14:30:00+00:00. Crucialement, ne la mettez à jour que lorsque le contenu de la page change réellement. Si chaque URL prétend avoir été modifiée aujourd'hui à chaque crawl, Google apprend à se méfier de vos dates et ignore complètement le signal.

Comment créer un sitemap XML manuellement, étape par étape#

Voici le workflow complet codé à la main, d'un fichier vierge à un sitemap soumis et validé. Savoir créer un sitemap XML manuellement signifie que vous ne dépendez jamais d'un plugin qui pourrait planer, prendre du retard ou lister des URL que vous ne vouliez jamais voir explorées.

Étape 1 : Lister chaque URL que vous souhaitez indexer#

Ouvrez un tableur ou un fichier texte et notez l'URL canonique de chaque page que vous voulez dans les résultats de recherche. Incluez votre page d'accueil, les pages clés, les articles de blog et les pages produits.

Excluez délibérément tout ce que vous ne voulez pas voir apparaître : pages de remerciement, résultats de recherche internes, archives de tags, doublons paginés, écrans de connexion et toute URL qui renvoie une balise noindex ou un statut non-200. Un sitemap rempli de redirections, de 404 et de pages noindexées envoie des signaux contradictoires et est la raison la plus courante des avertissements de sitemap dans Search Console.

Étape 2 : Envelopper chaque URL dans la structure urlset#

Créez un fichier nommé exactement sitemap.xml. Ajoutez la déclaration XML et la balise d'ouverture <urlset> avec l'espace de noms, puis enveloppez chaque URL de votre liste dans une paire <url> / <loc>.

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>https://example.com/</loc>
    <lastmod>2026-06-25</lastmod>
  </url>
  <url>
    <loc>https://example.com/pricing</loc>
    <lastmod>2026-06-20</lastmod>
  </url>
</urlset>

Attention aux caractères spéciaux. Dans une balise <loc>, une esperluette doit être écrite &amp;, pas un & brut. Ainsi, une URL comme https://example.com/search?q=a&page=2 devient https://example.com/search?q=a&amp;page=2. Une seule esperluette non échappée cassera tout le fichier. (En règle générale, les URL paramétrées n'ont de toute façon pas leur place dans un sitemap.)

Étape 3 : Enregistrer à la racine du site#

Téléchargez sitemap.xml à la racine de votre domaine pour qu'il soit accessible à https://example.com/sitemap.xml. Le placement à la racine est la convention attendue par les robots d'exploration, et il définit également la portée : un sitemap à la racine peut lister des URL sur tout le domaine.

Un sitemap peut techniquement vivre dans un sous-répertoire, mais il ne sera alors considéré comme fiable que pour les URL de ce même chemin. Gardez-le à la racine sauf si vous avez une raison spécifique de faire autrement. Confirmez qu'il se charge en ouvrant l'URL dans un navigateur. Vous devriez voir du XML brut, pas une 404 ou le HTML de votre site.

Étape 4 : Pointer robots.txt vers le sitemap#

Ajoutez une directive d'une ligne à votre fichier robots.txt pour que tout robot qui le lit découvre automatiquement le sitemap :

Sitemap: https://example.com/sitemap.xml

Utilisez l'URL absolue complète et placez la ligne n'importe où dans le fichier (elle n'est liée à aucun bloc user-agent). Si vous n'avez pas encore de fichier robots, notre générateur gratuit de robots.txt construit un fichier valide avec la ligne de sitemap déjà intégrée.

Étape 5 : Valider avant de soumettre#

Ne soumettez pas un sitemap que vous n'avez pas validé. Une seule balise mal formée peut amener Google à rejeter silencieusement tout le fichier. Passez le XML brut dans un validateur qui vérifie à la fois la bonne formation (balises correctes, caractères échappés) et la conformité au protocole (espace de noms correct, URL absolues, limites de taille).

Le chemin le plus rapide est de coller votre URL dans le générateur et validateur gratuit de sitemap XML de Molixa. Il vérifie votre structure, signale les caractères non échappés et les URL relatives, et peut même construire un sitemap propre pour vous si vous préférez ne pas maintenir le fichier à la main. Valider ici d'abord vous évite l'aller-retour de soumettre un fichier cassé et d'attendre que Search Console se plaigne.

Étape 6 : Soumettre dans Google Search Console#

Ouvrez Search Console, choisissez votre propriété et allez dans le rapport Sitemaps dans le menu de gauche. Saisissez sitemap.xml (le chemin relatif à votre domaine) et cliquez sur Soumettre.

Google récupérera le fichier, signalera combien d'URL il a découvertes et indiquera les éventuelles erreurs d'analyse. La soumission ne déclenche pas une indexation instantanée. Attendez-vous à ce que Google explore à nouveau sur plusieurs jours, pas minutes. Vous pouvez soumettre le même sitemap à Bing Webmaster Tools de la même manière, et la ligne robots.txt couvre les robots qui ne voient jamais vos tableaux de bord webmaster.

La limite des 50 000 URL et les fichiers d'index de sitemap#

Un fichier sitemap unique a deux limites strictes définies par le protocole : un maximum de 50 000 URL et une taille de fichier non compressé maximale de 50 Mo. Si vous atteignez l'une de ces limites, vous devez diviser votre sitemap, puis relier les morceaux avec un fichier d'index de sitemap.

C'est le moment que la plupart des guides basés sur des plugins ignorent complètement. Un index de sitemap est un sitemap de sitemaps. Au lieu de lister des pages, il liste vos fichiers sitemap individuels.

<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <sitemap>
    <loc>https://example.com/sitemap-articles.xml</loc>
    <lastmod>2026-06-25</lastmod>
  </sitemap>
  <sitemap>
    <loc>https://example.com/sitemap-produits.xml</loc>
    <lastmod>2026-06-24</lastmod>
  </sitemap>
</sitemapindex>

Notez les différences : l'élément racine est <sitemapindex> et non <urlset>, et chaque entrée utilise <sitemap> au lieu de <url>. Vous ne soumettez que le fichier d'index dans Search Console, et Google récupère chaque sitemap enfant qu'il référence.

Même si vous êtes loin des 50 000 URL, diviser par type de contenu (articles, produits, pages) est une bonne pratique. Lorsque Search Console signale un problème de couverture, un index vous permet de voir quel segment du site pose problème au lieu de devoir analyser un seul fichier géant. Vous pouvez aussi compresser n'importe quel sitemap en sitemap.xml.gz pour rester sous la limite de taille ; la limite du nombre d'URL s'applique toujours au contenu non compressé.

Erreurs courantes dans les sitemaps manuels#

Voici les erreurs qui transforment une tâche de cinq minutes en un après-midi de débogage. La plupart se manifestent par un message vague « impossible de récupérer » ou « contient des erreurs » dans Search Console.

  • URLs relatives. <loc>/about</loc> est invalide. Utilisez toujours l'URL complète avec https://.
  • Protocoles ou hôtes mélangés. Ne listez pas les versions http:// et https://, ni www et non-www. Choisissez votre version canonique et listez uniquement celle-ci.
  • URLs non canoniques ou avec noindex. Si une page canonicalise ailleurs ou porte un noindex, la laisser dans le sitemap contredit vos propres signaux.
  • Esperluette nue. L'échec d'analyse le plus courant. Échappez-la en &amp;.
  • Dates lastmod obsolètes ou fausses. Mettre à jour chaque date à « aujourd'hui » à chaque déploiement apprend à Google à ignorer ce champ.
  • Oublier de mettre à jour le fichier. Un sitemap codé à la main ne se met pas à jour tout seul. Les nouvelles pages n'apparaîtront pas tant que vous ne les ajoutez pas, ce qui est le principal inconvénient de l'approche manuelle par rapport à un générateur.

Attention : n'incluez jamais d'URLs que vous avez bloquées dans robots.txt. Dire à Google « explore ceci » dans le sitemap tout en lui disant « n'explore pas ceci » dans robots.txt est une contradiction qui gaspille le budget d'exploration et déclenche des avertissements.

Manuel vs Généré : Lequel Choisir#

Coder un sitemap à la main est idéal pour les petits sites stables et pour comprendre exactement ce que fait le fichier. L'inconvénient est la maintenance : chaque nouvelle page nécessite une modification manuelle, et une faute de frappe peut casser silencieusement tout le fichier.

Pour les sites qui publient régulièrement, un générateur qui explore votre site en direct et reconstruit le fichier automatiquement élimine les erreurs humaines et la maintenance. Le compromis que beaucoup adoptent est de générer le fichier avec un outil, puis de lire le résultat pour comprendre ce qui a été produit. Associer un sitemap propre à une structure de page solide, comme un balisage schema approprié pour les résultats enrichis, est ce qui renforce votre SEO technique au fil du temps.

Conclusion#

Vous savez désormais comment créer un sitemap XML manuellement : listez vos URLs indexables, encadrez chacune dans une balise <url> et <loc> à l'intérieur d'un <urlset> avec espace de noms, soyez honnête avec <lastmod>, ignorez <priority> et <changefreq>, validez le fichier, ajoutez la ligne du sitemap dans robots.txt, et soumettez-le dans Search Console. Passez à un index de sitemap une fois que vous dépassez 50 000 URLs ou 50 Mo.

Le fichier est vraiment simple une fois que l'on enlève le mystère des plugins. Créez-le une fois à la main pour en comprendre la structure, puis décidez si vous préférez le maintenir manuellement ou laisser le générateur de sitemap XML le mettre à jour pour vous et le valider à chaque modification.

Foire aux questions#

Ai-je besoin d'un plan de site XML si mon site est petit ? Pas strictement. Google peut généralement découvrir toutes les pages d'un petit site bien lié via un crawl normal. Un plan de site aide néanmoins en accélérant la découverte de nouveaux contenus et en supprimant toute ambiguïté sur les URL que vous considérez importantes. C'est donc un effort minime qui vaut la peine, même pour quelques pages.

Ajouter une URL à mon plan de site garantit-il son indexation ? Non. Un plan de site est une aide à la découverte, pas un ordre d'indexation. Google décide indépendamment si une page mérite d'être indexée en fonction de sa qualité et de son unicité. Une URL peut apparaître dans votre plan de site et rester "Explorée, non indexée" ou "Découverte, non indexée" dans Search Console.

Dois-je définir la priorité et la fréquence de changement de mes URL ? Vous pouvez, mais Google ignore les deux. Il lit <loc> et utilise <lastmod> lorsque les dates sont exactes, tandis que <changefreq> et <priority> n'ont aucun effet sur le crawl ou le classement de Google. Ils sont inoffensifs pour d'autres moteurs, mais ne perdez pas de temps à les paramétrer.

Où doit se trouver le fichier sitemap.xml ? Placez-le à la racine de votre domaine, accessible à https://votredomaine.com/sitemap.xml. Un emplacement racine permet à un seul plan de site de couvrir les URL de tout votre domaine et correspond aux attentes des robots d'exploration. Ajoutez une ligne Sitemap: dans robots.txt et soumettez l'URL dans Search Console pour qu'elle soit découverte via tous les canaux.

Comment valider mon plan de site avant de le soumettre ? Vérifiez à la fois que le XML est bien formé (balises correctes, esperluettes échappées, encodage UTF-8) et qu'il suit le protocole (bon espace de noms, URL absolues, limites de 50 000 URL et 50 Mo). Collez votre plan de site dans un validateur comme l'outil de plan de site Molixa, corrigez les problèmes signalés, puis soumettez le fichier propre dans Google Search Console.

Que se passe-t-il si j'ai plus de 50 000 URL ? Répartissez vos URL sur plusieurs fichiers de plan de site, chacun sous 50 000 URL et 50 Mo, puis créez un fichier d'index de plan de site listant ces plans enfants avec des entrées <sitemapindex> et <sitemap>. Soumettez uniquement le fichier d'index à Search Console, et Google récupérera chaque plan de site référencé.

xml sitemapsitemap.xmltechnical seogoogle search consolecrawling

More from Molixa

Try Molixa Tools

50+ free AI tools for content creation, SEO, coding, and more. No signup, no watermark.

Explore all tools
Créer un sitemap XML manuellement (2026) | Molixa