Créer un fichier sitemap à partir d’une liste d’articles pour le soumettre sur Google Search Console

Ces derniers jours, en me rendant dans la Google Search Console, je me suis rendu compte que j’avais quelques milliers d’articles qui étaient indexés par Google mais sans être présents dans aucune sitemap.

Il s’agit en fait des articles de tablatures de guitare: au lieu de publier un article pour chaque tablatures, le site crée à la volée un article WordPress qui contient la tablature en question. C’est très efficace mais cela ne permet évidemment pas de les ajouter au fichier sitemap par défaut.

Si vous avez ce genre de configuration – ou si vous avez d’autres liens à soumettre à Google, voici ce que j’ai utilisé cette semaine.

État des lieux

On commence par se connecter à la Search Console pour se rendre dans Coverage > Valid > Indexed, not submitted in sitemap.

Voici un petit graphique qui montre les 1658 pages au 26 juillet et après soumission de la première sitemap – 1000 liens, car cela semble être la limite de l’export de la Search console, un premier résultat positif:

google search console coverage indexed not submitted in sitemap 1280x746

Export de la liste des articles

Tout en haut de la page, cliquez sur le bouton Export et sélectionnez Download CSV:

google search console coverage indexed not submitted in sitemap export 1280x447

Cela lance le téléchargement d’un fichier zip. Décompressez l’archive et ouvrez le fichier Table.csv dans votre tableur préféré.

Préparation du fichier CSV

Le fichier CSV généré par la Search Console ne contient que deux colonnes: URL et Last crawled (date de la dernière visite GoogleBot).

Nous allons utiliser un service en ligne qui requiert deux colonnes supplémentaires: changefreq (fréquence de mise à jour) et priority (priorité par rapport à d’autres pages).

Commencez par créer les deux nouvelles colonnes. Je mets monthly dans la colonne changefreq et 0.5 dans la colonne priority pour chaque élément du tableau.

Pro-tip: écrivez-les une fois dans le premier élément et étirez la cellule vers le bas jusqu’au dernier élément du tableau, cela recopiera la valeur pour toute la colonne.

Enregistrez votre fichier CSV. Ouvrez-le maintenant avec un simple éditeur de texte puis supprimez la première ligne, qui contient le nom des colonnes du tableau. La ligne devrait ressembler à URL;Last crawled;changefreq;priority.

Cherchez et remplacez tous les points-virgule (;) et remplacez-les par le caractère pipe (|).

Enregistrez vos modifications. Changez l’extension du fichier: troquez l’extension .csv pour l’extension .txt

Votre fichier est prêt!

Conversion du fichier CSV en fichier sitemap.xml

C’est la partie la plus simple: nous allons utiliser un outil en ligne, MobileFish Sitemap Generator :

mobilefish online sitemap generator 1280x1193

Choisissez la méthode 2, uploadez votre fichier CSV (au format .txt). Cliquez sur Start et ensuite sur Download sitemap.xml pour télécharger votre nouveau fichier de sitemap.

Ajout du fichier sitemap à la Search Console

Il ne vous reste plus qu’à soumettre votre fichier sitemap dans Search Console > Sitemaps.

N’oubliez pas de l’ajouter également dans votre fichier robots.txt avec la syntaxe suivante:

Sitemap: https://example.com/sitemap.xml

Conclusion

Voilà, nous venons de créer un nouveau fichier sitemap pour les pages que Google avait détecté mais que nous ne lui avions pas soumis explicitement via une sitemap.

Une fois que Google a digéré votre nouveau fichier, les pages changeront de catégorie et basculeront dans Submitted and indexed. Cela n’a pris que quelques heures ou une journée chez moi:

google search console coverage submitted and indexed 1280x737

Vous voulez un site WordPress ou WooCommerce qui soit à la fois rapide et performant? Vous êtes au bon endroit.

Découvrez comment je peux booster votre site »

Articles conseillés :

Opinions