Ces derniers jours, en me rendant dans la Google Search Console, je me suis rendu compte que j’avais quelques milliers d’articles qui étaient indexés par Google mais sans être présents dans aucune sitemap.

Il s’agit en fait des articles de tablatures de guitare: au lieu de publier un article pour chaque tablatures, le site crée à la volée un article WordPress qui contient la tablature en question. C’est très efficace mais cela ne permet évidemment pas de les ajouter au fichier sitemap par défaut.

Si vous avez ce genre de configuration – ou si vous avez d’autres liens à soumettre à Google, voici ce que j’ai utilisé cette semaine.

État des lieux

On commence par se connecter à la Search Console pour se rendre dans Coverage > Valid > Indexed, not submitted in sitemap.

Voici un petit graphique qui montre les 1658 pages au 26 juillet et après soumission de la première sitemap – 1000 liens, car cela semble être la limite de l’export de la Search console, un premier résultat positif:

Export de la liste des articles

Tout en haut de la page, cliquez sur le bouton Export et sélectionnez Download CSV:

Cela lance le téléchargement d’un fichier zip. Décompressez l’archive et ouvrez le fichier Table.csv dans votre tableur préféré.

Préparation du fichier CSV

Le fichier CSV généré par la Search Console ne contient que deux colonnes: URL et Last crawled (date de la dernière visite GoogleBot).

Nous allons utiliser un service en ligne qui requiert deux colonnes supplémentaires: changefreq (fréquence de mise à jour) et priority (priorité par rapport à d’autres pages).

A lire :  Ubuntu : règler le problème du clavier QWERTY au démarrage

Commencez par créer les deux nouvelles colonnes. Je mets monthly dans la colonne changefreq et 0.5 dans la colonne priority pour chaque élément du tableau.

Pro-tip: écrivez-les une fois dans le premier élément et étirez la cellule vers le bas jusqu’au dernier élément du tableau, cela recopiera la valeur pour toute la colonne.

Enregistrez votre fichier CSV. Ouvrez-le maintenant avec un simple éditeur de texte puis supprimez la première ligne, qui contient le nom des colonnes du tableau. La ligne devrait ressembler à URL;Last crawled;changefreq;priority.

Cherchez et remplacez tous les points-virgule (;) et remplacez-les par le caractère pipe (|).

Enregistrez vos modifications. Changez l’extension du fichier: troquez l’extension .csv pour l’extension .txt

Votre fichier est prêt!

Conversion du fichier CSV en fichier sitemap.xml

C’est la partie la plus simple: nous allons utiliser un outil en ligne, MobileFish Sitemap Generator :

Choisissez la méthode 2, uploadez votre fichier CSV (au format .txt). Cliquez sur Start et ensuite sur Download sitemap.xml pour télécharger votre nouveau fichier de sitemap.

Ajout du fichier sitemap à la Search Console

Il ne vous reste plus qu’à soumettre votre fichier sitemap dans Search Console > Sitemaps.

N’oubliez pas de l’ajouter également dans votre fichier robots.txt avec la syntaxe suivante:

Sitemap: https://example.com/sitemap.xml

Conclusion

Voilà, nous venons de créer un nouveau fichier sitemap pour les pages que Google avait détecté mais que nous ne lui avions pas soumis explicitement via une sitemap.

Une fois que Google a digéré votre nouveau fichier, les pages changeront de catégorie et basculeront dans Submitted and indexed. Cela n’a pris que quelques heures ou une journée chez moi:

A lire :  Les balises meta indispensables pour les réseaux sociaux : Facebook, Twitter, Google+, Pinterest, LinkedIn

Si vous avez trouvé une faute d’orthographe, veuillez nous en informer en sélectionnant le texte en question et en appuyant sur Ctrl + Entrée.

Vous souhaitez réaliser un nouveau projet WordPress ou WooCommerce, ou ajouter de nouvelles fonctionnalités? Ou améliorer les performances de votre site?

Parlons de votre projet »

Articles en rapport:

Écrire un commentaire

Spelling error report

The following text will be sent to our editors: