Tag

Google

Browsing

Ces derniers jours, en me rendant dans la Google Search Console, je me suis rendu compte que j’avais quelques milliers d’articles qui étaient indexés par Google mais sans être présents dans aucune sitemap.

Il s’agit en fait des articles de tablatures de guitare: au lieu de publier un article pour chaque tablatures, le site crée à la volée un article WordPress qui contient la tablature en question. C’est très efficace mais cela ne permet évidemment pas de les ajouter au fichier sitemap par défaut.

Si vous avez ce genre de configuration – ou si vous avez d’autres liens à soumettre à Google, voici ce que j’ai utilisé cette semaine.

État des lieux

On commence par se connecter à la Search Console pour se rendre dans Coverage > Valid > Indexed, not submitted in sitemap.

Voici un petit graphique qui montre les 1658 pages au 26 juillet et après soumission de la première sitemap – 1000 liens, car cela semble être la limite de l’export de la Search console, un premier résultat positif:

Export de la liste des articles

Tout en haut de la page, cliquez sur le bouton Export et sélectionnez Download CSV:

Cela lance le téléchargement d’un fichier zip. Décompressez l’archive et ouvrez le fichier Table.csv dans votre tableur préféré.

Et voilà, depuis le temps que j’en voulais une… j’ai attendu patiemment que Google sorte la Nexus 7 qui, grâce à la magie de Noël (et de mes parents!) est enfin mienne.

La tablette en elle-même est plutôt belle d’aspect : bords arrondis argentés et coque arrière en plastique agréable au toucher (style grip et non un plastique brillant qui glisse entre les doigts – bon point!). L’écran est sublime, extrêmement précis et réactif.

Niveau performance, rien à voir avec la tablette chinoise que j’avais achetée à mon père il y a quelques mois:

  • écran 7” 1280×800 (216ppi)
  • 32Go de disque
  • 1 Go de RAM
  • NVIDIA Tegra3 quad-core processor
  • camera 1.2MP

Le tout tournant évidemment sous Android. Au premier démarrage, j’ai entré la clé WiFi de la maison puis mes identifiants Google : la tablette a alors récupéré toute la liste des applications installées sur mon téléphone et les a installées automatiquement sur la tablette.

Au début, je me suis demandé si c’était bien. Au final, j’ai trouvé cela génial : mêmes applis sur les deux périphériques, au moins on ne cherche pas ses applications!

La tablette a ensuite été chercher ses mises à jours pour Android : d’abord la 4.1.2 (23 Mo) puis, un reboot plus tard, la 4.2.1 (85 Mo). Et hop, la tablette est entièrement mise à jour, avec toutes mes applications en quelques minutes.

Sur votre site ou blog, vous avez peut-être ajouté le widget ou bouton +1 de Google+, le réseau social de Google. Or le petit problème, c’est que le code fourni empêche la bonne validation du document.

Voici le code fourni par Google :

<a title="Google+" href="https://plus.google.com/114535411372700844744" rel="publisher nofollow">Google+</a>

et voici l’erreur renvoyée par le validateur W3C :

Keyword publisher is not registered

HTML5 étant toujours en cours de réalisation, les valeurs de la balise rel sont assez restreintes et on ne peut pas mettre tout ce que l’on veut sans déclencher l’erreur.

La solution est toute simple : il faut ajouter la valeur du rel en argument dans le lien, comme ceci :

<a title="Google+" href="https://plus.google.com/114535411372700844744?rel=publisher" rel="nofollow">Google+</a>

Et voilà, plus d’erreur lors de la validation.

Cela fait quelques mois que le nouveau serveur est en place et il est temps de faire un petit bilan au niveau des performances.

Charge processeur

Tout d’abord, bien que le serveur soit équipé des mêmes caractéristiques techniques (même CPU, même quantité de RAM), il s’avère qu’il est beaucoup plus réactif que l’ancien. Le processeur n’est plus surchargé en permanence et lorsque l’on lance un top, la charge du processeur est le plus souvent entre 0.05 et 0.20, ce qui est idéal. A titre de comparaison, l’ancien serveur avait une charge souvent supérieure à 2.

Analyse du temps de chargement des pages via Google Webmaster Tools

Il y a quelques semaines, je me suis connecté sur Google Webmaster Tools et lorsque j’ai atteint le graphique du temps de chargement des pages du site, j’ai eu l’agréable surprise de découvrir ceci :

Sommaire de la série Monter un serveur dédié de A à Z

  1. Serveur dédié : installation d’Apache, PHP, MySQL et Webmin
  2. Serveur dédié : créer la base de données MySQL et importer WordPress
  3. Serveur dédié : créer et activer un Virtual Host sous Apache
  4. Serveur dédié : changer les DNS du nom de domaine et le faire pointer vers le serveur
  5. Serveur dédié : sécurisation des services avec iptables et fail2ban
  6. Serveur dédié : sécurisation de la couche TCP/IP
  7. Serveur dédié : création d’un serveur mail Postfix (sécurisé avec Saslauthd et certificat SSL) et Courier (accès POP et IMAP) utilisant une base MySQL d’utilisateurs/domaines virtuels
  8. Serveur dédié : sécuriser Apache 2 avec ModSecurity
  9. Serveur dédié : CHMOD récursif sur des fichiers ou répertoires en ligne de commande
  10. Serveur dédié : installer APC comme système de cache et configurer Varnish comme reverse-proxy pour Apache pour améliorer les performances
  11. Serveur dédié : afficher la véritable IP derrière un reverse-proxy comme Varnish
  12. Serveur dédié : intégrer SSH à WordPress pour mettre à jour le core, les plugins et les thèmes
  13. Serveur dédié : installer la dernière version d’APC par SVN
  14. Serveur dédié : analyse des performances du serveur
  15. Serveur dédié : mettre à jour le noyau Debian de la Kimsufi
  16. Serveur dédié : sauvegarde automatique des fichiers avec Backup Manager sur le serveur de sauvegarde OVH
  17. Serveur dédié : configurer la limite mémoire pour PHP et Suhosin
  18. Bash : supprimer tous les fichiers et sous-répertoires d’un répertoire
  19. Serveur dédié : impossible de se connecter à un port distant
  20. Rsync: rapatrier les fichiers du serveur à la maison
  21. Bash : réparer les tables MySQL en cas de crash
  22. Serveur dédié : création d’une seedbox avec Transmission
  23. Serveur dédié : des paquets LAMP à jour sous Debian
  24. Serveur dédié : mise à jour vers Debian 7 Wheezy
  25. Serveur dédié : activer X11 forwarding pour SSH
  26. Serveur dédié : optimiser toutes les images JPG et PNG avec OptiPNG et JpegOptim
  27. Postfix : résoudre l’erreur “fatal: www-data(33): message file too big”
  28. Serveur dédié : mise en place de l’IPv6
  29. WordPress : accorder les bonnes permissions aux fichiers et dossiers avec chown et chmod
  30. WordPress : héberger les images sur un sous-domaine
  31. Serveur dédié : ajouter l’authentification SPF, Sender-ID et DKIM à Postfix et Bind9 avec opendkim
  32. Apache : lorsque le domaine seul (sans WWW) renvoie une erreur 403
  33. Serveur dédié : sécuriser Apache avec HTTPS (HTTP avec la couche TLS/SSL) en Perfect Forward Secrecy
  34. Serveur dédié : passer WordPress en HTTPS (TLS/SSL)
  35. Serveur dédié : configurer Webmin en TLS avec un certificat SSL
  36. Serveur dédié : configurer Transmission pour accéder au WebUI via TLS-SSL
  37. Serveur dédié : installer et configurer Varnish 4
  38. Serveur dédié : passage au mod FastCGI et PHP-FPM avec Apache MPM Worker
  39. Récupérer un serveur Kimsufi après un plantage de kernel avec le mode rescue OVH
  40. Serveur dédié : configurer Postfix et Courier pour utiliser TLS-SSL en Perfect Forward Secrecy
  41. Serveur dédié : retirer Varnish, devenu inutile avec HTTPS
  42. Serveur dédié : installer la dernière version d’OpenSSL sous Debian
  43. Serveur dédié : activer l’IP canonique du serveur sous Apache
  44. Serveur dédié : mise à jour vers PHP 5.6
  45. MySQL : convertir les tables MyISAM au format InnoDB
  46. Serveur dédié : optimiser toutes les images GIF avec GIFsicle
  47. Serveur dédié : migration de MySQL vers MariaDB
  48. BASH : lister, bloquer et débloquer des adresses IP avec iptables
  49. Serveur dédié : produire une meilleure réserve d’entropie avec haveged
  50. Serveur dédié : mettre en place DNSSEC pour sécuriser les DNS du domaine
  51. Serveur dédié : mise en place du protocole DANE
  52. 8 règles d’or pour bien déployer DNSSEC et DANE
  53. Serveur dédié : installer PHP7 FPM avec FastCGI sous Debian
  54. Serveur dédié : réduire les connexions TIME_WAIT des sockets et optimiser TCP
  55. Fail2Ban: protéger Postfix contre les attaques DoS de types AUTH, UNKNOWN et EHLO
  56. Serveur dédié : mettre à jour Apache et configurer le mod_http2 pour HTTP/2
  57. Serveur dédié : ajouter le domaine à la liste HSTS preload
  58. Serveur dédié : ajouter l’authentification DMARC à Postfix et BIND
  59. Serveur dédié : à la recherche de l’inode perdue ou comment résoudre le problème “no space left on device”
  60. Serveur dédié : installer NginX avec support HTTP2 et certificat SSL, PHP, MariaDB sous Debian

Google, Yahoo! et Live Search viennent de se mettre d’accord pour essayer de résoudre les problèmes de contenus dupliqués à l’intérieur d’un site : ils ont opté pour la création d’une balise spéciale qui décrit l’URL canonique d’une page (c’est-à-dire son URL officielle) :

rel="canonical"

Le problème : le contenu dupliqué

Ce qui pose problème pour les moteurs de recherche, c’est savoir quelle est la bonne page à indexer lorsqu’un même contenu est disponible à plusieurs adresses différentes.

C’est le problème du contenu dupliqué, ou duplicate content.

duplicate content

C’est mauvais pour le référencement d’un site car pour les moteurs de recherche, une page web ou tout autre document indexable (comme les fichiers PDF, DOC, XLS…) équivaut à une URL.

Cette URL doit être unique pour le robot, pour qui une autre URL correspond à une autre page.

Si ce n’est pas le cas, ces pages dupliquées entrent en concurrence les unes avec les autres dans les résultats de recherche, ce qui n’est pas bon.

Migration de feedburner vers googleCela fait quasiment deux ans que Google a racheté FeedBurner et pas grand-chose ne s’était passé depuis. Et bien la machine vient de se mettre en marche : la grande migration des comptes FeedBurner vers les comptes Google a déjà commencé.

Cette migration, qui concerne tous les comptes, se terminera le 28 février donc je vous conseille de prendre les devants et de migrer votre compte vous-même.

La migration prend moins de 2 minutes.

GoogleMarre de la publicité qui s’affiche en haut et à droite des résultats de vos recherches avec Google ? N’en jetez plus ! Voici une petite astuce pour l’éliminer purement et simplement : pas de hack, pas de script, il suffit d’aller sur Google avec l’URL suivante :

http://www.google.fr/search?output=googleabout

Rajoutez la variable output=googleabout et la publicité disparaît comme par enchantement, laissant la place à une page des résultats épurée et donc au final plus rapide, sans fioritures. Nickel !

J’ai reçu ce message de la part de Google ce matin :

Google Adsense : la belle arnaque !Bonjour Matt,

Nous avons constaté que des clics incorrects ont été générés à partir des annonces Google diffusées sur votre site. Nous avons par conséquent désactivé votre compte Google AdSense. Cette mesure a été prise dans le but de protéger les intérêts des annonceurs AdWords.

Le site d’un éditeur ne doit pas générer de clics incorrects sur des annonces, incluant, sans s’y limiter, les clics générés par :

– un éditeur cliquant sur ses propres pages Web
– un éditeur incitant d’autres utilisateurs à cliquer sur ses annonces
– des outils automatisés de génération de clics ou tout autre logiciel de détournement de clics.
– un éditeur modifiant toute portion du code d’annonce ou l’apparence, le fonctionnement, le ciblage ou la diffusion des annonces pour quelque raison que ce soit

Ces pratiques constituent une violation des Conditions générales et du règlement du programme Google AdSense, que vous pouvez consulter sur les pages suivantes :

https://www.google.com/adsense/localized-terms?hl=fr
https://support.google.com/adsense/answer/48182?utm_source=aso&utm_medium=link&utm_campaign=ww-ww-et-asfe_&hl=fr&gsessionid=gSlW8RrVfqaKHi2zsgCJVA

Les éditeurs dont les comptes ont été désactivés en raison de clics incorrects, ne sont plus autorisés à participer au programme AdSense et ne recevront plus aucun nouveau paiement. Les gains de votre compte seront remboursés de manière appropriée aux annonceurs victimes de ces clics incorrects.

Cordialement,

L’équipe Google AdSense

Le problème, c’est que les pubs affichés sur le site, je ne les vois pas parce que j’utilise l’extension AdBlock Plus pour Firefox. Donc comment pourrais-je cliquer sur une annonce qui ne s’affiche pas chez moi ?!? Je n’utilise bien évidemment pas de programmes litigieux et n’ai incité personne à cliquer sur leurs annonces. Voilà, donc Adsense se termine ici apparemment. J’ai contacté leur support par email et par téléphone – qui renvoie vers le formulaire par mail d’ailleurs, toujours agréable lorsque l’on a besoin de parler à quelqu’un – mais je ne m’attends manifestement pas à un renversement de situation, vu ce que j’ai pu lire çà et là sur quelques forums.

Après enquête, il s’avère qu’il importe peu qui a cliqué sur les bannières : que ce soit un webmaster peu scrupuleux ou un petit malin qui s’amuse, le compte est désactivé. Par extrapolation : cliquez à répétition sur les annonces Google d’un site et celui-ci perdra son compte Adsense. Une logique imparable – c’est le webmaster qui en fait les frais. Adsense DTC, by Google…