Tag

moteurs de recherche

Browsing

Google, Yahoo! et Live Search viennent de se mettre d'accord pour essayer de résoudre les problèmes de contenus dupliqués à l'intérieur d'un site : ils ont opté pour la création d'une balise spéciale qui décrit l'URL canonique d'une page (c'est-à-dire son URL officielle) :

rel="canonical"

Le problème : le contenu dupliqué

Ce qui pose problème pour les moteurs de recherche, c'est savoir quelle est la bonne page à indexer lorsqu'un même contenu est disponible à plusieurs adresses différentes. C'est le problème du contenu dupliqué, ou duplicate content.

duplicate contentC'est mauvais pour le référencement d'un site car pour les moteurs de recherche, une page web ou tout autre document indexable (comme les fichiers PDF, DOC, XLS...) équivaut à une URL. Cette URL doit être unique pour le robot, pour qui une autre URL correspond à une autre page.

Si ce n'est pas le cas, ces pages dupliquées entrent en concurrence les unes avec les autres dans les résultats de recherche, ce qui n'est pas bon.

Je me suis aperçu hier soir que le moteur de recherche installé sur SkyMinds.Net était dans les choux : une recherche sur Laffer ou sur Alice Cooper ne donnait plus aucun résultat. La cause : le moteur de recherche que j'utilise, Atomz, est limité dans sa version gratuite à 750 pages et j'arrive bientôt à quelques 1000+ pages. Vu que je n'ai pas écrit 250 pages comme ça en trois coups de cuiller à pot, je suppose que cela fait un bout de temps que certaines pages sont ignorées... un petit mail d'avertissement aurait été le bienvenu. Bref, ils me demandent maintenant de payer pour accéder à une version pro, ce que bien évidemment je ne compte pas faire.

C'est alors que j'ai reconsidéré les possibilités de mon compte Google AdSense, qui fait également office de moteur de recherche interne. Il m'a fallu environ 2 minutes pour tout configurer, c'est à dire remplacer le code HTML de Google qui utilise des tableaux (pas bien !) par du XHTML bien plus léger et supprimer le choix de la recherche entre le Web ou mon site en ajoutant un petit champ caché. Tout fonctionne parfaitement désormais à part le détail cosmétique de la page de recherche : la page servie par Google ne peut pas être customisée à souhait et les seules options que l'on peut modifier concernent la présentation des résultats mais pas celle de la page en elle-même. Du coup, la page de résultat n'est plus intégrée au design général du site. Est-ce que cela est vraiment important ? Personnellement, je dirais oui. Maintenant, ce n'est pas franchement laid, j'aurais préféré que le logo reste à sa place quand même. Si un développeur de Google France passe dans le coin et veut nous offrir quelques options supplémentaires... n'hésitez pas les gars ! ;-)

Bon, ça y est, ma planche à voile est fixée sur ma galerie donc je pense que demain ce sera planche à voile pour moi ^^. Mon père et moi venons de finir de repeindre la façade (avec échelle, sangles... la totale quoi !) donc maintenant je devrais pouvoir souffler un peu.

J'ai aussi trouvé ceci pour soumettre son site aux moteurs de recherche : Add-Url-Free. Il n'y a que la moitié des moteurs qui marchent lors de la soumission mais c'est déjà ça.

Allez, aujourd'hui petit tour d'approche des spiders et des moteurs de recherche : j'ai trouvé Poodle Predictor, qui affiche votre site tel que les moteurs de recherche le voient. Il existe aussi un Search Engine Simulator, qui affiche votre site en mode texte, avec analyse des méta-tags et conseils pour améliorer votre positionnement.

Quelques petits liens utiles du même acabit :

Rapport de faute d’orthographe

Le texte suivant sera envoyé à nos rédacteurs :