Google, l’algorithme Panda, le Spam et le Saint-Graal

Votez pour cet article

L'algorithme PandaCet article, le deuxième d’une série, fait suite à un billet intitulé : « L’algorithme PageRank de Google: DeKeCé? » et est tiré d’une conférence sur la recherche sociale donnée le 11 avril 2011 dans le cadre du premier SEO Camp Montréal et intitulée : « Recherche sociale et Google Social Rank. Vers un nouveau Page Rank? »

Depuis l’avènement des réseaux sociaux, et des sites de microbloging en particulier, la quantité de liens de qualité créés dans les blogues et sur les sites web est en constante diminution.

Alors qu’il y a quelques années encore un contenu de qualité pouvait espérer s’attirer beaucoup de liens en provenance des blogues, ceux-ci se font de plus en plus rares. Paradoxalement, le partage de contenus n’a jamais été aussi accessible ni aussi populaire.

Pour certains, le PageRank est maintenant facilement manipulable, il a donc perdu en crédibilité et ne serait plus le meilleur indicateur de la pertinence d’une page pour le référencement internet de celle-ci dans les résultats de recherches.

Cette perte de pertinence, ainsi que l’intérêt des moteurs à présenter des résultats de recherches toujours plus personnalisés, a amené ceux-ci à s’intéresser à d’autres signaux de crédibilité et de pertinence.

Une levée de boucliers contre la piètre pertinence des résultats de recherches

Why We  Desperately Need a New (and Better) GoogleDernièrement, on a pu lire une flopée de critiques dirigée contre Google et l’envahissement de ses pages de résultats par des contenus de piètre qualité en provenance de « fermes de contenus », ces sites à valeur ajoutée minimale et qui créent des dizaines de milliers de pages de résultats simplement pour gagner quelques dollars avec la publicité affichée sur celles-ci.

High Quality Sites Algorithm A.K.A. Panda Update !

En réaction, Google lançait en février 2011 une mise à jour, baptisée Panda ou Farmer, et qualifiée par Google d’algorithme High Quality Sites Algorithm. Cette mise à jour avait pour objectif avoué de combattre et d’éliminer les pages de faibles contenus des premiers résultats des moteurs de recherches.

Crédibilité et qualité

La Spam  Clock sur le site du moteur de recherche BlekkoPour se faire, Google a été obligé de s’attarder à définir certains signaux de crédibilité et de qualité.

Critères On-Page

  • Fautes d’orthographe
  • Nombre de publicités par page
  • Ratio entre le contenu et la publicité
  • Type de domaine (.com, .gouv, etc.)

Critères Off-Page

Les confirmations des moteurs

What  Social Signals Do Google & Bing Really Count? L'article de Danny  Sullivan sur Search Engine Land.Dernièrement, soit en décembre 2010, Google et Bing confirmaient, à la demande de Danny Sullivan, l’éditeur en chef de Search Engine Land, les soupçons de plusieurs SEOs, à savoir que le « Buzz » en provenance des médias sociaux affecte le classement des résultats naturels dans Google et dans Bing.

Ce qui n’était pas clair jusqu’à l’interview de Danny Sullivan et la confirmation subséquente des moteurs, c’était la question de savoir si, oui ou non, les signaux en provenance des réseaux sociaux faisaient maintenant partie des « 200 critères » qui composent l’algorithme de Google et également s’ils font partie de la recette utilisée par Bing pour le positionnement des résultats « normaux » de recherches.

Dans cette interview donc, Danny Sullivan demande donc aux deux moteurs si les données en provenance de Twitter et Facebook sont utilisés comme signaux et s’ils affectent les résultats réguliers de recherche.

Google et Bing confirment que non seulement ils prenaient en compte ces signaux, mais aussi, comme on le soupçonnait, qu’ils essaient d’évaluer l’autorité des auteurs et la qualité des publications.

Vous trouverez dans le tableau ci-bas un résumé des confirmations des moteurs obtenues par l’interview de Danny Sullivan.

QuestionGoogleBing
Est-ce que les résultats réguliers sont affectés par les signaux sociaux?Oui, spécialement pour les nouvellesOui, les signaux sociaux transfèrent du « poids »
Est-ce que les résultats sociaux/temps réel sont affectés?Très affectésTrès affectés, l'autorité est mesurée pour déterminer le classement
Est-ce que les liens Twitter passent de la réputation?Dans certaines situations.Oui. Là aussi l'autorité est mesurée (fréquence, tweets, RT, autorité des personnes qui publient).
Est-ce que les liens Facebook sont utilisés?Les liens partagés sur les Pages sont utilisés de la même façon que les liens Twitter. Les « murs » personnels pas utilisés.Les liens « partagés avec tous » sur les profils et les Pages sont utilisés.
Est-ce que « l'autorité » des profils Twitter est prise en compte?Oui, Google calcule une Author Authority pour chaque profil.Oui, plusieurs métriques sont prises en compte pour calculer une Social Authority.
Y a-t-il une « autorité » des profils Facebook?Oui, de la même façon que pour Twitter. Applicable uniquement aux Fan pages.Non. Ils prennent en compte seulement les données Facebook accessibles publiquement.
Est-ce que « l'autorité » des profils Twitter affecte le « poids » des liens partagés?Oui. Le poids dépend de l'Author Authority, qui est indépendante du PageRankLa Social Authority affecte le poids des liens.
Est-ce que « l'autorité » des profils Facebook affecte le « poids » des liens partagés?Oui, comme Twitter. Le poids de chacun dépend de l'autorité du profil.Ils n'utilisent pas de Facebook Authority. La popularité d'un lien est obtenue en comparant les partages Twitter & Facebook.

Matt Cutts confirme également que Google utilise les données en provenance des réseaux sociaux dans son algorithme

Matt Cutts, un Googler très suivi, responsable de l’équipe Google Webspam et porte-parole officieux de Google auprès de la communauté SEO, confirmait également, sur le canal Youtube de Google Webmaster Central, que Google utilisait effectivement certains signaux en provenance des réseaux sociaux pour le classement des résultats de recherches.

Les signaux sociaux sont-ils le nouveau Graal du référencement?

L'impact des signaux sociaux est pour le moment assez limité Tout d’abord, on doit dire que tous vos efforts ne devaient pas être concentrés sur les réseaux sociaux. Le fait que les moteurs considèrent désormais les signaux en provenance des moteurs et que ceux-ci affectent les résultats de recherches ne veux pas dire que ces signaux soient soudainement devenus l’élément le plus important du classement.

En fait, au contraire, les moteurs semblent insister beaucoup sur le fait que, pour le moment, l’impact des signaux sociaux est très limité et que beaucoup de calculs sont effectués pour éliminer le Spam.

Néanmoins, les soupçons des SEOs sont maintenant confirmés et nous pouvons spéculer sur les critères utilisés par les moteurs pour évaluer le poids relatif des signaux sociaux.

Alors comment les moteurs Google et Bing évaluent-ils la pertinence des signaux sociaux?

Le  nombre de tweets & RT s sur Twitter est maintenant un signal pour  les moteurs de recherchesLes objectifs principaux des moteurs seront d’éliminer le Spam, évaluer la confiance (Trust) et le poids des liens, afin de s’assurer qu’une page est effectivement populaire, déterminer l’autorité de chaque auteur et chercher à obtenir des indices sur le sujet ou le thème d’une publication.

Ci-dessous trouverez une liste de facteurs qui sont les plus susceptibles d’affecter l’autorité et la confiance des liens de médias sociaux.

Ces facteurs ne sont pas officiellement confirmés ou reconnus comme tels par les moteurs de recherche, mais la plupart d’entre eux sont déjà utilisés par plusieurs services web et outils qui permettent d’évaluer la popularité des profils de médias sociaux, comme le Klout Score par exemple.

  • Le nombre de Followers sur Twitter
  • Le nombre de fans sur une page Facebook
  • Le nombre de tweets & RTs sur Twitter
  • Le nombre de Partages & Aime sur Facebook
  • Le ratio entre les abonnements et abonnés
  • L’autorité des gens qui vous suivent
  • L’autorité des gens qui partagent votre contenu
  • La qualité moyenne de vos messages précédemment partagés
  • Le nombre de mentions uniques / partages (similaire à la diversité des liens)
  • La source des liens que vous partagez

Outre leur influence éventuelle sur les résultats de recherches, les signaux en provenance de Twitter ou Facebook pourraient aider les moteurs à plusieurs points de vue. Par exemple pour :

  • Déterminer la « fraicheur » d’une publication. Les médias sociaux pourraient être très utiles aux moteurs pour déterminer quelles publications sont susceptibles d’activer des algorithmes de type QDF (Query Deserves Freshness) que Google a confirmé utiliser. Cet algorithme détermine quels sujets sont « hot ».
  • Savoir si une page est toujours utile/valide/mise à jour
  • Découvrir quelles sont les tendances de l’heure
  • Savoir quels termes sont liés à une publication particulière. Ils sont susceptibles d’utiliser les mots-clés et les balises de hachage qui peuvent être trouvées dans les contenus des messages partagés.
  • Déterminer le thème ou le domaine d’expertise d’un auteur. Les utilisateurs qui ont tendance à envoyer des messages de haute qualité sur un sujet particulier sont susceptibles d’être considérés comme des experts.

Les signaux sociaux peuvent-ils aider à « nettoyer » le PageRank?

Comme les moteurs de recherche prennent en compte les liens, ils doivent trouver une façon de mesurer la valeur de chaque d’un. C’est le rôle du Pagerank qui évalue la confiance, l’autorité, la réputation et de plusieurs autres paramètres qui servent à classer les pages. Nous verrons dans le prochain article si les signaux sociaux peuvent intervenir en « démocratisant » le partage et la curation des liens.

Références

Cet article est une analyse basée sur une conférence donnée le dans le cadre du premier SEO Camp Montréal et intitulée : « Recherche sociale et Google Social Rank. Vers un nouveau Page Rank? ».

— 1er billet de la série : « L’algorithme PageRank de Google: DeKeCé? »

Diapositives de la présentation
Youtube – SEO Camp Montreal 2011

email

À propos de Louis Durocher

Consultant principal et président d'Orénoque interactif, l'agence de référencement No1 de Montréal. Son expérience dans le domaine du référencement et du marketing Internet et son expertise technologique lui permettent d'offrir une approche holistique du référencement et du positionnement. +Louis Durocher

, , , , , , ,

No comments yet.

Laisser un commentaire