Comprendre les mystères de l'algorithme de Google : les secrets divulgués par la fuite de 2500 pages de documents internes
29 mai 2024

Comprendre les mystères de l’algorithme de Google : les secrets divulgués par la fuite de 2500 pages de documents internes

Par Eliott Loudon

La fuite inattendue des documents internes de Google

Une révélation étonnante a récemment été faite : une fuite massive de documents internes de Google. Cette fuite, qui comprend pas moins de 2500 pages, offre une vision éclairée du fonctionnement de l’algorithme du géant de la recherche.

Les documents, dont l’origine serait le Content API Warehouse de Google, ont été révélés par une source anonyme à Rand Fishkin, un expert reconnu dans le domaine du référencement. Il a été révélé que ces documents contiennent des informations précieuses sur des aspects du système de référencement de Google qui étaient auparavant inconnus du grand public.

Les informations révélées par la fuite de documents

Les documents fuités sont à la fois techniques et informatifs, offrant un aperçu détaillé des données collectées par Google. Ces informations nous permettent de tirer des conclusions sur les critères utilisés par Google pour le classement des sites web.

Contrairement à ce que Google a toujours affirmé, les documents suggèrent que les données de Google Chrome sont utilisées pour le classement des contenus. Rand Fishkin suggère que Google utilise probablement le nombre de clics sur les pages dans les navigateurs Chrome pour déterminer les URL les plus populaires et les plus importantes d’un site.

Les autres révélations de la fuite

Outre l’utilisation des données de Google Chrome pour le classement des sites, d’autres informations intéressantes ont été révélées. Parmi elles, l’existence de NavBoost, un outil qui utilise les données de clics pour améliorer la qualité des résultats de recherche, a été confirmée.

De plus, il a été révélé que Google utilise des filtres pour certaines requêtes sensibles, comme celles liées à la COVID ou aux élections. Pour ces requêtes, Google privilégie les sites qu’il juge fiables, comme les autorités gouvernementales ou certains sites de voyage privés.

Voici une liste non exhaustive des autres révélations importantes faites par la fuite :

  • Google identifie les auteurs de contenus.
  • Les index de liens sont classés selon trois niveaux : faible, moyen et élevé.
  • Les liens considérés comme « fiables » peuvent transmettre du PageRank.

Les implications de la fuite

Étant donné l’ampleur de la fuite, Google n’a pas encore fait de déclaration à ce sujet. Cependant, cette fuite offre un aperçu sans précédent du fonctionnement interne de l’algorithme de Google, et pourrait avoir des implications majeures pour le monde du SEO.

Les informations contenues dans ces documents pourraient aider les experts en référencement à mieux comprendre comment Google classe les sites, et à développer de nouvelles stratégies pour améliorer le classement de leurs sites. Toutefois, il est important de noter que ces informations sont encore à l’état de rumeur et n’ont pas été confirmées par Google.