woptimo

Pourquoi Google est le meilleur moteur de recherche au monde ?

Tout partait d’une question simple sur Obama :

« – Eh mais il a quel âge Obama ? Je vais regarder sur internet… Alors recherche Bing et donc, quel âge a…
– Non mais sérieusement tu utilises Bing ? Mais c’est nul, va sur Google !
– Ah oui, c’était réglé sur Bing par défaut… Mais pourquoi c’est mieux Google, au fait ?
– Euh… Ben tout le monde le sait, c’est mieux. »

Avec près de 92% de part de marché dans le monde et près de 95% en France(1), 3,3 milliards de recherches par jour pour 100 milliards par mois(2), Google est une évidence aujourd’hui.
Si lorsque l’on veut faire une recherche sur le web, le réflexe Google est bien acquis, mais lorsqu’il s’agit de savoir pourquoi Google et pas Bing, la légende urbaine est la seule réponse qu’on peut trouver.
Aujourd’hui tour d’horizon de pourquoi Google est le moteur de recherche le plus utilisé (on exclut ici les spécificités des marchés chinois et russe).

Il n’existe presque aucune alternative réelle à Google

Si on fait un tour d’horizon rapide des moteurs de recherche aujourd’hui, on remarque qu’il n’y a plus grand chose à se mettre sous le clavier. Pour le test, on a cherché sur internet la liste des moteurs de recherche, et on tombe directement sur la page Wikipedia :

Liste des moteurs de recherche généralistes

On ne prend que les multilingues, il nous reste :

  • Altavista ==> Fermé
  • Ask ==> OK
  • Bing ==> OK
  • DuckDuckGo ==> OK
  • Google ==> OK
  • Lycos ==> En mort cérébrale
  • Mozbot ==> Moteur qui utilise Google
  • Qwant ==> OK
  • Wopa! ==> Inconnu au bataillon
  • Yahoo! ==> Moteur qui utilise Bing et depuis récemment un peu Google(3)

Ce qui nous laisse seulement 4 alternatives sérieuses, en tant que vrais moteurs de recherche disposant de leur propre algorithme, en face de Google. Mais le match n’est donc pas encore plié, pourquoi parmi ces 4 acteurs aucun n’arrive à donner des résultats aussi performants que Google ?

Google investit plus que jamais en R&D pour mieux comprendre nos questions

Attention, on ne parle pas ici de la R&D version Futurama avec les voitures sans conducteur, les Google Glass et autres projets fantasmes… Rien que dans son moteur de recherche et uniquement lui, un investissement énorme est alloué pour sans cesse l’améliorer et mieux répondre à nos questions. Petit florilège de ses plus belles inventions(4) :

améliorer un moteur de recherche, une science difficile

  • 1998 : PageRank, technologie unique qui permet de donner des notes à chaque page en fonction de leur popularité (nombre et qualité des liens qui pointent vers elle)
  • 2003 : Index secondaire, range des contenus en 2 catégories, avec l’une secondaire pour des résultats moins pertinents ou très précis
  • 2005 : Recherche personnalisée, donne des résultats en fonction de l’historique de recherche
  • 2005 : Big Daddy, changement qui permet au robot de mieux comprendre des éléments techniques des sites (URL, redirections…)
  • 2009 : Caffeine, augmente la vitesse d’exploration et d’indexation des robots pour des résultats à jour plus rapidement
  • 2010 : Google intègre les signaux sociaux (likes, partages…) dans le classement des résultats pour des réponses plus précises
  • 2011 : Panda, une mise à jour de l’algorithme qui pénalise les sites aux mauvais contenu
  • 2012 : Venise, une autre mise à jour qui améliore les résultats au niveau local
  • 2012 : Penguin, une mise à jour qui, elle, pénalise le spam, comme les mauvais liens
  • 2012 : EMD update, permet des résultats de recherche plus liés au contenu qu’à l’URL
  • 2013 : Hummingbird, une mise à jour visant à mieux lier les mots d’une requête pour ouvrir un champ sémantique donné
  • 2014 : Pigeon, influence grandement les recherches locales
  • 2015 : Mobile update, permet un affichage spécifique et adapté des résultats sur terminaux mobiles
  • 2015 : RankBrain, une mise à jour qui permet l’analyse sémantique de la requête afin d’en comprendre le sens

On voit que Google a lutté sur plusieurs fronts pendant l’histoire du développement de son moteur de recherche : lutte contre les abus, combat contre la mauvaise qualité, voire la triche, glissement progressif récemment vers l’analyse sémantique et la compréhension linguistique des formulations, amélioration de son système de classement en prenant des critères plus pertinents…
Cette liste n’inclut d’ailleurs pas non plus les différentes mises à jour plus ou moins importantes de toutes les parties de l’algorithme, qui sont faites très régulièrement.

Les concurrents ont repris une partie de ces systèmes, et en ont développé d’autres, c’est indéniable, mais peu peuvent se targuer d’avoir autant de cordes à leur arc dans le développement de caractéristiques et technologies particulières. Google a un algorithme complet, sans cesse amélioré, sur tous les fronts envisageables, avec une culture de la remise en question. C’est ce qui fait probablement aujourd’hui de Google l’algorithme le plus performant au monde.

Google propose, plus qu’aucun autre, des produits facilitant la recherche

D’un côté il y a la mécanique, ce qu’il y sous le capot, le moteur, que nous venons d’aborder. Mais de l’autre il y a aussi l’habitacle, les options et le confort d’utilisation. Et là Google aussi a proposé sans cesse des produits qui permettent de mieux afficher les réponses à nos requêtes pour y répondre plus facilement et rapidement.
Tout un ensemble de fonctionnalités ont été développées au cours de son histoire, comme Google Maps, Google Flights, ou autres, afin de donner des réponses toujours plus précises et complètes. Voici l’historique des produits mis en place pour améliorer l’expérience de recherche sur Google(5 et 6) :

  • 2000 : Google Images, permet de faire des recherches spécifiquement sur les images
  • 2002 : Google Actualités, agrège les données de milliers de sources d’actualités différentes
  • 2002 : Froogle (ancêtre de Google Shopping), l’utilisateur peut faire des requêtes spécifiquement shopping pour avoir des résultats de produits e-commerce
  • 2005 : Google Maps, permet d’afficher des cartes, données de navigation, itinéraires, mais aussi circulation sur une période donnée
  • 2006 : YouTube est racheté par Google pour proposer aussi des vidéos
  • 2007 : Street View enrichit l’expérience de Google Maps et donner une vue de la rue lors de nos recherches
  • 2007 : Recherche universelle, toutes les données incluses dans les index Images, News, Shopping, Maps, etc. sont proposées directement sur la page de résultats lorsque c’est pertinent (voir exemple ci-dessus)
  • 2008 : Google Suggest est généralisé, il donne des suggestions de recherche lorsque l’on commence à taper des mots clés dans la barre de recherche
  • 2010 : Recherche instantanée, donne en temps réel les résultats au fur et à mesure que l’on tape notre requête
  • 2011 : Google Flights, agrège les données de plusieurs compagnies aériennes pour proposer des vols, itinéraires, dates, et prix
  • 2011 : Google Hotel Finder, fonction similaire aux vols mais pour les hôtels
  • 2012 : Knowledge Graph, permet d’afficher directement la réponse à la requête de l’internaute, notamment en récupérant des informations auprès d’autres sources que Google (comme Wikipedia) et en les connectant à certains champs sémantiques pour présenter des données enrichies lorsque le moteur pense qu’il s’agit d’une recherche pertinente (voir le test ci dessous pour illustration)

Et depuis, Google ne cesse d’améliorer ces services tout en proposant de nouveaux affichages, et en testant des nouvelles solutions.

Les candidats sur le banc d’essai : le test Obama

Pour compléter l’étude théorique, un petit exemple pratique sur une requête tirée dans le plus grand des hasards, quel est l’âge d’Obama ?
Nous sommes un internaute tout à fait lambda et en plus fainéant, donc nous réduisons notre requête au plus court et oublions les accents et majuscules : on tape « age d’obama ». Le moteur comprendra.
Pour précision, l’utilisateur test est situé en Espagne, son navigateur est Chrome non identifié en français, la requête est en français. Le test est fait le 12 novembre 2015.

Résultat Google

Google affiche un rich snippet sur des requêtes spécifiques

Google comprend que l’on cherche des résultats français même si je suis en Espagne, il comprend ce que l’on recherche parfaitement et nous donne un résultat très précis et des données complémentaires (sa date de naissance, un résumé de son parcours, de sa vie… c’est en fait le Knowledge Graph cité avant) et nous donne même un petit portrait photo. Il donne comme premier résultat Wikipédia pour nous proposer d’en savoir plus. Parfait. Nickel.

Résultat Bing

Une recherche spécifique mais sans données enrichies

Bing a bien compris que l’on faisait une recherche en français, par contre il n’a rien compris à la requête, c’est la débandade, nous voulons l’âge d’Obama on a le droit à deux vidéos chez le concurrent YouTube (bravo c’est du joli), parlant de son garde du corps (?) et de sa fille, puis enfin des images où on dirait que Mr President a changé de couleur de peau. Au final on ne sait toujours pas l’âge d’Obama… Bing, pour le coup, ça sonne un peu creux ici.

Résultat DuckDuckGo

Un résultat de recherche DuckDuckGo qui a mélangé les langues

Chez DuckDuckGo c’est l’affolement, le moteur n’a visiblement pas compris que l’on parlais en français, la grande majorité de nos résultats sont affichés en anglais (et même pas en espagnol), même s’il avait bien compris notre requête initiale. Par ailleurs, pas d’images et pas de données enrichies, c’est du sobre, l’affichage nous fait revenir un peu en arrière visuellement.

Résultat Ask

Un résultat de recherche o* les langues sont mélangées mais des infos sont proposées

Chez Ask rebelote, les langues se mélangent, un peu d’anglais et un peu français… La requête n’a visiblement pas été bien comprise avec par exemple le deuxième résultat sur la fille et ses animaux de ferme. Une tentative ratée de données enrichies tout en haut avec une mini bio mais qui ne répond pas à la question, et une colonne latérale d’actu qui n’a pas compris la requête. Idem qu’avant, visuellement c’est un peu du web 1.0.

Résultat Qwant

Résulltat de recherche qui affiche des images et données enrichies mais ne répond pas à la question

Chez Qwant, c’est visuellement très réussi, les images sont bien mises en avant et la présentation est très soignée. Conséquence, les résultats de recherche sont très bas et on est obligé de scroller pour y aller, pas très pratique. Qwant a bien compris que notre requête est en français mais il nous donne les données enrichies en espagnol. Premier résultat Wikipédia, logique et approprié, mais la suite est surprenante : encore le garde du corps, de l’actu, les filles d’Obama, et encore 2 vidéos chez le concurrent YouTube (re-bravo), on est assez loin du compte…

Résultat de l’étude sur l’âge d’Obama : c’est assez peu glorieux pour les concurrents de Google pour une requête pourtant simple, tandis que Google sort un sans-faute. Attention cependant, ce test n’est fait que sur une seule recherche, il est strictement empirique et n’a pas vocation à être une étude exhaustive sur la qualité des résultats de recherche. Il s’agit d’un exemple, toutefois édifiant, de la raison pour laquelle Google est le meilleur moteur de recherche au monde !

Sources :

1 : Statcounter Oct 2015
2 : Business Insider 2013
3 : Wikipedia
4 : Oncrawl 2015
5 : Google
6 : Wikipedia

Contact