Menu
Libération

Google bientôt en mode questions/réponses

Le moteur de recherche va intégrer prochainement un algorithme qui permettra de répondre directement aux questions que se posent les internautes.
par Camille Gévaudan
publié le 15 mars 2012 à 19h04

Google se construit une gigantesque base de données, révélait hier le Wall Street Journal . Enfin, une nouvelle base de données. Celle-ci ne recenserait pas les informations personnelles de milliards d'internautes, ni des trilliards de sites web, ni des heures de vidéos sur YouTube, ni des kilomètres de cartes sur Google Maps, ni... Bref, une autre. Qui serait alimentée en secret, depuis deux ans, par les «entités» numériques -- «personnes, lieux, objets» -- que les internautes soumettent au moteur de recherche le plus utilisé au monde.

En enregistrant et en recoupant les historiques de recherche, Google apprendrait ainsi à «associer des mots différents par leur graphie mais liés par leur sens, tels que le nom d'une entreprise (Google) et celui de ses fondateurs (Larry Page and Sergey Brin).» Simplement parce qu'une proportion non négligeable d'internautes cherchent ces termes simultanément, dans la même requête sur Google.com. Le moteur de recherche peut également observer que dans les pages web qu'il recense, les phrases contenant ces trois mots (Google / Larry Page / Sergey Brin) en comptent souvent un quatrième : «fondateurs». Il devient alors capable de comprendre le lien qui les unit, et quand on lui demandera «fondateurs Google», il pourra répondre directement «Larry Page et Sergey Brin». C'est ce qu'on appelle la recherche sémantique.

«Quel jour est l'anniversaire de Lady Gaga ?» demande la requête. «Le 28 mars 1986», répond Google.

Cette fonctionnalité de «réponses directes» est déjà activée sur Google dans quelques domaines très particuliers, comme les opérations mathématiques, la météo, les résultats sportifs et même les séances de cinéma. En-dessous, les liens vers les pages web s'affichent comme d'habitude.

«Mais les changements à venir devraient aller beaucoup plus loin» , prédit le Wall Street Journal . Grâce aux compétences de la start-up Metaweb Technologies, que Google a rachetée en 2010, le moteur de recherche devrait être capable de reconnaître correctement 200 millions d'entités parmi celles tapées par les internautes. Ce qui reste peu à l'échelle de Google, qui traite plus d'un milliard de requêtes par jour. Mais c'est un début.

Selon les «experts en recherche sémantique» interrogés par le journal américain, une telle évolution pourrait aider à distancier un éventuel futur moteur de recherche de Facebook, si le réseau social avait soudain l'idée d'en développer un. Il pourrait également s'agir de concurrencer Siri, l'assistant vocal d'Apple installé sur les iPhone 4S, capable de comprendre une poignée d'ordres simples comme «Cherche l'adresse du Palais de Tokyo» ou «Réveille-moi demain à 5h45».

Danny Sullivan, l'expert en moteurs de recherche et célèbre blogueur de SearchEngineLand , ne voit au contraire aucune raison de s'affoler : «Google fait de la recherche sémantique depuis 2003, c'est-à-dire l'année où il a commencé à proposer des synonymes pour les termes que l'on tape dans le champ de recherche. Il a affiné sa compréhension des mots au fil des ans et l'a même expliqué dans un billet de blog très détaillé en 2010. Quant à ces "réponses rapides et directes" de Google qui excitent le Wall Street Journal, elles existent depuis si longtemps que je n'arrive même plus à me souvenir exactement de la date.»

Les réponses directes étaient même l'une des spécialistés de Google Squared, une fonctionnalité expérimentale des ingénieurs en recherche chez Google que l'on pouvait activer dans la section «Labs» de son compte Google. Google Squared a cessé de fonctionner en août 2011 , sans doute pour mieux préparer l'arrivée d'un outil similaire à grande échelle dans les prochains mois. Quant à Bing, le moteur de recherche de Microsoft, il s'est déjà lancé dans la même aventure depuis longtemps (dans sa version anglophone surtout).

«Google est en évolution perpétuelle , rappelle Techcrunch . Les algorithmes qui servent à référencer et classer les pages web sont constamment modifiés. Parfois, plusieurs de ces modifications prennent effet simultanément» , et Google choisit alors de les regrouper sous un nom censé officialiser une nouvelle version de son moteur de recherche, comme ce fut le cas par exemple pour Google Panda et Google Search plus your world . Selon toute vraisemblance, c'est également ce qui arrivera pour cette fameuse recherche sémantique. Pas une révolution, mais une énième évolution.

Lire les réactions à cet article.

Pour aller plus loin :

Dans la même rubrique