Traducteurs du livre La révolution Google paru aux Éditions Eyrolles, Dov Rueff et Sébastien Blondeel nous présentent cet ouvrage et nous livrent leur point de vue sur l'avenir de la recherche Web.
Sébastien Blondeel : Je retiendrai :
Dov Rueff : En ce qui me concerne, c'est surtout le point suivant :
Larry Page s'est attaqué au Web parce qu'il voulait résoudre un problème personnel,
à savoir qui parlait de lui, en établissant un lien avec sa page sur Internet.
Le "Pagerank" que tout le monde traduit par "rang de la page" est en réalité le "rang selon Page".
Il paraît parfois de plus en plus difficile, voire impossible, aux individus de lutter à
armes égales et de terrasser de grandes sociétés.
Alors qu'en moins de dix ans une idée soit passée d'une poignée de cerveaux universitaires
à une domination quasi monopolistique mondiale, c'est pour moi une véritable ode
à l'accueil triomphal que le libéralisme fait parfois à l'innovation.
S.B. : Il en existe deux grands types, que La révolution Google évoque.
Les annuaires et systèmes reposant sur une relecture et valorisation des
documents par une équipe salariée s'opposent aux entreprises faisant le choix
d'une automatisation poussée. Cette deuxième solution, si l'on
maîtrise les algorithmes et dispose de programmeurs suffisamment nombreux,
doués et bien organisés, passe beaucoup plus facilement à l'échelle.
Dans tous les cas, c'est l'humain qui à la base qualifie
l'information. Google a su s'appuyer sur le produit du temps de travail
rendu disponible sur le Web par les milliards de pages disponibles,
et distribuer un maximum ses charges en les faisant, en quelque sorte,
réaliser par le grand public.
S.B. : C'est en effet le choix de cette entreprise. L'avantage est que cela réduit les ressources humaines nécessaires au traitement d'une masse d'informations toujours plus importante. Google procède d'ailleurs de même pour la vente des publicités : tout est géré par des programmes, ce qui lui permet de dégager des profits gigantesques à partir de transactions très modestes, qui ne seraient pas rentables si elles devaient être traitées par des commerciaux.
S.B. : Pour répondre à cette question, il est nécessaire de faire un point sur l'industrie du Web aujourd'hui.
Il y a une course incessante entre les tricheurs (qui recourent à une "optimisation pour moteurs de recherche") et les mesures de lutte contre eux : fermes de clics et autres procédés sont régulièrement contrecarrés. Le livre se fait l'écho de certains cas de figure...
Après une décennie où l'industrie du Web a montré qu'elle n'avait rien retenu
des leçons de l'Histoire (dans les années 1970, Unix s'est imposé car
il normalisait les systèmes d'exploitation, cf.
http://www.linux-france.org/article/these/lastdino/lastdino-fr.html), chaque navigateur tentant de
tirer la couverture à lui en développant des extensions et fonctionnalités
volontairement incompatibles avec la concurrence dans une dérisoire tentative
de conquérir des parts de marché, il semble que nous remontions la pente.
Les livres de design web mettent de plus en plus l'accent sur l'intérêt et les
avantages d'un respect des normes, d'une organisation structurée des contenus,
d'une séparation du fond de la forme pour une exploitation plus aisée dans
différents contextes et par des utilisateurs aux profils divers. Cette
évolution du Web devrait faciliter l'indexation des sites et la qualité
des résultats rendus par les moteurs de recherche.
Par conséquent, le 100% automatique a encore de belles années devant lui.
Qu'est-ce que l'information, en définitive ? Cela se réduit à toute donnée décrivant une chose, n'importe quoi. Réduire cette notion à un document web, c'est faire preuve d'étroitesse d'esprit. Où se trouve votre trousseau de clés et sa balise GPS ? Combien coûte un paquet de Pampers dans ce commerce de la banlieue de Miami ? L'information peut prendre la forme de photos de mariage ou d'un flux vidéo présentant un tsunami déferlant en direct sur l'océan indien. Si l'on peut tirer un enseignement des premières années de l'ascension de Google vers le sommet, c'est bien celui-là : tout ce qui présente un intérêt se doit de figurer dans son index. Que se passera-t-il quand on y retrouvera le monde entier ?(extrait de La révolution Google, page 223).
S.B. : À nouveau, Google adopte une approche très pragmatique à un problème ancien, ce qui est facilité par la jeunesse de l'entreprise, le grand contrôle qu'y conservent ses fondateurs, et les moyens financiers et humains incomparables dont elle dispose. L'intelligence artificielle progresse peu depuis plusieurs décennies ; certains pensent même qu'elle ne décollera jamais vraiment.
Prenons l'exemple de la traduction automatique. En somme, cela ne fonctionne
pas, parce que les ordinateurs ne comprennent pas ce qu'ils doivent traduire.
La solution Google : au lieu de décomposer les phrases en groupes grammaticaux et
en mots, on va tenter de retrouver des phrases voire des paragraphes proches, déjà traduits,
et reprendre l'adaptation réalisée par un être humain.
Google sait justement exploiter au maximum le travail humain publiquement disponible et accessible.
Ces données sont en grande quantité et à forte valeur ajoutée, car elles reposent au final
sur l'intelligence "naturelle".
Pour répondre à votre question, le projet à long terme de Google d'indexer tout ce qui peut
présenter un intérêt, mobilisera des ressources gigantesques en termes de mémoire
et de puissance de calcul, mais ça ne fait pas peur à Google. Il en est de même
pour la traduction automatique, projet dans lequel Google s'engage pour 10 ans
et plus.
S.B. : Pour moi, la révolution Google c'est :
Prenons l'exemple de Google Maps, cette carte du monde cliquable sur laquelle
on peut facilement naviguer. La plupart des clichés sont repris de sources
souvent publiques dans le cadre d'accords particuliers. Avant Google, personne
ne pouvait ou savait faire l'effort d'unifier ces données et ces interfaces.
Aujourd'hui, le slogan, "Don't Be Evil" (ne pas faire le mal), et l'objectif
"organize the world's information and make it universally accessible and useful"
(organiser l'immense volume d'informations disponibles dans le monde pour le
rendre universellement accessible et utile) de l'entreprise prennent tout
leur sens.
D.R. : La révolution Google, pour moi, c'est la façon dont Sarah, ma nièce de 9 ans, exprime régulièrement sa reconnaissance pour le moteur qui lui permet d'en savoir plus sur ses passions. Pour signifier son ignorance à une question, elle se tape régulièrement le front en disant : "Eh, y a pas écrit Google, ici !".
S.B. : Le livre
fait déjà quelques ouvertures sur le sujet. Le Web évoluera et s'invitera hors des ordinateurs
de bureau : mobiles, autres périphériques nomades, télévision, interconnexion
avec les petits commerces, liaisons entre ordinateurs, systèmes vidéo...
Quelques scénarios sont évoqués (cf. l'anecdote sur la poussette et celle sur la
bouteille de vin).
La recherche spécialisée dans des marchés de niche devrait elle aussi progresser, ainsi que la recherche de plus forte valeur ajoutée, capable de répondre à des questions plus pointues et industrielles. Cela fait l'objet de l'un des derniers chapitres de La révolution Google.
Google voit plus loin que le seul Web et innove de plus en plus vite et souvent, notamment avec ses outils pour développeurs permettant d'intégrer des services Google sur d'autres sites. On l'a vu récemment au Google Developer Day 2007 (http://code.google.com/events/developerday/). Cette entreprise fait aussi l'effort de rendre à la communauté ce que celle-ci lui a apporté notamment en finançant depuis plusieurs années le "Summer of Code" (http://code.google.com/soc/).
D.R. : J'aime bien la reconnaissance de formes, de visages dans les
images ou les vidéos. Cette technique qui fonctionne déjà dans certains systèmes de vidéo
sur veillance et certains dispositifs testables me paraît assez prometteuse.
Quand, en réponse à la question "Donne-moi une forme qui se rapproche de celle-ci",
on se retrouve avec différentes sortes de clés, de la clé mécanique à la clé USB, par exemple,
on perçoit les progrès à venir.
Avec des sources d'images de plus en plus nombreuses, avec les caméras branchées sur la vie réelle,
il deviendra possible de considérer les actes et les objets de la vie quotidienne comme une nouvelle
source d'informations.
Propos recueillis par Laetitia Maraninchi.