Google veut jouer la transparence sur sa Search Quality
PageRank, la classification qu'on aime détester
Google est la référence des moteurs de recherche, que les concurrents le veuillent ou non. La société californienne a réussi l’un de ces exploits qui modifient le langage courant, au point que les utilisateurs ne parlent plus de chercher sur Internet, mais de chercher sur Google. Au centre de cette activité de recherche se trouvent les algorithmes qui ont la lourde charge de récupérer les mots clés et de chercher parmi les milliards de pages recensées et indexées pour trouver aussi vite que possible les résultats les plus probants. C’est le cœur de l’activité de Google, un service nommé Search Quality chargé de gérer tout ce qui concerne les recherches, et plus particulièrement le système PageRank.
Ce dernier cache jalousement ses rouages internes, et Google vient d’ailleurs de lui dédier un article sur son blog officiel. Bien que cela paraisse surprenant, la firme indique qu’il est nécessaire de maintenir un équilibre entre la sécurité par l’obscurité et la nécessité de partager certaines informations avec les développeurs. Ce type de sécurité est, selon Google, loin d’être la panacée (et n’est pas le seul mécanisme mis en jeu dans la société), mais il est nécessaire pour éviter deux problèmes majeurs :
- Concurrence : il est dangereux pour Google de révéler ses secrets de fabrication
- Abus : la moindre information filtrant sur le système PageRank permet aux développeurs web de modifier le code des pages pour obtenir artificiellement de meilleurs résultats lors des recherches. Cette « optimisation Google » change non seulement l’écosystème du web, mais fait de Google non plus une société tierce fournissant une information, mais un référentiel détourné de sa fonction première.
Ces vérifications sont très courantes. Google indique qu’il y a un test automatique chaque minute pour contrôler le bon fonctionnement de l’ensemble. D’autres, plus espacées, contrôlent la qualité générale avec des vérifications plus approfondies. Enfin, chaque algorithme subit des tests indépendants pour en vérifier la validité et l’efficacité.
Le caractère international des recherches est l’une des clés du succès de Google, mais elle est un défi, avec la prise en charge obligatoire d’un maximum de langues, y compris celles qui sont sous la barre des dix millions de personnes l’utilisant, comme l’azerbaïdjanais, parlé par huit millions de personnes.
Bien sûr, à côté de l’activité principale sur la recherche, d’autres équipes existent pour s’occuper par exemple des interfaces, des différents produits logiciels tels que Google Earth ou encore des services comme Gmail. Par exemple, l’équipe en charge des interfaces est aidée par une équipe d’experts en utilisation et en facilité d’utilisation. Leur travail les envoie ainsi voyager dans le monde entier pour rencontrer des utilisateurs et les observer dans leur quotidien.
Google ne révèlera bien sûr jamais ses secrets de fabrication, mais la société souhaite partager de temps en temps certaines informations, comme celles contenues dans le dernier billet du blog officiel. Elle précise en outre qu’elle reviendra plus régulièrement sur ce genre d’initiative dans le futur.
Source :
Google
Vincent Hermann
Rédacteur/journaliste spécialisé dans le logiciel et en particulier les systèmes d'exploitation. Ne se déplace jamais sans son épée.
Le 22 mai 2008 à 10:42
(15 734
lectures)
Il y a 13 commentaires
Faut voir... c'est un peu le blog qui la pour dire qu'on ne va pas dire grand chose non ? (C'est un peu long l'article en anglais, pas trop le temps de le lire là).
A voir si ce sont de réelles infos intéressantes techniquement ou si c'est juste pour casser leur image de big brother qui sait/fait tout dans l'ombre.
Le caractère international des recherches est l’une des clés du succès de Google, mais elle est un défi, avec la prise en charge obligatoire d’un maximum de langues, y compris celles qui sont sous la barre des dix millions de personnes l’utilisant, comme l’azerbaïdjanais, parlé par huit millions de personnes.
on trouve même du contenu en luxo
Pourtant on doit pas être plus d'un demi-million à le parler... Malgré ça je pense que le nombre d'Azebaïdjanais en ligne doit pas être énorme là...
Par contre c'est vrai que google.lu est en Français et en Allemand "seulement"... On peut pas leur faire de reproches c'est deux des langues officielles du pays, ça suffit ;)
Pagerank était une vrai évolution/révolution à sa sortie.
Désormais, le temps a passé sous les ponts, et il serais temps de passer à quelque chose de techniquement plus évolué.
Certes ils sont encore les seuls sur le marché à utiliser un algorithme de ce type, mais il n'est pas incassable, c'est juste que personne ne cherche vraiment à le reproduire.
On en a un qui marche, pourquoi en faire un deuxième ?
Et je trouve que technologiquement parlant, même si Pagerank a évolué c'est certain, il reste sensiblement le même qu'a ses débuts. La même idée, le même concept, et les plus ou moins les mêmes performances.
Alors c'est le moment selon moi d'enfoncer des portes, et de passer à de nouvelles méthodes de recherches, via << langage naturel >> ou autres.
Pagerank est efficace, mais il faut faire plusieurs recherches, plusieurs essai, consulter plusieurs pages de résultats avant d'avoir un résultat cohérent. Et ce n'a pas changé depuis le début ou presque.
Désormais, le temps a passé sous les ponts, et il serais temps de passer à quelque chose de techniquement plus évolué.
Certes ils sont encore les seuls sur le marché à utiliser un algorithme de ce type, mais il n'est pas incassable, c'est juste que personne ne cherche vraiment à le reproduire.
On en a un qui marche, pourquoi en faire un deuxième ?
Et je trouve que technologiquement parlant, même si Pagerank a évolué c'est certain, il reste sensiblement le même qu'a ses débuts. La même idée, le même concept, et les plus ou moins les mêmes performances.
Alors c'est le moment selon moi d'enfoncer des portes, et de passer à de nouvelles méthodes de recherches, via << langage naturel >> ou autres.
Pagerank est efficace, mais il faut faire plusieurs recherches, plusieurs essai, consulter plusieurs pages de résultats avant d'avoir un résultat cohérent. Et ce n'a pas changé depuis le début ou presque.
je ne sais pas pourquoi, mais quelques chose me dit que google prépare le remplaçant de pagerank, puisqu'il est vrai que trop dévoilé, ça va insiter à la modification des pages web pour que le pagerank augmente
google n'avait pas annoncé la semaine dernière de mettre beaucoup d'effort justement sur le language naturel ???
google n'avait pas annoncé la semaine dernière de mettre beaucoup d'effort justement sur le language naturel ???
Il n'est plus possible de commenter cette actualité
Vous devez être connecté ou vous inscrire en haut pour pouvoir participer aux commentaires.













