Des comptes étranges chez Google ? (suite et fin ?)
Jean Veronis, bloggeu et professeur de linguistique et d'informatique à la ...
Jean Veronis, bloggeu et professeur de linguistique et d'informatique à la faculté d’Aix-Marseille 2, vient de nous contacter suite à notre actualité qui présentait son article sur les « comptes étranges » chez Google. Il a tenu à nos apporter ces précisions :
« Depuis la date de publication », souligne-t-il, « j'ai affiné la recherche [sur les comptes Google], et je peux donner des chiffres plus précis. Il ressort de l'étude mathématique que nous menons ici à l'université que l'index véritable de Google n'est très probablement que de 60% de la taille annoncée (soit environ 5 milliards de pages). En conséquence, les nombres de résultats affichés semblent surestimés de 66% ».
Les détails supplémentaires de ces recherches fournissent une explication au mystère des comptes relevé il y a quelques jours. Ses travaux méritent plus qu’un simple coup d’œil : « selon toute probabilité, les ingénieurs Google ont oublié de connecter la routine d'extrapolation à la sortie du module de requêtes booléennes ! En conclusion, si vous voulez connaître le vrai compte des mots dans l'index Google, tapez-les deux fois :
- Chirac 3 570 000
- Chirac Chirac 2 170 000
« La deuxième ligne fournit probablement le vrai compte... »
Un gros bogue dans les résultats de chez Google ? Pour lire cette nouvelle étude, tout aussi passionnante, rendez-vous sur cette page.
« Depuis la date de publication », souligne-t-il, « j'ai affiné la recherche [sur les comptes Google], et je peux donner des chiffres plus précis. Il ressort de l'étude mathématique que nous menons ici à l'université que l'index véritable de Google n'est très probablement que de 60% de la taille annoncée (soit environ 5 milliards de pages). En conséquence, les nombres de résultats affichés semblent surestimés de 66% ».
Les détails supplémentaires de ces recherches fournissent une explication au mystère des comptes relevé il y a quelques jours. Ses travaux méritent plus qu’un simple coup d’œil : « selon toute probabilité, les ingénieurs Google ont oublié de connecter la routine d'extrapolation à la sortie du module de requêtes booléennes ! En conclusion, si vous voulez connaître le vrai compte des mots dans l'index Google, tapez-les deux fois :
- Chirac 3 570 000
- Chirac Chirac 2 170 000
« La deuxième ligne fournit probablement le vrai compte... »
Un gros bogue dans les résultats de chez Google ? Pour lire cette nouvelle étude, tout aussi passionnante, rendez-vous sur cette page.
Marc Rees
le 14 février 2005 à 09:31
(4 510
lectures)
Actualités et brèves relatives
- 11 / 02 / 2005 : Un geste sympathique de Google ?
- 06 / 02 / 2005 : Explosion des invitations Google Gmail
- 03 / 02 / 2005 : Des comptes étranges chez Google ?
- 19 / 12 / 2004 : Google Suggest arrive doucement, mais sûrement
- 07 / 10 / 2004 : Google dément vouloir créer son propre navigateur
- 03 / 07 / 2004 : Vente et échange des comptes Gmail : Google se fâche
- 18 / 03 / 2004 : Quand Google passe dans votre quartier
- 08 / 09 / 2003 : A propos de Google et de ses résultats
- 16 / 08 / 2002 : Google Toolbar : Problème de sécurité






