S'identifier / Créer un compte
  • Actualités
  • Dossiers
  • Tests
  • Commentaires
  • INpactiens
Publicité

Flash Info : Fêtons la TVA à 2,1 % : abonnez-vous dès 17 € par an !

Google traduit Wikipédia dans les langues manquant d'articles

S'ils ont besoin d'articles, en voila : le, la, les, un, une, des...

Wikipédia logoGoogle est décidément bien en train de faire son deuil de Knol, l'encyclopédie rémunérant ses contributeurs qu'elle avait lancé en 2008. Elle semble aujourd'hui se tourner entièrement vers Wikipédia.

En effet, en plus d'offrir 2 millions de dollars à la fondation Wikimédia en début d'année, le géant de la recherche explique cette semaine travailler « avec des bénévoles, des traducteurs et des Wikipédiens à travers l'Inde, le Moyen-Orient et l'Afrique pour traduire plus de 16 millions de mots pour les Wikipédia en arabe, goujrâti, hindi, kannada, swahili, tamoul et telugu ». Ce sont donc les langues indiennes, africaines et l'arabe qui sont à l'honneur. En particulier l'hindi, parlé par des dizaines de millions d'internautes mais ne bénéficiant au début de ce projet que de 21 000 articles (pour 3,4 millions de mots), et qui a bénéficié de leur attention en premier lieu.

Aider les humains avec la machine

Pour aider à ces traductions, Google a commencé par utiliser ses énormes bases de données pour sélectionner les articles Wikipédia qui ont le plus de visites, et qui sont populaires dans la durée. Ils ont ensuite utilisé leur service Translator Toolkit, qui permet d'utiliser Google Translation pour établir une base, puis de coordonner les équipes de volontaires pour achever la traduction. De cette manière ils ont traduit les articles de leur liste qui n'étaient pas encore dans la version hindi : en bref, ce sont 100 articles importants, pour 600 000 mots, qui ont été traduit, augmentant donc la taille de la section hindi de l'encyclopédie de près de 20 %.

Selon Google, ils ont depuis répété l'opération pour 16 langues différentes, arrivant à un total de 16 millions de mots traduits. Mais il reste encore du travail, comme le montre ce graphique :

Wikipedia google translation


Il représente le nombre d'articles Wikipédia (sans inclure ceux au contenu presque inexistant) par nombre d'internautes, avec la version anglaise en base 1. Les internautes francophones ont donc 2,2 fois plus d'articles par personnes que leurs amis anglophones, bien que le nombre total d'articles en français soit moins élevé. Ceci s'explique par le fait qu'il y a désormais beaucoup moins de francophones dans le monde que de pratiquants de la langue de Mark Twain. Mais ça montre aussi que les internautes parlant allemand et français sont de bien plus grands contributeurs que ceux parlant coréen, chinois ou arabe.

En plus des efforts directs des équipes de Google Translation, les salariés de Mountain View croient savoir que les volontaires de l'encyclopédie ont utilisé leurs outils pour traduire 100 millions d'autres mots. Voilà qui a dû faire plaisir à ces supporteurs de la traduction qui déclarent : « Nous pensons que la traduction est la clé de notre mission pour rendre l'information utile à tous ».
Publiée le 16/07/2010 à 16:22

Soutenez l'indépendance de Next INpact en devenant Premium

  • Tout le contenu de Next INpact sans pub
  • Et bien plus encore...

Il y a 32 commentaires

Avatar de HenryBasmati INpactien
HenryBasmati Le vendredi 16 juillet 2010 à 16:24:23
Inscrit le mardi 19 janvier 10 - 439 commentaires
A quand la traduction en wesh wesh pour l'équipe de France ?
Avatar de yeti62 INpactien
yeti62 Le vendredi 16 juillet 2010 à 16:27:42
Inscrit le mercredi 15 juillet 09 - 7438 commentaires
deux.gif pour le sous-titre...

ça se voit que c'est un stagiaire qui a écrit
Avatar de ano_634942305493542311 INpactien
ano_634942305493542311 Le vendredi 16 juillet 2010 à 16:28:34
Inscrit le vendredi 13 mai 05 - 19 commentaires
A quand la traduction en wesh wesh pour l'équipe de France ?


désolé mais ils ne parlent qu'en ouin ouin
Avatar de HenryBasmati INpactien
HenryBasmati Le vendredi 16 juillet 2010 à 16:29:25
Inscrit le mardi 19 janvier 10 - 439 commentaires

désolé mais ils ne parlent qu'en ouin ouin

Avatar de Calibhaan INpactien
Calibhaan Le vendredi 16 juillet 2010 à 16:30:19
Inscrit le mercredi 11 mars 09 - 412 commentaires
quatre.gif pour le sous-titre, il faut rémunérer le courage d'avoir oser faire la vanne...

Il y a 32 commentaires

;