Google traduit Wikipédia dans les langues manquant d'articles
S'ils ont besoin d'articles, en voila : le, la, les, un, une, des...
Google est décidément bien en train de faire son deuil de Knol, l'encyclopédie rémunérant ses contributeurs qu'elle avait lancé en 2008. Elle semble aujourd'hui se tourner entièrement vers Wikipédia.En effet, en plus d'offrir 2 millions de dollars à la fondation Wikimédia en début d'année, le géant de la recherche explique cette semaine travailler « avec des bénévoles, des traducteurs et des Wikipédiens à travers l'Inde, le Moyen-Orient et l'Afrique pour traduire plus de 16 millions de mots pour les Wikipédia en arabe, goujrâti, hindi, kannada, swahili, tamoul et telugu ». Ce sont donc les langues indiennes, africaines et l'arabe qui sont à l'honneur. En particulier l'hindi, parlé par des dizaines de millions d'internautes mais ne bénéficiant au début de ce projet que de 21 000 articles (pour 3,4 millions de mots), et qui a bénéficié de leur attention en premier lieu.
Aider les humains avec la machine
Pour aider à ces traductions, Google a commencé par utiliser ses énormes bases de données pour sélectionner les articles Wikipédia qui ont le plus de visites, et qui sont populaires dans la durée. Ils ont ensuite utilisé leur service Translator Toolkit, qui permet d'utiliser Google Translation pour établir une base, puis de coordonner les équipes de volontaires pour achever la traduction. De cette manière ils ont traduit les articles de leur liste qui n'étaient pas encore dans la version hindi : en bref, ce sont 100 articles importants, pour 600 000 mots, qui ont été traduit, augmentant donc la taille de la section hindi de l'encyclopédie de près de 20 %.
Selon Google, ils ont depuis répété l'opération pour 16 langues différentes, arrivant à un total de 16 millions de mots traduits. Mais il reste encore du travail, comme le montre ce graphique :
Il représente le nombre d'articles Wikipédia (sans inclure ceux au contenu presque inexistant) par nombre d'internautes, avec la version anglaise en base 1. Les internautes francophones ont donc 2,2 fois plus d'articles par personnes que leurs amis anglophones, bien que le nombre total d'articles en français soit moins élevé. Ceci s'explique par le fait qu'il y a désormais beaucoup moins de francophones dans le monde que de pratiquants de la langue de Mark Twain. Mais ça montre aussi que les internautes parlant allemand et français sont de bien plus grands contributeurs que ceux parlant coréen, chinois ou arabe.
En plus des efforts directs des équipes de Google Translation, les salariés de Mountain View croient savoir que les volontaires de l'encyclopédie ont utilisé leurs outils pour traduire 100 millions d'autres mots. Voilà qui a dû faire plaisir à ces supporteurs de la traduction qui déclarent : « Nous pensons que la traduction est la clé de notre mission pour rendre l'information utile à tous ».
Source :
Google Translate Blog
Jeff,
Le 16 juillet 2010 à 16:22
(18 676
lectures)
Il y a 32 commentaires
HenryBasmati
Le vendredi 16 juillet 2010 à 16:24:23
#1
Inscrit
le mardi 19 janvier 10
-
381
commentaires
A quand la traduction en wesh wesh pour l'équipe de France ?
yeti62
Le vendredi 16 juillet 2010 à 16:27:42
#2
Inscrit
le mercredi 15 juillet 09
-
7438
commentaires
pour le sous-titre... ça se voit que c'est un stagiaire qui a écrit
ano_634942305493542311
Le vendredi 16 juillet 2010 à 16:28:34
#3
Inscrit
le vendredi 13 mai 05
-
19
commentaires
A quand la traduction en wesh wesh pour l'équipe de France ?
désolé mais ils ne parlent qu'en ouin ouin
HenryBasmati
Le vendredi 16 juillet 2010 à 16:29:25
#4
Inscrit
le mardi 19 janvier 10
-
381
commentaires
Calibhaan
Le vendredi 16 juillet 2010 à 16:30:19
#5
Inscrit
le mercredi 11 mars 09
-
412
commentaires
pour le sous-titre, il faut rémunérer le courage d'avoir oser faire la vanne...
Il n'est plus possible de commenter cette actualité
Vous devez être connecté ou vous inscrire en haut pour pouvoir participer aux commentaires.














