Qu’est-ce qu’hindi ?
Google a aidé, depuis 2008, l’encyclopédie collaborative en ligne Wikipédia, en participant à la traduction d’articles à destination des éditions les moins complètes. Ce sont ainsi près de 16 millions de mots qui devraient être traduits « en arabe, goujrâti, hindi, kannada, swahili, tamoul et telugu ».
L’annonce provient du blog de Google Translate. Google a mis en place une équipe de « volontaires, traducteurs et utilisateurs de Wikipédia à travers l’Inde, le Moyen-Orient et l’Afrique pour traduire plus de 16 millions de mots ».
Tout est parti d’une constatation : si l’Inde est un des pays les plus peuplés au monde, l’édition hindi de Wikipédia ne comportait que 25 000 articles environ au lancement du projet en 2008, contre 2,5 millions sur l’édition anglophone à la même période.
L’équipe mise sur pied par Google a donc cherché à contribuer à l’enrichissement des éditions les plus délaissées de Wikipédia, en traduisant à partir de l’anglais les articles les plus populaires de l’encyclopédie en ligne.
« En trois mois, nous avons combiné l’humain et les outils de traduction automatique pour traduire 600 000 mots provenant de plus de 100 articles du Wikipédia anglais ; faisant croître le Wikipédia hindi de près de 20 % », mentionne le blog de Google Translate. Le même procédé a ensuite été réutilisé avec les autres langues pour atteindre les 16 millions de mots traduits.
Google indique que l’utilisation de ses outils de traduction est d’ailleurs fréquente chez les traducteurs d’articles Wikipédia. La firme a même mis en ligne un pack d’outils dédié à cet usage…
Cette annonce intervient quelques mois après que la direction de Google ait fait un don record de 2 millions d’euros à la fondation Wikimedia. Faut-il y voir, de la part de la firme californienne, une volonté de se rapprocher à terme de Wikipédia, délaissant dans le même temps son propre projet encyclopédique en ligne, Knol ?
Source : Google Translate blog via PC INpact