De l’idée à sa commercialisation

 

 

  Numéro10
Décembre2008
ENGLISH
Événements à venir

Mission commerciale de l'industrie canadienne de la langue au Chili
Du 19 au 23 janvier 2009

OCCASION DE PÉNÉTRER UN MARCHÉ DYNAMIQUE

Ne ratez pas cette excellente occasion de conquérir un nouveau marché! Compte tenu du besoin d'élargissement de sa capacité linguistique, le Chili est à la recherche de fournisseurs, de partenaires et d'investisseurs de l'industrie canadienne de la langue. Dans le but de répondre à ces besoins, le Canada organise une petite mission ciblée qui vise à :

  • appuyer les écoles canadiennes à se préparer en vue d'un débouché d'une valeur de 7,5 millions de dollars en 2009;
  • établir des liens afin de permettre aux étudiants chiliens d'étudier au Canada;
  • aider les entreprises canadiennes spécialisées dans la technologie qui cherchent à profiter d'un soutien financier et de l'infrastructure actuelle au Chili afin d'accroître leur clientèle et de percer dans un nouveau marché;
  • préparer le terrain pour que les cabinets de traduction puissent améliorer leur accès aux ressources et examiner les débouchés.

Pour plus de renseignements, y compris les coûts et le programme, cliquez ici ou communiquer avec Gonzalo Peralta à l'adresse gperalta@ailia.ca.


Conférence « Le Monde de la Traduction – Traduction et priorités mondiales »
Du 11 au 13 mai 2009

Endroit : À déterminer – Toronto, Ontario

« Le monde de la traduction » est une conférence internationale sur l'art et la science de la traduction, de l'interprétation et des technologies connexes.

DEMANDE DE COMMUNICATIONS – Ateliers post-conférence : 13 mai

Conférence interactive axée sur l'apprentissage et le partage, Le Monde de la traduction réunit d'importants intervenants sur la scène internationale qui œuvrent dans le domaine de la traduction. Des représentants du gouvernement et de l'industrie, des éducateurs et des chercheurs se rassemblent dans le but de mettre en commun l'information et de se pencher sur les enjeux les plus pertinents dans le monde de la traduction et de la traduction dans le monde, ainsi que les questions liées à l'interprétation.

À ce titre, cette conférence suscitera l'intérêt tant des particuliers que des organisations, chargés de l'offre et de la demande. La conférence a pour thème « Traduction et priorités mondiales ». Le Comité du programme accepte actuellement des propositions de communications pour Le Monde de la traduction 2009, conférence qui aura lieu du 11 au 13 mai, à Toronto, en Ontario, au Canada. Des communications théoriques peuvent aussi être présentées en vue de révision.

Pour de plus amples renseignements, consulter le lien www.translationworld.com


  TAMA, un colloque qui a répondu aux attentes des participants  
 
 

L'Université du Québec en Outaouais accueillait les 9 et 10 octobre le colloque TAMA 2008. TAMA signifie Terminology in Advanced Management Applications (la terminologie dans les applications avancées de gestion, AAG).

148 participants provenant de 20 pays ont pris part à ce colloque. Selon monsieur Gabriel Huard directeur, Normalisation terminologique, Bureau de la traduction Travaux publics et Services gouvernementaux Canada, « Ce colloque a répondu aux attentes des participants tant pour la qualité des locaux, les conférences ainsi que l'accueil et les services de l'UQO ».

TAMA est une conférence régulière organisée par TermNet (Réseau international de terminologie) permettant aux acteurs internationaux œuvrant en terminologie de se réunir. D'ailleurs, mesdames Frieda Steurs et Gabriele Sauberer respectivement présidente et secrétaire exécutive de TermNet ont prononcé des allocutions en ouverture de ce colloque.

Le recteur de l'UQO, monsieur Jean Vaillancourt a quant à lui mis en lumière le rôle de chef de file de l'Université en matière de recherche dans ce domaine.

TAMA est un évènement international de grande renommée, qui rassemble les représentants d'institutions, d'organismes et d'entreprises venant de partout au monde.

Les participants à TAMA identifient et discutent des tendances mondiales, ainsi que de nouvelles technologies dans le vaste domaine de la terminologie appliquée.

TAMA est reconnu comme une conférence axée sur les entreprises, où l'on porte une attention particulière au développement des systèmes, aux méthodes et aux services liés à la gestion terminologique dans les industries du contenu et de la langue.

Un autre rendez-vous a eu lieu; La foire de l'industrie canadienne de la langue, le 17 novembre. Pour accéder au site Internet de l'événement, cliquez sur le lien suivant :

http://ailia.4poyntzdezign.com/content.php?sec=4

 

 
  L'Actualité langagière célèbre son 40e anniversaire!  
 
 

La revue professionnelle du Bureau de la traduction, L'Actualité langagière, fête ses 40 ans cette année! L'Actualité terminologique, comme on l'appelait à l'origine, publiait en effet son premier numéro en janvier 1968 : c'est presque un record de longévité pour un périodique de nature linguistique.

L'Actualité langagière paraît quatre fois par année. Cette revue de prestige est, avec TERMIUM®, un des outils de normalisation terminologique en usage à la fonction publique. Elle nous donne des nouvelles de l'industrie langagière, et elle comporte un volet éminemment pratique qui traite des difficultés auxquelles sont confrontés jour après jour les langagiers, les communicateurs et les non-spécialistes. Tous les amoureux de la langue y trouvent leur compte!

Depuis mars 2008, le Bureau de la traduction diffuse gratuitement L'Actualité langagière sur son site Web.

Lisez le numéro spécial des 40 ans de L'Actualité langagière; vous y apprendrez la petite histoire de la revue et verrez se dissiper vos doutes sur des questions de langue épineuses!

 

 
  MT Summit XII à Ottawa du 26 au 30 août 2009!!!  
 
 

La prochaine édition de la conférence internationale MT Summit, conférence qui est organisée tous les deux ans conjointement par l'IAMT (International Association for Machine Translation) et l'AMTA (Association for Machine Translation in the Americas) aura lieu du 26 au 30 août 2009 au Château Laurier d'Ottawa (Ontario). La dernière édition, MT Summit XI, avait eu lieu à Copenhague (Danemark) en septembre 2007.

MT Summit XII rassemblera les chercheurs, développeurs et utilisateurs de la traduction automatique et d'autres outils de traitement multilingue. La conférence permettra de faire le point sur l'avancée des technologies et de leur usage en traduction automatique, et ce, sur la scène internationale. La conférence comprendra :

  • un programme « recherche » élaboré;
  • des programmes concernant les utilisateurs gouvernementaux et commerciaux;
  • des séances spécialisées sur la technologie et son rôle en tant qu'outil de traduction ainsi que dans la formation des traducteurs;
  • une exposition de technologies incluant des démonstrations en temps réel de systèmes de traduction automatique ou intégrant la traduction automatique.

La journée du 26 août sera consacrée à des tutoriels, la journée du 30 août se focalisera sur des ateliers spécialisés, alors que les séries de présentations auront lieu les 27-28-29 août. Ces activités très diverses permettront aux participants, qu'ils soient du monde de la recherche, des affaires ou gouvernemental, d'interagir et d'évaluer l'usage qui peut être fait des technologies de traduction automatique pour vaincre la barrière des langues et mettre à profit l'environnement numérique.

Nous venons d'apprendre que NIST (National Institute of Standards and Technology, U.S.A.) s'est engagé à organiser leur atelier d'évaluation « OpenMT » en connexion avec MT Summit XII, juste après le sommet, les 31 août et 1er septembre. Ceci est un atelier international sur invitation seulement et qui pourrait rassembler 125 spécialistes de la traduction automatique; son objectif est de soutenir l'avancée des technologies de pointe de traduction de textes entre différentes langues, avec pour résultat la production de sorties machine qui sont des traductions à la fois fidèles et fluides de l'original.

L'appel à présentations scientifiques est maintenant lancé : les soumissions sont dues pour la fin avril 2009. Le comité du programme « recherche » de MT Summit XII est dirigé par Pierre Isabelle et co-dirigé par Roland Kuhn, tous deux du Groupe de technologies langagières interactives du CNRC et bien connus de la communauté de traduction automatique. Pour plus d'information, voir le site Web de la conférence : http://summitxii.amtaweb.org/ (en anglais seulement).

Des appels séparés seront faits dans les semaines à venir concernant les présentations et études de cas commerciales et gouvernementales, ainsi que les propositions d'ateliers et de tutoriels.

 

 
  Nouveaux résultats emballants en traduction automatique statistique et hybride  
 
 

Le 14 mai dernier, Pierre Isabelle, Chef de groupe du GTLI de l'ITI-CNRC, a présenté à l'Université du Québec en Outaouais les derniers résultats obtenus dans l'application de la traduction automatique, des résultats qui s'avèrent être extrêmement encourageants quant à la qualité des traductions produites. La séance a été un franc succès vu qu'elle a attiré plus d'une cinquantaine de personnes des secteurs public et privé, dont certaines venaient de l'extérieur du Québec.

Après une revue de l'évolution de la traduction automatique (TA), de l'approche à base de règles (TABR) aux approches statistiques plus récentes basées sur l'apprentissage machine, Pierre Isabelle a donné quelques détails concernant le système de traduction automatique statistique (TAS) du CNRC – PORTAGE – afin de permettre à l'auditoire de se mettre à jour sur le contexte actuel de la TA. Il a ensuite présenté les résultats obtenus grâce à l'approche dite de « Post-Edition Statistique » dans laquelle un système de TAS apprend à effectuer une post-édition automatique des résultats d'un système de TABR. L'apprentissage se fait par le biais d'un corpus « bilingue » (en fait dans une même langue !) composé, d'une part, de sorties machine brutes du système de TABR et, d'autre part, soit de post-éditions manuelles de ces sorties soit de traductions humaines produites de manière indépendante. Les expériences impliquant la première approche ont été menées avec Guichet emplois (Service Canada), alors que des expériences utilisant la seconde approche ont été menées avec la compagnie SYSTRAN, bien connue dans le monde de la traduction automatique. Dans ce dernier cas, il a été possible de mesurer le système hybride SYSTRAN-PORTAGE à ses compétiteurs grâce à des évaluations humaines des traductions obtenues : la combinaison SYSTRAN-PORTAGE a été jugée la meilleure et la seconde en qualité, respectivement, dans les deux compétitions auxquelles le système a participé, montrant ainsi que les systèmes hybrides de TA ont une performance très intéressante quant à la qualité des traductions obtenues.

 

  Une nouvelle référence sur la traduction automatique statistique  
 
 

Une collaboration entre deux chercheurs du Centre de recherche européen de Xerox (XRCE) à Grenoble (France) – Nicola Cancedda et Marc Dymetman – et deux chercheurs du Groupe de technologies langagières interactives du CNRC à Gatineau (QC, Canada) – Cyril Goutte et George Foster – a mené à la publication d'un nouveau livre qui fera référence en traduction automatique statistique et auquel ont contribué de nombreux spécialistes.

Ce livre, intitulé « Learning Machine Translation » et publié par MIT Press, fait le point sur l'apport des techniques d'apprentissage machine au domaine de la traduction automatique statistique. Pour plus de détails, voir : http://mitpress.mit.edu/catalog/item/default.asp?ttype=2&tid=11753 (en anglais seulement).

 

  Nouvelles du projet européen SMART : PORTAGEpartagé et Trados intégrés pour des essais de traduction automatique adaptative  
 
 

L'équipe du projet européen SMART (Statistical Multilingual Analysis for Retrieval and Translation), http://www.smart-project.eu/node/1 (en anglais seulement) est en voie de réaliser un pas important dans son programme de travail lors d'essais intégrant la traduction automatique statistique (TAS); dans ce cas-ci, le système PORTAGEpartagé du CNRC) à un environnement de mémoire de traduction (Trados de SDL International). Les méthodes de la TAS permettent en principe d'utiliser la rétroaction fournie par les traducteurs lorsqu'ils effectuent une post-édition des sorties machine. Toutefois, on n'avait encore réussi à produire des systèmes capables de prendre en compte cette rétroaction « à la volée », de manière immédiate : la rétroaction ne devenait effective qu'après avoir procédé à un ré-entraînement « hors-ligne » du système. Les méthodes testées par les chercheurs du projet SMART visent à produire des systèmes dotés d'une vraie capacité d'apprentissage à la volée et les essais en cours ont pour but de tester ce nouveau concept à l'intérieur d'un environnement plus large de soutien à la traduction.

 

  TerminoWeb 2.0  
 
 

Depuis la mise en ligne du prototype de TerminoWeb 1.0 en décembre 2006, les recherches et travaux reliés à la terminologie computationnelle se sont poursuivis au Groupe de technologies langagières interactives du CNRC et avec ses collaborateurs, mettant à profit la souplesse offerte par cette plateforme de recherche. En particulier :

  • plus de 30 usagers et groupes d'usagers ont accédé à TerminoWeb 1.0 : terminologues, traducteurs, chercheurs en terminologie, chercheurs en linguistique, et autres;
  • des tests structurés ont été effectués par trois terminologues de la Direction de la Normalisation terminologique du Bureau de la Traduction du Canada;
  • TerminoWeb a été utilisé par les chercheurs de l'Observatoire linguistique sens-texte (OLST) de l'Université de Montréal dans le cadre du projet SACOT (Semi-automatic Construction of Ontologies from Texts) de R-D Défense Canada (Valcartier, QC);
  • TerminoWeb a été mis en pratique dans des séminaires aux études supérieures dédiés à l'enseignement de la terminologie et terminotique dans plusieurs universités : Université d'Ottawa, Université du Québec en Outaouais et Glendon College (affilié à l'Université York à Toronto);
  • un tutoriel sur TerminoWeb est en développement à l'Université d'Ottawa pour être inclus dans le cadre de leur initiative CERTT (Collection électronique de ressources en technologies de la traduction : (http://aix1.uottawa.ca/~certt/CERTT-main-FR.htm) dont le but est de donner accès à diverses technologies, tutoriels et exercices pour l'enseignement, mais aussi de s'adresser plus largement aux traducteurs, terminologues, écrivains et autres professionnels de la langue dont le besoin en outils de soutien est grandissant.

Caroline Barrière complète actuellement la préparation de la version 2.0 de TerminoWeb, dont la mise en ligne est prévue pour la fin 2008. Cette nouvelle version de TerminoWeb comportera des améliorations importantes, telles que :

  • la construction et l'analyse de corpus de textes en français (seul l'anglais était couvert jusqu'à présent);
  • l'exploration de la liste de termes d'intérêt de façon plus ciblée en relation aux termes déjà sélectionnés;
  • la définition d'ensembles de relations sémantiques, afin de mieux servir les besoins de divers types d'analyse (par ex., un usager pourrait définir un ensemble « relations médicales », comprenant plusieurs relations sémantiques spécifiques à ce domaine);
  • la construction de corpus pertinents à un ensemble de termes (plutôt qu'à un domaine spécifique);
  • la possibilité de faire des recherches plus flexibles dans les textes du corpus, par ex. en utilisant comme patron linguistique « est aussi % appelé » qui identifiera toute phrase contenant « est aussi communément appelé » mais aussi « est aussi parfois appelé ».

Voir le site Web du prototype TerminoWeb : http://termino.iit.nrc.ca/termino_f.html

 

  Le logiciel d'alignement de mots PORTalign disponible sous licence  
 
 

Le Groupe de technologies langagières interactives du CNRC poursuit depuis 2004 son projet majeur en traduction automatique statistique (TAS) : le projet PORTAGE, dont l'expertise est maintenant reconnue internationalement. Une des opérations préliminaires du système PORTAGE sur un corpus bilingue dont les phrases sont alignées est d'effectuer des alignements plus détaillés, soit au niveau des segments de phrases et des mots eux-mêmes. Ce travail d'alignement de mots peut maintenant être effectué séparément grâce au logiciel PORTalign, offert par le CNRC sous licence commerciale.

L'alignement de mots, bien que développé pour la TAS, ouvre la porte à des applications potentielles en dehors de la TAS elle-même, par exemple en terminologie multilingue et dans l'amélioration des fonctionnalités des outils de mémoires de traduction. Le logiciel PORTalign permet d'explorer et d'implanter de telles applications indépendamment de l'implantation de la TAS.

Pour toute information, vous adresser à : Michel.Mellinger@cnrc-nrc.gc.ca

 

 
 

Le CRTL remercie les lecteurs du Cybermag-TL de leur intérêt et de leur participation à sa diffusion. Ce magazine d'information en ligne affiché dans le site Web du CRTL vise à tenir les partenaires et les acteurs de l'industrie de la langue et des technologies de l'information au courant des dernières nouvelles. Continuez à le faire connaître autour de vous, et communiquez-nous vos réactions, suggestions et commentaires!

Centre de recherche en technologies langagières
283, boul. Alexandre-Taché
Case postale 1250, succursale Hull
Gatineau (Québec)
J8X 3X7
Tél. : (819) 595-3999
info@crtl.ca

   
   
     

 

Aller au site
Haut de page
 
     
 
Abonnement
Désabonnement Envoyer à un ami