Recherches et Mémoires de fin d études tagged with Le décodage

Exemple des traductions évaluées - Techniques de décodage

6.5 Exemple des traductions évaluées  1) REFERENCE : nous avons vu des résultats . DP : we have seen the results . Greedy+: we have seen some results . Greedy : we have seen the results . Tous les évaluateurs choisissent la traduction de greedy+. 2) REFERENCE : il faut faire en sorte de modifier cette perception . Greedy : we must make the kind of change that perception . DP : there must be the kind of change that perception . Greedy+: we must be the kind of change that perception . Dans cet exemple, les évaluateurs ont plusieurs choix. (un ne trouve aucune traduction acceptable, un autre préfère celle de greedy+ , un choisi DP et d’autre greedy.) 3) REFERENCE : les températures [...]




Décodage, l’algorithme DP : principe, description et filtrage

Décodage – Chapitre 5 : Nous avons abordé dans les sections précédentes le problème de l’entraînement des modèles. Nous nous concentrons dans ce chapitre sur le troisième problème de la traduction statistique « le décodage ». Nous expérimentons, ici des décodeurs traduisant du français vers l’anglais, bien qu’en principe, les modèles utilisés sont indépendants de la paire de langues. Dans la traduction automatique probabiliste, le but d’un décodeur est de chercher la phrase anglaise eI=e1…eI la plus probable étant donnée une phrase source française fJ=f1,…,fJ et des modèles (modèle de langue et modèle de traduction) où I et ei i[1,I] sont des inconnus (figure 18). Figure 18: L’architecture de la traduction probabiliste [Nießen et al. 1998]. Chaque phrase anglaise est considérée comme une traduction possible de la phrase [...]

Expériences de traduction avec GIZA : Paramètres et Temps

Les expériences avec GIZA – Chapitre 4 : Le corpus des débats parlementaires canadiens (connu sous le nom de Hansard) a été utilisé dans notre étude pour entraîner les paramètres des modèles de traduction. Ce corpus est constitué de 1 639 250 paires de phrases, 29 547 933 mots anglais et 31 826 112 mots français. Les tailles des vocabulaires anglais et français sont respectivement de 103’830 et de 83 106 mots différents. Dans ce chapitre, nous décrivons les expériences réalisées avec GIZA (décrit dans le chapitre précédent) et comparons la qualité des trois modèles que nous avons entraînés à l’aide de ce package. Nous nous intéressons également aux temps d’entraînement et à l’espace mémoire requis par ce package. Ce type de considération à priori secondaire, prend toute [...]

Les modèles de traduction statistique proposés par IBM

2.3.3 Les modèles de traduction proposés par IBM [Brown et al, 1993] propose cinq modèles de traduction 1, 2, 3, 4 et 5. Chaque modèle a sa propre prescription pour calculer la probabilité conditionnelle P(f|e), qu’on appelle la probabilité de traduction. Toute paire de mots reliés (ei,fj) du corpus d’entraînement est un paramètre du modèle. On fait un choix initial de l’ensemble des paramètres du modèle, puis on applique un algorithme d’estimation afin d’améliorer la vraisemblance du corpus d’entraînement. Notation: On cherche à modéliser P(F=fJ|E=eI) où E est l’ensemble de phrases anglaises, F est l’ensemble de phrases françaises. eI=e1,…,eI et fJ=f1,…,fJ sont deux phrases particulières de E et F. A(eI,fJ) est l’ensemble des alignements liant une phrase anglaise donnée à une phrase française. On note [...]