Home » Teams » MLIA » François Yvon
  • François Yvon

  • Équipe: MLIA
  • Bureau: H13
  • Email: prénom point nom arobase sorbonne-universite point fr
  • Site web: https://fyvo.github.io
  • Bio: François Yvon est directeur de recherche au CNRS; il conduit ses recherches en traitement des langues au sein du groupe "Machine Learning and Deep Learning for Intelligent Access" de l'ISIR. Ses travax récents s'intéressent à la traduction automatique par des méthodes neuronales et probabilistes - et plus généralement au traitement automatique des langues dans sa dimension multilingue. Parmi les projets récents: MaTOS qui s'intéresse à la traduction automatique d'articles scientifiques; CLD 2025 qui s'intéresse à l'outillage de la linguistique de terrain; et BigScience, qui a conduit à l'entrainement du modèle BLOOM. Antérieurement, F. Yvon a été directeur du LIMSI/CNRS à Orsay et professeur d'informatique à l'Université Paris-Sud et à Télécom Paris, et brièvement chercheur au centre de recherche d'IBM à New York.

Publications

  • Sadaf Abdul Rauf, François Yvon. Translating scientific abstracts in the bio-medical domain with structure-aware models. Computer Speech and Language, 2024, 87, pp.101623. ⟨10.1016/j.csl.2024.101623⟩. ⟨hal-04476788⟩
  • Rachel Bawden, Hatim Bourfoune, Bertrand Cabot, Nathan Cassereau, Pierre Cornette, et al.. Les modèles Bloom pour le traitement automatique de la langue française. 2024. ⟨hal-04435371⟩
  • François Yvon. La traduction multilingue : analyse d'une prouesse technologique. Mediazioni. Rivista online du studi interdisciplinari su lingue e culture, 2023, 39, pp.A17-A34. ⟨10.6092/issn.1974-4382/18785⟩. ⟨hal-04365112⟩
  • Shu Okabe, François Yvon. Towards Multilingual Interlinear Morphological Glossing. 2023 Conference on Empirical Methods in Natural Language Processing, Association for Computational Linguistics, Dec 2023, Singapore, Singapore. pp.5958-5971, ⟨10.18653/v1/2023.findings-emnlp.396⟩. ⟨hal-04357157⟩
  • Maxime Bouthors, Josep Crego, François Yvon. Towards Example-Based NMT with Multi-Levenshtein Transformers. Conference on Empirical Methods in Natural Language Processing, Association for Computational Linguistics, Dec 2023, Singapour, Singapore. pp.1830-1846. ⟨hal-04332427⟩
  • Amir Hossein Kargaran, Ayyoob Imani, François Yvon, Hinrich Schütze. GlotLID: Language Identification for Low-Resource Languages. Findings of the Association for Computational Linguistics: EMNLP 2023, Association for Computational Linguistics, Dec 2023, Singapore, Singapore. pp.6155-6218. ⟨hal-04332442⟩
  • Alban Petit, Caio Corro, François Yvon. Structural generalization in COGS: Supertagging is (almost) all you need. Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing, Dec 2023, Singapour, Singapore. pp.1089-1101, ⟨10.18653/v1/2023.emnlp-main.69⟩. ⟨hal-04382463⟩
  • Shu Okabe, François Yvon. LISN @ SIGMORPHON 2023 Shared Task on Interlinear Glossing. The 20th SIGMORPHON workshop on Computational Morphology, Phonology, and Phonetics, Association for computational linguistics, Jul 2023, Toronto, Canada. ⟨10.18653/v1/2023.sigmorphon-1.21⟩. ⟨hal-04186388⟩
  • Dávid Javorský, Ondřej Bojar, François Yvon. Assessing Word Importance Using Models Trained for Semantic Tasks. 61st Annual Meeting of the Association for Computational Linguistics (ACL 2023), ACL, Jul 2023, Toronto, Canada. pp.8846-8856. ⟨hal-04163044⟩
  • Josep Crego, Jitao Xu, François Yvon. BiSync: A Bilingual Editor for Synchronized Monolingual Texts. The 61st Annual Meeting of the Association for Computational Linguistics, ACL, Jul 2023, Toronto, Canada. pp.369-376. ⟨hal-04163029⟩
  • Ayyoob Imani, Peiqin Lin, Amir Hossein Kargaran, Silvia Severini, Masoud Jalili Sabet, et al.. Glot500: Scaling Multilingual Corpora and Language Models to 500 Languages. 61th Annual Meeting of the Association for Computational Linguistics, ACL, Jul 2023, Toronto, Canada. ⟨hal-04163023⟩
  • Jitao Xu, Josep Crego, François Yvon. Integrating Translation Memories into Non-Autoregressive Machine Translation. EACL 2023, May 2023, Dubrovnik, Croatia. ⟨hal-03995339⟩
  • Shu Okabe, François Yvon. Joint Word and Morpheme Segmentation with Bayesian Non-Parametric Models. 17th Conference of the European Chapter of the Association for Computational Linguistics (EACL 2023), Association for Computational Linguistics, May 2023, Dubrovnik, Croatia. pp.628-642. ⟨hal-04086368⟩
  • Rachel Bawden, François Yvon. Investigating the Translation Performance of a Large Multilingual Language Model: the Case of BLOOM. EAMT 2023 - 24th Annual Conference of the European Association for Machine Translation, Jun 2023, Tampere, Finland. ⟨10.48550/ARXIV.2303.01911⟩. ⟨hal-04015863v2⟩
  • Maud Bénard, Alexandra Mestivier, Natalie Kubler, Lichao Zhu, Rachel Bawden, et al.. MaTOS: Traduction automatique pour la science ouverte. 18e Conférence en Recherche d'Information et Applications -- 16e Rencontres Jeunes Chercheurs en RI -- 30e Conférence sur le Traitement Automatique des Langues Naturelles -- 25e Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues, Jun 2023, Paris, France. pp.8-15. ⟨hal-04131594⟩
  • François Yvon. Transformers in Natural Language Processing. Mohamed Chetouani; Virginia Dignum; Paul Lukowicz; Carles Sierra. Human-Centered Artificial Intelligence. Advanced Lectures, 13500, Springer International Publishing, pp.81-105, 2023, Lecture Notes in Computer Science, 978-3-031-24348-6. ⟨10.1007/978-3-031-24349-3_6⟩. ⟨hal-04224531⟩
  • Shu Okabe, François Yvon. Production automatique de gloses interlinéaires à travers un modèle probabiliste exploitant des alignements. 18e Conférence en Recherche d'Information et Applications -- 16e Rencontres Jeunes Chercheurs en RI -- 30e Conférence sur le Traitement Automatique des Langues Naturelles -- 25e Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues, 2023, Paris, France. pp.262-274. ⟨hal-04130176⟩
  • Gilles Adda, Ioana Vasilescu, François Yvon. Language Report French. Georg Rehm; Andy Way. European Language Equality. A Strategic Agenda for Digital Language Equality, Springer International Publishing, pp.139-142, 2023, Cognitive Technologies, 978-3-031-28818-0. ⟨10.1007/978-3-031-28819-7_16⟩. ⟨hal-04121465⟩
  • Philippe Langlais, François Yvon. For a common European framework for evaluating AI- based translation technologies. Rachele Raus. How artificial intelligence can further European multilingualism Strategic recommendations for European decision-makers, Università di Torino - Artificial Intelligence for European Integration; Ledizioni, pp.93-96, 2023, 9791256000142. ⟨hal-04392444⟩
  • François Yvon. Evaluer, diagnostiquer et analyser la traduction automatique neuronale. FORUM. Revue internationale d’interprétation et de traduction / International Journal of Interpretation and Translation , 2022, 20 (2), pp.315-332. ⟨10.1075/forum.00023.yvo⟩. ⟨hal-03975750⟩
  • Guillaume Wisniewski, Lichao Zhu, Nicolas Ballier, François Yvon. Analyzing Gender Translation Errors to Identify Information Flows between the Encoder and Decoder of a NMT System. BlackboxNLP 2022, Dec 2022, Abu Dhabi, United Arab Emirates. ⟨hal-03912438⟩
  • Ayyoob Imani, Silvia Severini, Masoud Jalili Sabet, François Yvon, Hinrich Schütze. Graph-Based Multilingual Label Propagation for Low-Resource Part-of-Speech Tagging. Empirical Methods in Natural Language Processing, Association for Computational Linguistics, Dec 2022, Abu Dhabi, United Arab Emirates. ⟨hal-03832874⟩
  • Jitao Xu, Josep Crego, François Yvon. Bilingual Synchronization: Restoring Translational Relationships with Editing Operations. The 2022 Conference on Empirical Methods in Natural Language Processing (EMNLP 2022), Dec 2022, Abou Dabi, United Arab Emirates. ⟨hal-03827010⟩
  • Guillaume Wisniewski, Lichao Zhu, Nicolas Ballier, François Yvon. Biais de genre dans un système de traduction automatique neuronale : une étude des mécanismes de transfert cross-langue. Revue TAL : traitement automatique des langues, 2022, 63 (1), pp.37-61. ⟨hal-03890622⟩
  • François Buet, François Yvon. Sous-titrage automatique : étude de stratégies d'adaptation aux genres télévisuels. Revue TAL : traitement automatique des langues, 2022, Varia, 63 (1), pp.11-35. ⟨hal-03890594⟩
  • Minh Quang Pham, Josep Crego, François Yvon. Latent Group Dropout for Multilingual and Multidomain Machine Translation. Findings of the ACL: NAACL 2022, Association for Computational Linguistics, Jul 2022, Seattle, United States. ⟨hal-03720395⟩
  • Alina Karakanta, François Buet, Mauro Cettolo, François Yvon. Evaluating Subtitle Segmentation for End-to-end Generation Systems. 13th Language Resources and Evaluation Conference (LREC), ELDA, Jun 2022, Marseille, France. ⟨hal-03783891⟩
  • Minh-Quang Pham, Josep Crego, François Yvon. Multi-Domain Adaptation in Neural Machine Translation with Dynamic Sampling Strategies. Conference of the European Association for Machine Translation, European Association for Machine Translation, Jun 2022, Ghent, Belgium. ⟨hal-03686763⟩
  • Jitao Xu, François Buet, Josep Crego, Elise Bertin-Lemée, François Yvon. Joint Generation of Captions and Subtitles with Dual Decoding. 19th International Conference on Spoken Language Translation (IWSLT 2022), May 2022, Dublin, Ireland. ⟨hal-03666567⟩
  • Shu Okabe, Laurent Besacier, François Yvon. Weakly Supervised Word Segmentation for Computational Language Documentation. Annual meeting of the Association for Computational Linguistics, Association for Computational Linguistics, May 2022, Dublin, Ireland. ⟨hal-03679416⟩
  • Ayyoob Imani, Lütfi Şenel, Masoud Sabet, François Yvon, Hinrich Schütze. Graph Neural Networks for Multiparallel Word Alignment. Findings of the ACL: ACL 2022, The Association for Computational Linguistics (ACL), May 2022, Dublin, Ireland. ⟨hal-03679419⟩
  • Gilles Adda, Annelies Braffort, Ioana Vasilescu, François Yvon, Jean-François Nominé. État de l'art des technologies linguistiques pour la langue française. [Rapport de recherche] CNRS - LISN. 2022. ⟨hal-03637784⟩
  • François Yvon. Le modèle Transformer: un « couteau suisse » pour le traitement automatique des langues. Techniques de l'Ingénieur, 2022, ⟨10.51257/a-v1-in195⟩. ⟨hal-03619077v2⟩
  • Joseph J Mariani, François Yvon. European Language Equality : Ressources et technologies pour le traitement de la langue française. Forum « Innovation, Technologies et Plurilinguisme » organisé par la Délégation Générale à la Langue Française et aux Langues de France (DGLFLF) à l’occasion de la Présidence Française de l’Union Européenne, Feb 2022, Lille, France. ⟨hal-04415400⟩
  • Gilles Adda, Annelies Braffort, Ioana Vasilescu, François Yvon. European Language Equality - Report on the French Language. [Research Report] CNRS - LISN. 2022. ⟨hal-03637776⟩
  • Shu Okabe, François Yvon. Modèle-s bayés-ien-s pour la segment-ation à deux niveau-x faible-ment super-vis-é-e. Traitement Automatique des Langues Naturelles, 2022, Avignon, France. pp.174-182. ⟨hal-03701487⟩
  • Lichao Zhu, Guillaume Wisniewski, Nicolas Ballier, François Yvon. Flux d'informations dans les systèmes encodeur-décodeur. Application à l'explication des biais de genre dans les systèmes de traduction automatique.. Traitement Automatique des Langues Naturelles, Jun 2022, Avignon, France. pp.10-18. ⟨hal-03701474⟩
  • Nicolas Devatine, Caio Corro, François Yvon. Ré-ordonnancement via programmation dynamique pour l'adaptation cross-lingue d'un analyseur en dépendances. 29ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2022), Association pour le Traitement Automatique des Langues (ATALA); Laboratoire d’Informatique et Systèmes (LIS); Laboratoire Informatique d’Avignon (LIA), Jun 2022, Avignon, France. pp.183-197. ⟨hal-03701508⟩
  • Shu Okabe, François Yvon. Vers la génération automatique de gloses pour la documentation automatique des langues. Journées Jointes des Groupements de Recherche Linguistique Informatique, Formelle et de Terrain (LIFT) et Traitement Automatique des Langues (TAL), Nov 2022, Marseille, France. pp.198-203. ⟨hal-03846843⟩
  • Shu Okabe, François Yvon, Laurent Besacier. Segmentation en mots faiblement supervisée pour la documentation automatique des langues. 2021. ⟨hal-03477475⟩
  • Guillaume Wisniewski, Lichao Zhu, Nicolas Ballier, François Yvon. Screening Gender Transfer in Neural Machine Translation. BlackBoxNLP 2021, Nov 2021, Punta Cana, Dominican Republic. ⟨hal-03993451⟩
  • Guillaume Wisniewski, Lichao Zhu, Nicolas Ballier, François Yvon. Screening Gender Transfer in Neural Machine Translation. Fourth BlackboxNLP Workshop on Analyzing and Interpreting Neural Networks for NLP, Association for computational linguistics, Nov 2021, Punta Cana, Dominica. ⟨hal-03424174⟩
  • Ayyoob Imani, Masoud Jalili Sabet, Lütfi Keremşenel, Philipp Dufter, François Yvon, et al.. Graph Algorithms for Multiparallel Word Alignment. The 2021 Conference on Empirical Methods in Natural Language Processing, Association for Computational Linguistics, Nov 2021, Punta Cana, Dominica. ⟨hal-03424044⟩
  • François Buet, François Yvon. Toward Genre Adapted Closed Captioning. Interspeech 2021, Aug 2021, Brno (virtual), Czech Republic. pp.4403-4407, ⟨10.21437/interspeech.2021-1762⟩. ⟨hal-03329488⟩
  • Anh Khoa Ngo Ho, François Yvon. Optimizing Word Alignments with Better Subword Tokenization. The 18th biennial conference of the International Association of Machine Translation, Aug 2021, Miami (virtual), United States. ⟨hal-03322842⟩
  • Mohamed Frihat, Bérengère Podvin, Lionel Mathelin, Yann Fraigneau, François Yvon. Coherent structure identification in turbulent channel flow using latent Dirichlet allocation. Journal of Fluid Mechanics, 2021, 920, ⟨10.1017/jfm.2021.444⟩. ⟨hal-03258870⟩
  • Mohamed Frihat, Némo Malhomme, Bérengère Podvin, Lionel Mathelin, Yann Fraigneau, et al.. Unsupervised identification of motifs in turbulent channel flow using Latent Dirichlet Allocation. Euromech colloquium on Machine learning methods for turbulent separated flows, Jun 2021, Paris, France. ⟨hal-03451341⟩
  • Jitao Xu, François Yvon. Can You Traducir This? Machine Translation for Code-Switched Input. Workshop on Computational Approaches to Linguistic Code Switching, Association for Computational Linguistics, Jun 2021, Online, United States. ⟨hal-03218889⟩
  • Guillaume Wisniewski, Lichao Zhu, Nicolas Ballier, François Yvon. Biais de genre dans un système de traduction automatique neuronale : une étude préliminaire. Traitement Automatique des Langues Naturelles, 2021, Lille, France. pp.11-25. ⟨hal-03265895⟩
  • Jitao Xu, François Yvon. One Source, Two Targets: Challenges and Rewards of Dual Decoding. Conference on Empirical Methods in Natural Language Processing, Nov 2021, Online and Punta Cana, Dominican Republic. ⟨hal-03345478⟩