File size: 2,532 Bytes

---
language:
  - fr
  - en
license: cc-by-4.0
library_name: transformers
base_model: Helsinki-NLP/opus-mt-fr-en
tags:
  - translation
  - opus-mt
  - marian-mt
  - marianMTModel
  - fr-to-en
  - neuro-symbolic
  - NMT
datasets:
  - opus_books
metrics:
  - bleu
  - sacrebleu
pipeline_tag: translation
---

# last release : March 16 2026 (added functions to uplaod PDF or TeX file and separate the whole corpus in 528 tokkens chuncks)

# opus-mt-fr-en-finetuned-fr-to-en

Modèle de traduction automatique neuronale (NMT) **français → anglais**, fine-tuné à partir du modèle de base [`Helsinki-NLP/opus-mt-fr-en`](https://huggingface.co/Helsinki-NLP/opus-mt-fr-en) dans le cadre des recherches doctorales en **IA hybride neuro-symbolique** à l'UQAM.

## Model Description

Ce modèle est basé sur l'architecture **MarianMT** (Marian NMT converti en PyTorch via 🤗 Transformers). Il a été fine-tuné pour améliorer la traduction de textes académiques et informationnels du français vers l'anglais, avec un focus sur des corpus spécialisés liés à la vérification de la crédibilité de l'information.

- **Architecture** : MarianMTModel (Encoder-Decoder)
- **Modèle de base** : `Helsinki-NLP/opus-mt-fr-en`
- **Tâche** : Traduction automatique (fr → en)
- **Langue source** : Français (`fr`)
- **Langue cible** : Anglais (`en`)
- **Framework** : 🤗 Transformers / PyTorch

## Intended Uses & Limitations

### Utilisations prévues
- Traduction de textes académiques et journalistiques du français vers l'anglais
- Composant NLP dans des pipelines de vérification de la crédibilité de l'information
- Recherche en traduction automatique neuronale

### Limitations
- Performances réduites sur des textes très spécialisés hors domaine d'entraînement
- Ne gère pas les dialectes régionaux du français
- Longueur maximale recommandée : 512 tokens par segment

## How to Use

### Avec `pipeline` (recommandé)

```python
from transformers import pipeline

translator = pipeline(
    "translation",
    model="DomLoyer/opus-mt-fr-en-finetuned-fr-to-en"
)

result = translator("La crédibilité de l'information est essentielle à l'ère numérique.")
print(result['translation_text'])
```



Citation:

```bibtex

## Auteur

**Dominique Loyer**  
Doctorant en Informatique Cognitive — UQAM  
ORCID: [0009-0003-9713-7109](https://orcid.org/0009-0003-9713-7109)  
Hugging Face: [@DomLoyer](https://huggingface.co/DomLoyer)

## License

[CC BY 4.0](https://creativecommons.org/licenses/by/4.0/)

```