File size: 2,532 Bytes
a51ca73
56abda6
4b83036
 
56abda6
 
 
4b83036
 
 
 
 
 
 
 
56abda6
4b83036
56abda6
4b83036
 
56abda6
 
 
da4964c
4b83036
56abda6
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
7fb76f7
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
---
language:
  - fr
  - en
license: cc-by-4.0
library_name: transformers
base_model: Helsinki-NLP/opus-mt-fr-en
tags:
  - translation
  - opus-mt
  - marian-mt
  - marianMTModel
  - fr-to-en
  - neuro-symbolic
  - NMT
datasets:
  - opus_books
metrics:
  - bleu
  - sacrebleu
pipeline_tag: translation
---

# last release : March 16 2026 (added functions to uplaod PDF or TeX file and separate the whole corpus in 528 tokkens chuncks)

# opus-mt-fr-en-finetuned-fr-to-en

Modèle de traduction automatique neuronale (NMT) **français → anglais**, fine-tuné à partir du modèle de base [`Helsinki-NLP/opus-mt-fr-en`](https://huggingface.co/Helsinki-NLP/opus-mt-fr-en) dans le cadre des recherches doctorales en **IA hybride neuro-symbolique** à l'UQAM.

## Model Description

Ce modèle est basé sur l'architecture **MarianMT** (Marian NMT converti en PyTorch via 🤗 Transformers). Il a été fine-tuné pour améliorer la traduction de textes académiques et informationnels du français vers l'anglais, avec un focus sur des corpus spécialisés liés à la vérification de la crédibilité de l'information.

- **Architecture** : MarianMTModel (Encoder-Decoder)
- **Modèle de base** : `Helsinki-NLP/opus-mt-fr-en`
- **Tâche** : Traduction automatique (fr → en)
- **Langue source** : Français (`fr`)
- **Langue cible** : Anglais (`en`)
- **Framework** : 🤗 Transformers / PyTorch

## Intended Uses & Limitations

### Utilisations prévues
- Traduction de textes académiques et journalistiques du français vers l'anglais
- Composant NLP dans des pipelines de vérification de la crédibilité de l'information
- Recherche en traduction automatique neuronale

### Limitations
- Performances réduites sur des textes très spécialisés hors domaine d'entraînement
- Ne gère pas les dialectes régionaux du français
- Longueur maximale recommandée : 512 tokens par segment

## How to Use

### Avec `pipeline` (recommandé)

```python
from transformers import pipeline

translator = pipeline(
    "translation",
    model="DomLoyer/opus-mt-fr-en-finetuned-fr-to-en"
)

result = translator("La crédibilité de l'information est essentielle à l'ère numérique.")
print(result['translation_text'])
```



Citation:

```bibtex

## Auteur

**Dominique Loyer**  
Doctorant en Informatique Cognitive — UQAM  
ORCID: [0009-0003-9713-7109](https://orcid.org/0009-0003-9713-7109)  
Hugging Face: [@DomLoyer](https://huggingface.co/DomLoyer)

## License

[CC BY 4.0](https://creativecommons.org/licenses/by/4.0/)

```