French translation model

I’m currently considering changing the default en-fr models to an Opus-MT model. Here are some translation examples if any native speakers have feedback:

EN → FR

English Source Text (Wikipedia)

Discourse is an open source Internet forum system. Features include threading, categorization and tagging of discussions, configurable access control, live updates, expanding link previews, infinite scrolling, and real-time notifications. It is customizable via its plugin architecture and its theming system.

Discourse was released on August 26, 2014, by its founders Jeff Atwood, Robin Ward, and Sam Saffron.

The client side application is written in EmberJS. The server side is written in Ruby on Rails and backed by a Postgres database and Redis cache. The source code is distributed under the GNU General Public License version 2.

The default homepage features a list of active topics as well as navigation buttons that help users find discussions they’re interested in.
The default homepage in Discourse
Discourse is in active development, with over 49,000 commits as of June 2023.

Current 1.0 Model

Discours est un système de forum Internet open source. Les caractéristiques incluent le filage, la catégorisation et l’étiquetage des discussions, le contrôle d’accès configurable, les mises à jour en direct, l’extension des aperçus de liens, le défilement infini et les notifications en temps réel. Il est personnalisable via son architecture plugin et son système d’édition.

Discourse a été libéré le 26 août 2014, par ses fondateurs Jeff Atwood, Robin Ward et Sam Saffron.

L’application côté client est écrite dans EmberJS. Le côté serveur est écrit dans Ruby on Rails et soutenu par une base de données Postgres et le cache Redis. Le code source est distribué sous la version 2.

La page d’accueil par défaut comporte une liste de sujets actifs ainsi que des boutons de navigation qui aident les utilisateurs à trouver des discussions qui les intéressent.

La page d’accueil par défaut dans Discourse

Le cours est en développement actif, avec plus de 49 000 commits en juin 2023.

Proposed 1.9 Model

Discourse est un système de forum Internet open source. Les fonctionnalités comprennent le threading, la catégorisation et le marquage des discussions, le contrôle d’accès configurable, les mises à jour en direct, l’extension des prévisualisations de liens, le défilement infini et les notifications en temps réel. Il est personnalisable via son architecture plugin et son système de thème.

Discourse est sorti le 26 août 2014 par ses fondateurs Jeff Atwood, Robin Ward et Sam Safron.

L’application côté client est écrite dans EmberJS. Le côté serveur est écrit dans Ruby on Rails et soutenu par une base de données Postgres et le cache Redis. Le code source est distribué sous la licence publique générale GNU version 2.

La page d’accueil par défaut comporte une liste de sujets actifs ainsi que des boutons de navigation qui aident les utilisateurs à trouver des discussions qui les intéressent.

La page d’accueil par défaut dans Discourse

Le discours est en développement actif, avec plus de 49 000 engagements en juin 2023.

FR → EN

French Source Text (Wikipedia)

Wikipédia est un projet d’encyclopédie collective en ligne, universelle, multilingue et fonctionnant sur le principe du wiki. Ce projet vise à offrir un contenu librement réutilisable, objectif et vérifiable, que chacun peut modifier et améliorer.
Wikipédia est définie par des principes fondateurs. Son contenu est sous licence Creative Commons BY-SA. Il peut être copié et réutilisé sous la même licence, sous réserve d’en respecter les conditions. Wikipédia fournit tous ses contenus gratuitement, sans publicité, et sans recourir à l’exploitation des données personnelles de ses utilisateurs.

Current 1.0 Model

Wikipedia is a collective encyclopedia project online, universal, multilingual and working on the principle of wiki. This project aims to provide freely reusable, objective and verifiable content that everyone can modify and improve.

Wikipedia is defined by founding principles. Its content is licensed under Creative Commons BY-SA. It may be copied and reused under the same license, subject to the conditions. Wikipedia provides all its content free of charge, without advertising, and without using the personal data of its users.

Proposed 1.9 Model

Wikipedia is a collective online, universal, multilingual and wiki-based encyclopedia project. This project aims to provide freely reusable, objective and verifiable content that everyone can modify and improve.

Wikipedia is defined by founding principles. Its content is licensed under Creative Commons BY-SA. It may be copied and reused under the same licence, subject to compliance with the conditions. Wikipedia provides all its content free of charge, without advertising, and without using the personal data of its users.

Response from Twitter:

looks v good to me .
i couldn’t figure out how FR → EN 1.9 model could be better — even the 1.0 model was ok —

the EN-> FR 1.9 model has used an english word “threading” , even if this could be seen as an error , the same translated word “filage” ( on 1.0 model ) is a mistranslation .
so “threading” is ok to me . as “filage” would be more confusing .
moreover i don’t think that “threading” has a french equivalent .
even if the 1.0 model was kinda ok , there used to be a lot of mistranslated / confusing words : “filage” , “système d’édition” , “Discourse a été libéré” .

so yeah there is a big difference on EN → FR 1.0 vs 1.9
1.9 model . congrats

1 Like

From Mastodon:

For the first text, it’s overall much better. The first and second paragraphs were not only bad, but the meaning was different from the English. Only the last paragraph is becoming worse, since “commit” should not have been translated in this context. There are still quite a lot of issues with the text, but they’re the same in both models.

For the second text, I feel the new model improves the text (esp. first sentence), but it’s harder for me to judge.

I’ve uploaded the Opus-MT 1.9 French model to the index:

1 Like