EN --> IT model generated using NLLU (Results and Download Link)

Following the creation of Announcing NLLU - No Language Left Unlocked - #5 by pierotofy I’ve generated a model using the workflow of argos-train and the nllu dataset, along with a a few smaller opus corpuses and a wiktionary dataset.

~82% of the training data came from NLLU, the remaining 18% from opus/wiktionary.

The good news is that BLEU evaluation on flores200 increased by 5 points, the bad news is that as a human I can’t detect any noticeable improvements, in fact the translations seem pretty equal to me.

There’s also an annoying issue where basic words such as “hello” (lowercase) return “hello” (unchanged), whereas “Hello” (first letter uppercase) correctly returns “Salve”. Same issue for “hi”, which returns “hi” (unchanged), whereas “Hi” correctly returns “Ciao”.

Super-annoying, given that the wiktionary dataset has explicit entries for “hello” (lowercase). I know the capitalization of letters is an on-going issue with existing models as well (for example, the current model translates “hello” → “pronto” and “Hello” → “Ciao”).

This might be the next issue that I start working on, as people who try LT/argos for the first time do not type full sentences as a first test, but simple ones, and if those fail, it doesn’t look great for a first test/evaluation.

Link to argos model for those that want to try it out: https://nllu.libretranslate.com/data/translate-en_it-1_0_test.argosmodel

Current argos-translate (C) → 46.75
New test (N) → 51.31

flores200id

• input
• human ground truth
• (C) current
• (N) new
• deepl translation

25

• Ovechkin’s first assist of the night was on the game-winning goal by rookie Nicklas Backstrom;
• Il primo assist di Ovechkin della serata è stato quello che ha permesso all’esordiente Nicklas Backstrom di segnare il gol della vittoria;
• (C) Il primo aiuto di Ovechkin della notte è stato sull’obiettivo vincente dal rookie Nicklas Backstrom;
• (N) Il primo assist della notte di Ovechkin fu nell’obiettivo vincitore del gioco dal rookie Nicklas Backstrom;
• Il primo assist di Ovechkin della serata è stato fornito sul gol vittoria del debuttante Nicklas Backstrom;

50

• In the last 3 months, over 80 arrestees were released from the Central Booking facility without being formally charged.
• Negli ultimi 3 mesi, oltre 80 detenuti sono stati rilasciati dal Centro di detenzione senza una formale accusa.
• (C) Negli ultimi 3 mesi, oltre 80 arresti sono stati rilasciati dalla centrale di prenotazione senza essere formalmente accusati.
• (N) Negli ultimi 3 mesi, oltre 80 arresti sono stati rilasciati dalla struttura di prenotazione centrale senza essere formalmente addebitati.
• Negli ultimi 3 mesi, oltre 80 arrestati sono stati rilasciati dal centro di prenotazione senza essere formalmente accusati.

125

• Since its inception, The Onion has become a veritable news parody empire, with a print edition, a website that drew 5,000,000 unique visitors in the month of October, personal ads, a 24 hour news network, podcasts, and a recently launched world atlas called Our Dumb World.
• A partire dal suo debutto, The Onion è diventato un vero impero della parodia dell’informazione, con un’edizione cartacea, un sito web in grado di attirare 5.000.000 di visitatori unici nel mese di ottobre, inserzioni personali, un network di notizie h24, podcast e un atlante mondiale, lanciato recentemente, chiamato Our Dumb World.
• (C) Fin dalla sua nascita, The Onion è diventato un vero e proprio impero di parodia di notizie, con un’edizione di stampa, un sito web che ha attirato 5.000.000 visitatori unici nel mese di ottobre, annunci personali, una rete di notizie 24 ore, podcast, e un atlante mondiale recentemente lanciato chiamato Our Dumb World.
• (N) Fin dalla sua nascita, The Onion è diventato un vero e proprio impero di parodie di notizie, con un’edizione cartacea, un sito web che ha attirato 5.000.000 di visitatori unici nel mese di ottobre, annunci personali, una rete di notizie 24 ore su 24, podcast e un atlante mondiale recentemente lanciato chiamato Our Dumb World.
• Dalla sua nascita, The Onion è diventato un vero e proprio impero della parodia giornalistica, con un’edizione cartacea, un sito web che ha attirato 5.000.000 di visitatori unici nel mese di ottobre, annunci personali, una rete di notizie 24 ore su 24, podcast e un atlante mondiale recentemente lanciato, chiamato Our Dumb World.

250

• The hostel’s guests were mostly citizens of the United Arab Emirates.
• L’ostello ospitava principalmente cittadini provenienti dagli Emirati Arabi Uniti.
• (C) Gli ospiti dell’ostello erano per lo più cittadini degli Emirati Arabi Uniti.
• (N) Gli ospiti dell’ostello erano per lo più cittadini degli Emirati Arabi Uniti.
• Gli ospiti dell’ostello erano per lo più cittadini degli Emirati Arabi Uniti.

500

• It was developed by John Smith in the 1970s to help inexperienced folders or those with limited motor skills.
• Fu ideato da John Smith negli anni '70 per facilitare il lavoro ai piegatori inesperti o a coloro che avevano limitate capacità motorie.
• (C) È stato sviluppato da John Smith negli anni '70 per aiutare cartelle inesperte o quelle con capacità motorie limitate.
• (N) È stato sviluppato da John Smith negli anni '70 per aiutare le cartelle inesperte o quelle con capacità motorie limitate.
• È stato sviluppato da John Smith negli anni '70 per aiutare i piegatori inesperti o con capacità motorie limitate.

800

• When people don’t see moose as potentially dangerous, they may approach too closely and put themselves at risk.
• Se le persone sottovalutano la potenziale pericolosità degli alci, potrebbero avvicinarsi troppo a loro e correre dei rischi.
• (C) Quando le persone non vedono l’alce come potenzialmente pericoloso, possono avvicinarsi troppo da vicino e mettersi a rischio.
• (N) Quando le persone non vedono l’alce come potenzialmente pericolosa, possono avvicinarsi troppo da vicino e mettersi a rischio.
• Quando le persone non vedono gli alci come potenzialmente pericolosi, possono avvicinarsi troppo e mettersi in pericolo.

1 Like

I also trained a new model, argos-translate-en_it-20230903, on the NLLU data.

Data

Dataset Size
OpenSubtitles 35216229
NLLU 14025542
LinguaTools-WikiTitles 11544626
XLEnt 6065170
DGT 5096168
TildeMODEL 3752393
Europarl 1946253
JRC-Acquis 810979
Wikimedia 568428
Tatoeba 502269
TED2020 373072
GNOME 318084
ELRC-CORDIS_Results v1 252920
TED2013 159391
GlobalVoices v2018q4 129550
bible-uedin 61863
PHP 35538
Ubuntu 19612

Sample Output

English

The Hubble Space Telescope (often referred to as HST or Hubble) is a space telescope that was launched into low Earth orbit in 1990 and remains in operation. It was not the first space telescope, but it is one of the largest and most versatile, renowned both as a vital research tool and as a public relations boon for astronomy. The Hubble telescope is named after astronomer Edwin Hubble and is one of NASA’s Great Observatories. The Space Telescope Science Institute (STScI) selects Hubble’s targets and processes the resulting data, while the Goddard Space Flight Center (GSFC) controls the spacecraft.

argos-translate-en_it-20230903

Il telescopio spaziale Hubble (spesso chiamato HST o Hubble) è un telescopio spaziale lanciato in orbita terrestre bassa nel 1990 e rimane in funzione. Non è stato il primo telescopio spaziale, ma è uno dei più grandi e versatili, rinomato sia come strumento di ricerca vitale che come boon di relazioni pubbliche per l’astronomia. Il telescopio Hubble prende il nome dall’astronomo Edwin Hubble ed è uno dei grandi osservatori della NASA. Il Space Telescope Science Institute (STScI) seleziona gli obiettivi di Hubble e elabora i dati risultanti, mentre il Goddard Space Flight Center (GSFC) controlla il veicolo.

1.0

Il telescopio spaziale Hubble (spesso chiamato HST o Hubble) è un telescopio spaziale lanciato in orbita bassa della Terra nel 1990 e rimane in funzione. Non era il primo telescopio spaziale, ma è uno dei più grandi e versatili, rinomati sia come strumento di ricerca vitale che come boon di pubbliche relazioni per l’astronomia. Il telescopio Hubble prende il nome dall’astronomo Edwin Hubble ed è uno dei Grandi Osservatori della NASA. Lo Space Telescope Science Institute (STScI) seleziona gli obiettivi e i processi di Hubble, mentre il Goddard Space Flight Center (GSFC) controlla il veicolo spaziale.

1 Like

argos-translate-en_it-20230903 BLEU score: 61.85434 :boom:

The Hubble translation above is better with 20230903 (verb conjugations are more correct), also translated better “seleziona gli obiettivi di Hubble e elabora i dati risultanti”, instead of “seleziona gli obiettivi e i processi di Hubble” → “selects the targets and the processes of Hubble” (incorrect).

1 Like

Wow! Here are some more samples:

English

Source

Hubble features a 2.4 m (7 ft 10 in) mirror, and its five main instruments observe in the ultraviolet, visible, and near-infrared regions of the electromagnetic spectrum. Hubble’s orbit outside the distortion of Earth’s atmosphere allows it to capture extremely high-resolution images with substantially lower background light than ground-based telescopes. It has recorded some of the most detailed visible light images, allowing a deep view into space. Many Hubble observations have led to breakthroughs in astrophysics, such as determining the rate of expansion of the universe.

Space telescopes were proposed as early as 1923, and the Hubble telescope was funded and built in the 1970s by the United States space agency NASA with contributions from the European Space Agency. Its intended launch was in 1983, but the project was beset by technical delays, budget problems, and the 1986 Challenger disaster. Hubble was finally launched in 1990, but its main mirror had been ground incorrectly, resulting in spherical aberration that compromised the telescope’s capabilities. The optics were corrected to their intended quality by a servicing mission in 1993.

Hubble is the only telescope designed to be maintained in space by astronauts. Five Space Shuttle missions have repaired, upgraded, and replaced systems on the telescope, including all five of the main instruments. The fifth mission was initially canceled on safety grounds following the Columbia disaster (2003), but after NASA administrator Michael D. Griffin approved it, the servicing mission was completed in 2009. Hubble completed 30 years of operation in April 2020 and is predicted to last until 2030–2040.

Hubble is the visible light telescope in NASA’s Great Observatories program; other parts of the spectrum are covered by the Compton Gamma Ray Observatory, the Chandra X-ray Observatory, and the Spitzer Space Telescope (which covers the infrared bands). The mid-IR-to-visible band successor to the Hubble telescope is the James Webb Space Telescope (JWST), which was launched on December 25, 2021, with the Nancy Grace Roman Space Telescope due to follow in 2027.

argos-translate-en_it-20230903

Hubble presenta uno specchio di 2,4 m (7 ft 10 in) e i suoi cinque strumenti principali osservano nelle regioni ultraviolette, visibili e a infrarossi dello spettro elettromagnetico. L’orbita di Hubble al di fuori della distorsione dell’atmosfera terrestre le permette di catturare immagini ad altissima risoluzione con una luce di fondo molto più bassa rispetto ai telescopi terrestri. Ha registrato alcune delle immagini di luce visibile più dettagliate, permettendo una visione profonda dello spazio. Molte osservazioni Hubble hanno portato a scoperte in astrofisica, come la determinazione del tasso di espansione dell’universo.

I telescopi spaziali sono stati proposti già nel 1923 e il telescopio Hubble è stato finanziato e costruito negli anni '70 dall’agenzia spaziale statunitense NASA con contributi dell’Agenzia spaziale europea. Il suo lancio era previsto nel 1983, ma il progetto era dovuto a ritardi tecnici, problemi di bilancio e al disastro del Challenger del 1986. Hubble è stato finalmente lanciato nel 1990, ma il suo specchio principale era stato a terra in modo non corretto, con conseguente aberrazione sferica che ha compromesso le capacità del telescopio. L’ottica è stata corretta per la loro qualità prevista da una missione di servizio nel 1993.

Hubble è l’unico telescopio progettato per essere mantenuto nello spazio dagli astronauti. Cinque missioni dello Space Shuttle hanno riparato, migliorato e sostituito sistemi sul telescopio, compresi tutti e cinque gli strumenti principali. La quinta missione è stata inizialmente annullata per motivi di sicurezza dopo il disastro della Columbia (2003), ma dopo che l’amministratore della NASA Michael D. Griffin l’ha approvata, la missione di servizio è stata completata nel 2009. Hubble ha completato 30 anni di attività nell’aprile 2020 e dovrebbe durare fino al 2030-2040.

Hubble è il telescopio di luce visibile nel programma Great Observatories della NASA; altre parti dello spettro sono coperte dall’osservatorio Compton Gamma Ray, dall’osservatorio a raggi X Chandra e dal telescopio spaziale Spitzer (che copre le bande a infrarossi). Il telescopio spaziale James Webb (JWST), lanciato il 25 dicembre 2021, con il telescopio spaziale Nancy Grace Roman che dovrebbe seguire nel 2027.

1.0 (Production)

Hubble presenta uno specchio di 2,4 m (7 ft 10 in) e i suoi cinque strumenti principali osservano nelle regioni ultraviolette, visibili e a infrarossi dello spettro elettromagnetico. L’orbita di Hubble al di fuori della distorsione dell’atmosfera terrestre permette di catturare immagini ad altissima risoluzione con una luce di fondo molto più bassa rispetto ai telescopi terrestri. Ha registrato alcune delle immagini di luce visibile più dettagliate, permettendo una visione profonda dello spazio. Molte osservazioni hanno portato a scoperte in astrofisica, come la determinazione del tasso di espansione dell’universo.

I telescopi spaziali sono stati proposti già nel 1923 e il telescopio Hubble è stato finanziato e negli anni ‘70 dall’agenzia spaziale statunitense NASA con contributo dell’ Agenzia spaziale europea. Il suo lancio era previsto nel 1983, ma il progetto era dovuto a ritardi tecnici, problemi di bilancio e al disastro del Challenger del 1986. Hubble è stato finalmente lanciato nel 1990, ma il suo specchio principale era stato a terra in modo non corretto, con conseguente aberrazione sferica che ha compromesso le capacità del telescopio. L’ottica è stata corretta per la loro qualità prevista da una missione di servizio nel 1993.

Hubble è l’unico telescopio progettato per essere tenuto nello spazio dagli astronauti. Cinque missioni dello Space Shuttle hanno riparato, migliorato e sostituito sistemi sul telescopio, compresi tutti e cinque gli strumenti principato. La quinta missione è stata inizialmente annullata per motivi di sicurezza dopo il disastro della Columbia (2003), ma dopo che l’amministratore della La missione di servizio è stata completata nel 2009. Hubble ha completato 30 anni di attività nell’aprile 2020 e dovrebbe durare fino al 2030-2040.

Hubble è il telescopio di luce visibile nel programma Grandi Osservatori della NASA; altre parti dello spettro sono coperte dall’osservatorio Compton Gamma Ray, dall’osservatorio a raggi X Chandra e dal telescopio spaziale Spitzer (che copre le bande a infrarossi). Il telescopio spaziale James Webb (JWST), lanciato il 25 dicembre 2021, con il telescopio spaziale Nancy Grace Roman che dovrebbe seguire nel 2027.

Equal.

Equal.

Equal.

20230903 slightly better, 1.0 missed to translate “built”.

Equal.

Equal.

Equal.

20230903 is better, as “to be maintained” is “per essere mantenuto” and not “per essere tenuto” (to be kept).

20230903 is better “main instruments” is “strumenti principali”, not “strumenti principato” (“principate tools”? lol)

20230903 is better, references to “Michael D. Griffin” are removed in 1.0 (wrong).

Equal.

Equal.

Equal (both kind of awkward), no references to “mid-IR-to-visible”.

Overall, 1.0 was never better, so 20230903 performed best.

1 Like