Immagini, traduzione automatica e tazze

Nota: post del 2009, precedente all’avvento dei sistemi di traduzione automatica neurale (NMT, Neural Machine Translation).


Con i sistemi di traduzione automatica di tipo statistico come Google Translate e Microsoft Translator è sempre più difficile vedere traduzioni esilaranti come “addolorisi con i ventilatori dell’ape Gee” (mourn with Bee Gee fans, titolo apparso dopo la dipartita di uno dei cantanti) o “le lampadine della molla” (spring bulbs come tulipani e narcisi).

Qualche sorrisetto può ancora capitare in alcuni siti di immagini stock dove le parole chiave (keyword) associate a ciascuna foto e illustrazione sono presumibilmente vecchie traduzioni fatte con sistemi basati su regole. Ecco qualche risultato in Shutterstock, con l’italiano come lingua di ricerca, per la parola tazza, usata come unica traduzione di due diverse parole inglesi:

alcuni risultati per la parola chiave 'tazza' in Shutterstock.com

Chi parla inglese fa presto i collegamenti: cup non è solamente la tazza tradizionale con il piattino ma anche il bicchiere di carta o di plastica (paper cup e plastic cup) e la coppa data in premio, ad esempio nei tornei di calcio (ma anche la coppa dei reggiseni); suction cup è la ventosa e rubber cup una ventosa di gomma, quindi cup plunger spiega lo sturalavandini (da non usare però cup per la tazza del water, che è toilet bowl!).

Mug, invece, è sia il tazzone alto (senza piattino) che il boccale da birra. Più divertente, e sicuramente disorientante per chi non conosce l’inglese, il risultato con la foto segnaletica (mug shot, infatti mug è anche una parola informale per faccia) e soprattutto la descrizione associata alla relativa immagine: “colpo della tazza dell’uomo Medio Evo” (mug shot of middle aged man)!

Sono tutti esempi di anisomorfismo, l’impossibilità di far corrispondere tutti i significati di una parola in una data lingua a tutti i significati di una parola in un’altra.

vignetta da SO MUCH PUN

Il verbo mug significa aggredire per rapinare e mugger è un rapinatore; shot ha varie accezioni tra cui colpo di arma da fuoco (ma anche tiratore) e foto istantanea.


Vedi anche: Espressioni idiomatiche inglesi, per un altro esempio di cupbicchiere, e Traduzione automatica, per le principali differenze tra sistemi basati su regole, come quello probabilmente usato per le traduzioni di mug, e di tipo statistico, come Google Translate.

Nuovo post: Mugshot, una parola particolare sul collegamento tra tazze e foto segnaletiche come quella virale di Donald Trump (agosto 2023)


4 commenti su “Immagini, traduzione automatica e tazze”

  1. Gió:

    Il problema della traduzione e dei siti di immagini stock non affligge http://www.iStockphoto.com

    iStock infatti ha un motore di ricerca che permette di conoscere le traduzioni dei termini in modo molto piú accurato di tutte le altre agenzie.

    E ricerca piú accurate significano risparmio di tempo, e se il tempo é denaro…

    Provate a cercare “tazza” su iStock, nei primi 32 risultati ci sono 28 tipi di tazze differenti. Direi che la ricerca é decisamente accurata.

    Gió
    http://www.unitalianosuistock.com

  2. Vlad:

    Un sistema di traduzione che non caschi nei tranelli non dev’essere uno scherzo, visto che ancora mi capita spesso di scuotere la testa sconsolato perché traduttori in carne e ossa incappano quotidianamente nei più banali dei falsi amici (ho ancora in testa il “ticchettio di chiavi di computer”).
    Un giorno sentiremo nostalgia degli strafalcioni di Babelfish?
    Una perla come il “mug shot” è praticamente un’opera d’arte. Il sistema ha travisato quasi ogni parola, è bellissimo.

  3. Licia:

    @ Gió e Vlad, effettivamente la traduzione delle parole chiave non è uno scherzo perché rimangono problemi difficili da risolvere anche con i traduttori umani più bravi (bisognerebbe ricorrere a sistemi molto complessi che sarebbero troppo dispendiosi da implementare). Basta pensare agli omografi: ottenere immagini inaspettate per il significato che si sta cercando è accettabile nella lingua di partenza perché l’utente è consapevole della polisemia della parola, invece nella lingua di arrivo le perplessità sono inevitabili. Un esempio tipico è la ricerca di immagini per la parola chiodo in un sistema con parole chiave tradotte dall’inglese: spesso si ottengono dita e unghie di vario genere. In alcuni sistemi il problema è attenuato se la ricerca non è generica, per cui se si cerca chiodo nella categoria Strumenti si ottengono solo le immagini che in inglese hanno parola chiave nail e categoria Tools, mentre vengono escluse tutte quelle che hanno nail e categoria People.

I commenti sono chiusi.