L’IA “sciacqua i panni in Arno”. Il ruolo della traduzione

Che impatto ha l’intelligenza artificiale sulla lingua italiana e sulla traduzione? Se ne discute lunedì 24 febbraio in un convegno con diretta streaming:

Programma del convegno. Relatori: Giuseppe Antonelli, “L’IA-taliano e le sue varietà”;  Federico Gaspari, “I panni sporchi si lavano in casa: gli studi sulla traduzione alle prese con l’intelligenza artificiale generativa”; Maria Margherita Mattioda, “La traduzione automatica neurale: innovare la didattica per una professionalizzazione delle competenze”;

L’intelligenza artificiale “sciacqua i panni in Arno” – Il ruolo della traduzione è un convegno organizzato dalla Rappresentanza in Italia della Commissione europea che lo sintetizza con questa descrizione:

Accademici di spicco esploreranno le interazioni tra gli ambiti dell’intelligenza artificiale, della linguistica e della traduzione, mettendone in luce, tra le altre cose, le ricadute professionali e didattiche e gli effetti sulla lingua che parliamo ogni giorno.”

Continua a leggere   >>

Parole dell’anno 2024, al di là dell’inglese

Immagine con parole dell’anno 2024 in inglese: manifest, brat, brain rot, demure
Immagine: dettagli di annunci di Word of the Year da Cambridge Dictionary, Collins Dictionary e Dictionary.com

Come ogni anno, anche alla fine del 2024 i media italiani hanno dato spazio alle word of the year annunciate da dizionari, media o altre istituzioni del mondo anglofono. Immancabili anche i fraintendimenti sui diversi criteri di scelta delle parole, come già descritto in Cos’è una “parola dell’anno” e come viene scelta.

Mi pare però che stavolta ci sia una novità: mai come quest’anno le parole inglesi del 2024 appaiono in gran parte irrilevanti per il lessico italiano, oppure sono indicative di fenomeni passeggeri o di nicchia (dettagli più sotto). Ho l’impressione che questo abbia in parte spiazzato chi invece avrebbe voluto descrivere neologismi di grande impatto e destinati a entrare nell’uso comune.  

Dalle parole dell’anno ci si aspetta infatti che siano particolarmente significative e simboliche dell’anno appena trascorso. Non per forza però devono essere nuove o esprimere nuovi concetti. Lo esemplifica efficacemente Le parole più usate nel web nel 2024 tra IA, guerra e meteo, un’analisi della linguista Stefania Spina specifica per l’italiano.

Parole rappresentative del 2024 in italiano

Spina ha usato gli strumenti e i metodi della linguistica del corpora per estrarre “parole chiave” (keyword) salienti per il 2024, ossia parole che nel web rispetto ai due anni precedenti hanno avuto una frequenza d’uso maggiore, misurata attraverso un indice cosiddetto di keyness.

Continua a leggere   >>

Cos’è un LLM, spiegato in immagini

Tra i termini dell’intelligenza artificiale che ormai sono ricorrenti anche nel lessico non specialistico c’è modello linguistico di grandi dimensioni, spesso indicato con l’acronimo originale inglese LLM (large language model).

Identifica una rappresentazione matematica complessa di un modello linguistico statistico, addestrato su un’enorme quantità di dati, che consente di eseguire attività di elaborazione e produzione di linguaggio naturale che appaiono del tutto simili a quelle degli esseri umani (un esempio sono i chatbot come ChatGPT).

Per capire cosa c’è alla base di un LLM e come funziona è molto efficace il video Large Language Models explained briefly, in inglese ma anche con sottotitoli:

Continua a leggere   >>

AI slop, “sbobba artificiale”

Alcuni esempi d’uso del neologismo inglese AI slop:

Immagini create con intelligenza artificiale e frasi: “it’s all slop, every website is becoming AI slop”; “Most of my Facebook feed is just AI slop, it’s so depressing”; It’s so sad. Google as a search engine is just ruined. It’s nothing but AI. Especially if you look up anime-related stuff, 98% of the results are AI slop”; “Every time I google something I have to add –ai at the end otherwise it will keep showing AI slop”

AI slop è un’espressione informale per ora ancora di nicchia che descrive contenuti di infima qualità generati dall’intelligenza artificiale, ad es. immagini, video, notizie, risultati di motori di ricerca e interi siti con funzione acchiappaclic.

È una risemantizzazione della parola slop, che nel lessico comune indica vari tipi di materiale liquido o semiliquido dall’aspetto poco allettante, come acqua sporca con residui solidi, fanghiglia, brodaglie varie, broda per i maiali, sbobba. In inglese la nuova accezione risulta trasparente perché già usata con il senso figurato di “robaccia che ci viene data in pasto” senza aver bisogno di spiegazioni.

Slop è una parola che ha anche aspetti fonosimbolici: la sequenza iniziale /sl/ è ricorrente in parole che richiamano interazioni tra sostanze liquide o vischiose (ad es. slosh, “sciabordare”, slime, “viscidume”, sludge, “melma”, slurp) e in parole con connotazioni negative (ad es. sleaze, “sozzume”, spec. in senso figurato, slob, “persona sciatta e indolente”, slut e slag, epiteti spregiativi femminili).

Continua a leggere   >>

IA con rigurgiti: falsi amici vs pappagalli!

Spunto per una discussione sul neologismo semantico inglese regurgitation nell’ambito dell’intelligenza artificiale generativa:

tweet da Ivo Silvestro: Un dubbio per @terminologia: come traduciamo “regurgitation” (quando una IA generativa ripropone tale e quale un contenuto su cui è stata addestrata), usato ad esempio da OpenAI nella loro presa di posizione?

Il riferimento è alle accuse del New York Times che ChatGPT, prodotto di OpenAI, anziché generare contenuti ad hoc darebbe risposte che riproducono letteralmente testo da articoli del NYT protetti da copyright.

OpenAI spiega che è un bug infrequente che stanno cercando di eliminare; è un comportamento anomalo che viene descritto come regurgitation:

Continua a leggere   >>

Prompt: “parole significative del 2023”

word cloud di parole significative del 2023

In Cos’è una “parola dell’anno” e come viene scelta (novembre 2023) ho descritto vari esempi per l’inglese. Nel frattempo sono state annunciate anche alcune parole dell’anno per l’italiano, che aggiungo qui assieme ad altre per me significative, da prompt a granchio blu passando per sbadilare e cassa di espansione.

La parola del 2023 per cui ha optato l’Enciclopedia Treccani è femminicidio, una scelta dovuta alla rilevanza da un punto di vista socioculturale (criterio che si differenza da quelli privilegiati dai dizionari di lingua inglese che ricorrono invece a dati quantitativi).

In Svizzera il Dipartimento di linguistica applicata dell’Università di Zurigo ha scelto come parola dell’anno per l’italiano GPT (“Generative Pre-trained Transformer, ovvero trasformatore generativo preaddestrato, un acronimo che esprime l’era dell’intelligenza artificiale”), seguito da tunnel, per rilevanza locale, ed ecoansia (“ansia derivante dal timore delle possibili conseguenze di disastri ambientali legati all’emergenza climatica”), parola entrata in italiano nel 2015 nella forma eco-ansia. Queste scelte hanno confermato la prevalenza di due temi osservati anche per altre lingue: intelligenza artificiale e cambiamenti climatici.

Continua a leggere   >>

Intelligenza artificiale, sciatteria reale

In un lungo articolo intitolato Cosa sono gli otoliti: perché si “spostano” e qual è la cura le stesse informazioni vengono ripetute più volte, con minime variazioni. I sospetti che il testo sia stato prodotto automaticamente con un sistema di intelligenza artificiale generativa (come ad es. ChatGPT) e poi pubblicato senza alcun intervento umano aumentano quando si incontra la frase evidenziata: La manovra di Dix-Hallpike per riposizionare gli otoliti Un altro modo per scrivere questo testo è: Per verificare la presenza di otoliti nei canali semicircolari dell'orecchio, si può eseguire il test di Dix-Hallpike.

Questo invece è uno dei vari esempi di informazioni ripetute che si differenziano solo per minimi dettagli:

  • Gli organi otolitici reagiscono soprattutto ai cambiamenti di movimento orizzontale (utricolo) o di accelerazione verticale (sacculo), a seconda del loro orientamento.
  • A causa del loro orientamento nella testa, gli organi otolitici sono sensibili, in particolare, al cambiamento nel movimento orizzontale (utricolo) o all’accelerazione verticale (sacculo).

Continua a leggere   >>

Cos’è una “parola dell’anno” e come viene scelta

immagine che illustra le parole dell’anno di dizionari di lingua inglese

Ogni anno in questo periodo vari dizionari, associazioni o istituzioni del mondo anglofono annunciano una word of the year, conosciuta informalmente con l’acronimo WOTY.

Associamo la tradizione delle parole dell’anno all’inglese ma in realtà ha origine in Germania negli anni ’70 del secolo scorso e poi è stata ripresa in vari altri paesi. In Italia c’è stato qualche tentativo poco riuscito per l’italiano e di solito i media si limitano a rilanciare le parole inglesi, con vari fraintendimenti che tradiscono scarse conoscenze linguistiche.  

Word of the year, non solo parole!

Innanzitutto va chiarito cosa si intende con “parola” (word), che in questo contesto è un concetto piuttosto ampio. In inglese word of the year può essere un sostantivo, un verbo, un aggettivo, un pronome (they nel 2019), un suffisso, un acronimo, un hashtag, un’espressione, un modo di dire, un gioco di parole, una frase (my pronouns are… nel 2019), un eufemismo, o anche un’emoji (😂 nel 2015). 

Continua a leggere   >>

Intelligenza artificiale in breve: IA o AI?

È iniziata la stagione delle parole dell’anno e il dizionario britannico Collins per il 2023 ha scelto AI, acronimo di artificial intelligence:

Immagine con definizione: AI, “abbreviation for artificial intelligence: the modelling of human mental functions by computer programs”

Un’AI e due artificial intelligence

La definizione usata per la parola dell’anno (immagine qui sopra) evidenzia una peculiarità dell’abbreviazione AI che nell’uso contemporaneo la differenzia dalla forma estesa: è usata quasi esclusivamente solo in una delle due accezioni che invece ha la locuzione artificial intelligence, qui nelle definizioni di Collins Dictionary* online:

1 the modelling of human mental functions by computer programs  

2 the study of this

Il significato prevalente e più recente di artificial intelligence, 1, indica la riproduzione e l’imitazione di funzioni mentali umane da parte di sistemi informatici, un insieme di funzionalità, procedure e prestazioni. È questa accezione che nella forma abbreviata AI è stata scelta come parola dell’anno.

L’espressione artificial intelligence nasce però nel 1956 con un altro significato, inizialmente unico, 2, di disciplina, settore di studio e di ricerca che si occupa di 1. A quanto pare per questa accezione si ricorre sempre meno all’acronimo AI, ormai associato per lo più a 1.

Continua a leggere   >>

Bing: intelligenza artificiale, domande poco reali(stiche)

Microsoft ha annunciato un aggiornamento delle funzioni di ricerca basate su intelligenza artificiale del proprio motore di ricerca Bing, che ora ricorre a GPT-4, versione più avanzata di Chat GPT.

Sarei curiosa di sapere se anche la localizzazione italiana della pagina di presentazione è opera dell’intelligenza artificiale. Ho infatti qualche perplessità su alcuni degli esempi che dovrebbero invogliare gli utenti italiani a ricorrere a Bing.

Schermata “Presentazione del nuovo Bing. Fai domande reali. Ottieni risposte complete. Chatta e crea.” con esempi: 1 Crea un gustoso menu di 3 portate; 2 Aiutami a trovare un animale di compagnia; 3 Scrivi un poema in rima; 4 Mi serve aiuto per pianificare la battuta di pesca.

Microsoft afferma “Grazie a questa serie di funzioni basate sull’intelligenza artificiale, è possibile: Fai [sic] una domanda vera e propria”. Gli esempi che ho riportato qui sopra mi sembrano invece poco realistici.

Dubito infatti che un parlante nativo italiano alla ricerca di ricette opterebbe proprio per le parole gustoso menu (scelta e posizione dell’aggettivo), o che cercherebbe un cane o un gatto, indifferentemente, descrivendolo come animale di compagnia, o che si rivolgerebbe a un bot con mi serve aiuto. E non credo che pianificare una battuta di pesca sia un’attività comune in cui ci si identifica facilmente.

Continua a leggere   >>

Proctoring e altre parole per esami con l’inganno

Reperti storici dalla Cina:

tweet con foto di reperti cinesi e testo Tools for cheating on the Chinese imperial civil service examinations--from the Qing Dynasty (1644-1911): cheat book, cheat vest, and cheat socks.

Bigliettini

Le locuzioni evidenziate – cheat book, cheat vest e cheat socks – hanno come modello cheat sheet, il nome usato in inglese americano per i bigliettini pieni di informazioni essenziali, scritte in caratteri minuti, che sono usati di nascosto agli esami (cfr. crib sheet nell’inglese britannico: crib è un verbo informale che vuol dire scopiazzare o plagiare; il sostantivo può essere anche un bigino).

In italiano i bigliettini hanno più nomi: sono usati vari geosinonimi tra cui bigino, pizzino, copietta, cartuccia, foglietto, rionetta (fonte: @latraduzionedim). Ma ancora più numerosi e fantasiosi sono gli stratagemmi a cui si ricorre per copiare durante compiti in classe ed esami!

Continua a leggere   >>

Algocrazia

immagine da IEET.orgConoscete già il concetto di algocrazia, il “potere degli algoritmi”?

Ha origine negli Stati Uniti: il termine algocracy è apparso nel 2006 in Virtual Migration, un libro di A. Aneesh che descrive sistemi di governance informatizzati dove è il codice (algoritmi) che determina, organizza e vincola le interazioni umane con quei sistemi.

La parola è formata da algo, abbreviazione informale di algorithm, e dall’elemento formativo –cracy, che in inglese può essere combinato con parole di qualsiasi origine.

Aneesh ha usato il concetto di algocracy e l’aggettivo algocratic per descrivere nuove tipologie di lavoro nell’economia globale. A differenza della burocrazia, intesa come il potere amministrativo basato su leggi e regolamenti ed esercitato da una gerarchia, l’algocrazia si avvale del codice e della sua programmabilità per creare modalità di lavoro dove si può agire solo come previsto dagli algoritmi, riducendo così la necessità di supervisione e controllo.

Continua a leggere   >>

Computer e linguaggio naturale: IBM Watson

Watson è il nome di un supercomputer di IBM che combina tecnologie avanzate di elaborazione del linguaggio naturale, analisi dei dati, information retrieval, rappresentazione della conoscenza e apprendimento automatico.

Sfrutta una tecnologia sviluppata da IBM, DeepQA, un sofisticato sistema di Question Answering che riesce a comprendere ed elaborare domande in linguaggio naturale e formulare risposte precise, proprio come farebbe una persona.

Analizzare una frase e capirne complessità, ambiguità, riferimenti culturali, informazioni implicite, ironia, giochi di parole ecc. è un’attività normale per un umano ma complessa per un computer (l’esempio classico e più banale di ambiguità è “Marco guarda la ragazza con il cannocchiale”: noi possiamo desumere facilmente dal contesto o da altri dati chi ha lo strumento ma per il computer è più difficile arrivare alla conclusione corretta).  

Continua a leggere   >>