IA con rigurgiti: falsi amici vs pappagalli!

Spunto per una discussione sul neologismo semantico inglese regurgitation nell’ambito dell’intelligenza artificiale generativa:

tweet da Ivo Silvestro: Un dubbio per @terminologia: come traduciamo “regurgitation” (quando una IA generativa ripropone tale e quale un contenuto su cui è stata addestrata), usato ad esempio da OpenAI nella loro presa di posizione?

Il riferimento è alle accuse del New York Times che ChatGPT, prodotto di OpenAI, anziché generare contenuti ad hoc darebbe risposte che riproducono letteralmente testo da articoli del NYT protetti da copyright.

OpenAI spiega che è un bug infrequente che stanno cercando di eliminare; è un comportamento anomalo che viene descritto come regurgitation:

Dalla risposta di OpenAI: “Regurgitation” is a rare bug that we are working to drive to zero. Our models were designed and trained to learn concepts in order to apply them to new problems. Memorization is a rare failure of the learning process that we are continually making progress on, but it’s more common when particular content appears more than once in training data, like if pieces of it appear on lots of different public websites. So we have measures in place to limit inadvertent memorization and prevent regurgitation in model outputs. We also expect our users to act responsibly; intentionally manipulating our models to regurgitate is not an appropriate use of our technology and is against our terms of use.

Regurgitation è un esempio di risemantizzazione di una parola del lessico comune che viene trasformata in un termine che designa un concetto particolare, qui nell’ambito dell’IA.

Regurgitation e regurgitate in inglese

Il nuovo significato di regurgitation non è specifico di OpenAI ma circola ormai da mesi. Non deriva da regurgitation nel senso medico di ritorno nella bocca degli alimenti non digeriti (in italiano rigurgito) ma rimanda invece al senso metaforico del verbo regurgitate.

In inglese regurgitate descrive negativamente un comportamento umano: significa ripetere a pappagallo idee, nozioni o informazioni senza avere capito granché, o addirittura nulla. Proprio come l’IA generativa quando riproduce meccanicamente ciò che ha “imparato a memoria”, parola per parola, anziché rielaborare i dati con cui è stata addestrata per dare nuove risposte (ma sempre senza avere idea del significato di quello che sta formulando).

Sono accezioni figurate che non sono condivise dalle parole italiane rigurgitare e rigurgito.

Rigurgitare e rigurgito in italiano

In italiano il verbo rigurgitare ha due forme:

  1. nell’uso intransitivo descrive il comportamento di liquidi e significa sgorgare con impeto, traboccare per eccessiva pienezza; in senso figurato di luoghi significa essere frequentato da un gran numero di persone (ad es. lo stadio rigurgitava di tifosi);
  2. nell’uso transitivo significa emettere dalla bocca cibo non digerito; in senso figurato può significare versare, mandar fuori con abbondanza (ad es. il treno rigurgitò centinaia di persone in stazione).

Il sostantivo rigurgito può indicare:

  1. fuoriuscita impetuosa di un liquido (ad es. di fogna);
  2. emissione dalla bocca di cibo non digerito.

    In senso figurato indica la ricomparsa improvvisa e spesso violenta di fenomeni negativi che si ritenevano superati, ad es. rigurgiti di nazionalismo.

In sintesi: regurgitate e regurgitation in inglese e rigurgitare e rigurgito in italiano condividono solo l’accezione medica ma non quelle figurate, e sono quindi potenziali falsi amici.

I “rigurgiti” dell’IA

In contesto IA, in italiano molti descrivono il bug di ChatGPT traducendo letteralmente regurgitation e regurgitated content, presumo perché ignorano che in inglese comunicano l’idea di una riproduzione meccanica, parola per parola, a pappagallo. Se non lo capiscono gli autori, è ancora più difficile che lo recepiscano i lettori. Alcuni esempi:     

Il problema è che ChatGPT rigurgita interi pezzi degli articoli e dei testi su cui è stata addestrata    Open AI ha adottato misure per limitare la memorizzazione involontaria e prevenire il rigurgito negli output del modello    l’output dei sistemi generativi è un rigurgito di fatti    OpenAI accusa il NYT di aver "manipolato i suggerimenti, spesso includendo lunghi estratti di articoli, al fine di far rigurgitare il nostro modello"    Il "rigurgito" è un bug raro che stiamo lavorando per portare a zero

Un neologismo italiano?

Che alternative si potrebbero usare in italiano? È preferibile operare una risemantizzazione di una parola esistente, come in inglese, oppure optare per  una formula descrittiva più trasparente? Quali caratteristiche della parola inglese vanno mantenute e a quali invece si può eventualmente rinunciare?

Non ho una risposta, però è stato molto interessante discuterne, e dalle reazioni al tweet citato all’inizio sono emersi vari spunti. Alcune proposte:

  • ripetere meccanicamente (e ripetizione meccanica), ma non ha la connotazione negativa che invece ha regurgitate;
  • [ri]sputare meccanicamente sottintende che non c’è stata alcuna “digestione”, ma mancherebbe un sostantivo corrispondente;
  • vomitare in senso figurato implica violenza, rabbia e grandi quantità, e quindi va escluso; l’alternativa rimettere non funzionerebbe perché ambigua (verrebbe interpretata come “mettere di nuovo”, e il sostantivo rimessa sarebbe ancora più ambiguo);
  • ripresentare è neutro e potrebbe far pensare a una rielaborazione consapevole (il contrario della ripetizione alla lettera);
  • scopiazzare / scopiazzatura indicano una copia fatta male, diversa dall’originale (e possono sottintendere consapevolezza dell’azione che si sta facendo, che l’IA non ha);
  • ripetere macchinalmente / ripetizione macchinale implicano in modo automatico e/o per abitudine, che non sono le caratteristiche di regurgitate (descrive un bug, che non è un automatismo ma un comportamento anomalo e imprevisto);
  • far riaffiorare / portare a galla / riemergere non comunicano l’idea della ripetizione a pappagallo;
  • pappagallare è un neologismo efficace in un contesto informale ma non funzionerebbe in tutti i registri.
  • pedissequare / pedissequamento potrebbero essere dei neologismi ottenuti con un uso disinvolto di suffissazione; avrebbero il vantaggio di unicità e di sufficienti trasparenza e rappresentatività, con una connotazione critica che in parte riprodurrebbe quella negativa originale, però avrebbero poche probabilità di affermarsi perché sarebbe difficile farli circolare.

Se avete osservazioni su queste proposte o ne avete di nuove, i commenti sono aperti!


Alcune indicazioni a cui si deve prestare attenzione nel lavoro terminologico e nella ricerca di alternative italiane a neologismi inglesi:


8 commenti su “IA con rigurgiti: falsi amici vs pappagalli!”

  1. Mauro:

    Non sono d’accordo sul fatto che “pappagallare” non funzionerebbe. Credo invece che funzionerebbe bene in ogni ambito (lo rifiuterebbero solo gli snob, non gli esperti, della lingua).

  2. Licia:

    @Watkin, @Mauro, del tutto d’accordo con voi che sono soluzioni trasparenti e facilmente comprensibili, soprattutto ripetere a pappagallo che è inequivocabile. Funzionano molto bene con il verbo, meno con il sostantivo: ripetizione a pappagallo è un po’ lungo e artificioso, per il neologismo pappagallare ci sarebbe pappagallismo, il cui significato prevalente però è quello di comportamento maschile verso le donne.

    Va anche tenuto conto che in italiano in ambito informatico e tecnologico, e per riflesso anche in altri ambiti “tecnici”, c’è la tendenza ad evitare metafore riconducibili esplicitamente a esseri viventi o loro comportamenti, o soluzioni percepite come troppo informali o regionali, come ad es. ripetere a pappardella.

    La soluzione perfetta non esiste, per questo è utile valutare i pro e i contro di ciascuna opzione per decidere quella più adatta. In Windows 8: da charm ad accesso un vecchissimo esempio di una funzionalità abbandonata da anni ma che mostra come si possa ricorrere a strategie denominative diverse per lo stesso concetto. 

  3. Licia:

    @Ivo intanto noi abbiamo provato a farlo circolare!

    @Marco, questo commento però non è molto utile se non si spiega perché.

  4. Nicola Annunziata:

    A me sembra preferibile mantenere i calchi dei termini inglesi, cioè rigurgito e rigurgitare. La risemantizzazione di parole italiane che le forza ad assumere significati dei termini inglesi simili è, nei tempi recenti, un fenomeno piuttosto frequente nella nostra lingua, piegando i falsi amici a divenire amici se non veri almeno verosimili. Per esempio, anche le riviste mediche sono piene di “severo” usato al posto di grave e tanti altri esempi sono messi in rilievo da questo blog. Non mi sembra pertanto uno sforzo produttivo voler evitare il calco in una situazione come questa, dove il nuovo significato figurato non sarebbe così lontano dall’accezione medica, cioè di tirar fuori e riproporre materiale non digerito.

  5. Licia:

    @Nicola, grazie per questo commento, che mi fa capire che non sono riuscita a spiegarmi chiaramente. Ci riprovo.

    La risemantizzazione è un meccanismo molto produttivo che nel blog ho descritto molte volte, in particolare quando una parola del lessico comune viene usata per designare un concetto particolare in un linguaggio speciale (post con tag terminologizzazione).

    In gran parte dei casi il nuovo significato attribuito per risemantizzazione è metaforico: si basa su un’analogia trasparente o comunque intuitiva tra il significato originale 1 e quello nuovo 2. Nel passaggio da una lingua all’altra lo stesso meccanismo è efficace se c’è un rapporto equivalente tra 1 e 2, altrimenti ne risultano neologismi semantici opachi in cui viene perso il riferimento. Concordo che il caso di falsi amici che si impongono con l’uso diventando verosimili è sufficientemente comune, tanto da avere un proprio nome: prestito camuffato, come ad es. salvare in informatica (da save che in inglese rimanda all’idea di mettere da parte, preservare o conservare per uso futuro, assente in italiano prima che si imponesse il calco). Credo però che nel caso di nuovi concetti  sarebbe auspicabile evitare i prestiti camuffati, operando scelte più ragionate e trasparenti.

    In inglese regurgitate dal senso originale 1 (ritorno nella bocca degli alimenti non digeriti) era stato già da tempo risemantizzato in 2 (ripetere a pappagallo, l’accezione prevalente nel lessico comune). Il neologismo semantico nell’ambito dell’intelligenza artificiale 3 è una risemantizzazione di 2 (e non di 1).

    In italiano però per rigurgitare non abbiamo accezione 2 , e per questo ritengo che una risemantizzazione di 1 che rimanda all’accezione medica sia fuorviante (anche perché nel rigurgito il cibo non è digerito ma è comunque trasformato: non è tale e quale a quanto è stato ingerito). So anch’io che il caso più probabile è che si affermi comunque, però almeno qui stiamo provando a capire se sia effettivamente la scelta migliore.

Lascia un commento L' indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *.