Nei dispositivi mobili le funzionalità più note di riconoscimento vocale sono i comandi vocali* (voice commands), usati per eseguire una serie di azioni come aprire app, riprodurre brani musicali, comporre numeri di telefono o chiamare contatti (voice dialling).
(God / death calling <somebody> home è un’espressione idiomatica, ad es. until death called him home è una frase tipica da necrologi)
La “grammatica” dei comandi vocali
I sistemi di riconoscimento dei comandi vocali ricorrono a una “grammatica” che consente di riconoscere un numero limitato di parole e frasi specifiche per quel contesto e che spesso devono essere formulate seguendo una struttura predefinita. Ad esempio, per fare una telefonata potrebbe essere necessario dire, nell’ordine:
1 – chiama (call) o componi (dial),
2 – il nome della persona come appare nella rubrica,
3 – casa (home) o cellulare (mobile) se allo stesso nome sono associati più numeri (se non è specificato, il sistema potrebbe richiederlo).
Indicazioni per l’uso
Questi sistemi hanno parecchie limitazioni e per un uso migliore vengono dati suggerimenti che valgono per tutte le lingue, come ad es. scandire bene le parole e fare una breve pausa dopo ciascuna istruzione. Alcune indicazioni invece sono riconducibili alla “grammatica” di ciascuna lingua, ad es. Apple in Tips for using Voice Control (iPhone e iPad) per l’inglese sconsiglia di usare il genitivo: Avoid possessive names. Instead of saying "call Frank’s mobile" try "call Frank on his mobile" (il sistema di riconoscimento sente /ˈfræŋks/, che è una parola diversa da /ˈfræŋk/).
Localizzazione di esempi: traduzione e adattamento
Nella localizzazione dei suggerimenti si deve saper differenziare tra regole comuni (per semplificare, se fattibile le lingue simili hanno grammatiche simili) e regole “grammaticali” diverse. Penso possa essere interessante confrontare le traduzioni dell’esempio precedente nelle lingue neolatine, che non hanno il genitivo come l’inglese:
IT | Evita di pronunciare frasi come: "chiama il cellulare di Franco", scegliendo invece "chiama Franco al cellulare" |
ES | Evita las expresiones posesivas. En vez de decir "llamar al móvil de Frank", prueba con "llamar a Frank al móvil". |
FR | Évitez les articles et les prépositions. Au lieu de dire « appeler le portable de Frank », dites « appeler portable Frank ». |
PT | Evite palavras soltas. Em vez de dizer "ligar telemóvel Tiago", experimente dizer "ligar para o telemóvel do Tiago" |
Gli esempi per l’italiano e lo spagnolo funzionano se le relative grammatiche prevedono solo sequenze del tipo 1+2+3, ma sono irrilevanti se invece accettano anche 1+3+2. Il riferimento esplicito alla “forma possessiva” dello spagnolo mostra che è stato frainteso il tipo di problema descritto in inglese.
Gli esempi di francese e portoghese suggeriscono la sequenza 1+3+2 ma vengono date istruzioni opposte: evitare le parole funzionali in un caso, usarle sempre nell’altro.
Se si raffrontano gli esempi con le istruzioni dei manuali dell’utente di iPhone, si scopre che per tutte le lingue neolatine viene indicata solo la sequenza 1+2+3, senza parole funzionali, cfr. le descrizioni del comando di composizione vocale in inglese e italiano:
Non ho un iPhone e non ho modo di verificare, ma presumo che per questo comando vengano comunque riconosciute anche le varianti con le parole funzionali, e che quindi gli esempi per l’italiano e lo spagnolo siano validi.
In ogni caso, il confronto dei suggerimenti localizzati pare indicare che la frase inglese sia stata tradotta letteralmente e poi resa plausibile in ciascuna lingua, forse senza verificare che fosse congruente al 100% con istruzioni già esistenti e che rappresentasse un problema ricorrente e tipico della propria grammatica. Si nota anche che nessuna di queste lingue ha scelto altre possibili alternative: eliminare l’esempio perché non rilevante, oppure sostituirlo con un esempio completamente diverso e specifico per la propria lingua.
.
* Nota: i controlli vocali non vanno confusi con con gli assistenti personali come Siri (Apple) e Cortana (MIcrosoft), o con Google Now, che invece sono in grado di elaborare il linguaggio naturale.
Per un’introduzione alle grammatiche per il riconoscimento vocale: Speech Recognition Grammar Specification Version 1.0 (WC3) e Grammars Overview (Microsoft Speech)
.Striscia: Pearls Before Swine