Voce e Internet: rivoluzione controversa

Voce e internet: è iniziata la rivoluzione e non ce ne siamo nemmeno accorti.

Ormai possiamo dirlo: l’uso della voce per comandare gli apparecchi elettronici che ci circondano è diventato comune. I nostri smartphone e le nostre device traboccano di suadenti voci che ci risolvono problemi di ogni genere senza faci più toccare le macchine. Ma il binomio tra voce e internet è una rivoluzione dagli aspetti molto controversi che sta entrando nelle nostre vite senza nemmeno essere guardata da coloro che dovrebbero badare a regolamentarne l’uso e a disciplinarne lo sviluppo.

Il video di Soundhound che spiega la collaborative AI

Gli esemplari si moltiplicano.

Siri, Cortana, Ok Google, Alexa, Bixby, Robin sono solo alcuni nomi degli assistenti vocali pià conosciuti che ci circondano e riempiono l’aria delle nostre giornate. C’è perfino Hound, dell’azienda americana Soundhound, il quale risponde anche a domande multiple imparando da quello che sente. La Soundhound, più di tante altre, sta esplorando i confini della voce associata all’Intelligenza Artificiale per far diventare gli assistenti vocali sempre più responsivi alle esigenze dell’interlocutore. Tramite lo sviluppo di quella che loro chiamano una Collaborative AI, Soundhound si sta lanciando nel mercato dei servizi vocali con l’obiettivo, nemmeno tanto celato, di creare per ogni brand, per ogni azienda, per ogni cliente una voce che sia un marchio unico e inconfondibile.

Voce e Internet: quando le macchine del caffé ci parleranno

Quando potremo chiedere a voce un caffé alla macchinetta dell’ufficio, forse ci accorgeremo del mondo che si sta delineando. La voce ci servirà per avere tutto quello di cui abbiamo bisogno. Voce e Internet è il prossimo passo del web con le aziende già lanciate ad accaparrarsi il mercato e a normarlo con regole a proprio vantaggio ben prima che lo facciano i legislatori. Già, perché sappiamo bene che i microfoni ci ascoltano e lo fanno anche quando non dovrebbero. Ho sperimentato e raccontato in un pezzo che potete vedere sul blog di Sharingdaddy l’esperienza inquietante di sentirmi ascoltato da Ok Google.

E la nostra voce dove va? Dove viene conservata? Ho provato l’ebbrezza di cercare di cancellare le registrazioni vocali conservate dai server di Google e sono stato respinto con perdite. Dentro i complicati Terms of Service, infatti, ci sono tutta una serie di restrizioni per le quali la pretesa di cancellare le registrazioni conservate dai server di una tech company si scontra con le possibilità d’uso degli assistenti vocali. Insomma, ci stanno rubando la voce senza chiedere il permesso. Così come fanno con altri dati e le geolocalizzazioni.

L’inquietante ricerca dell’università di Montreal

Una deriva molto pericolosa.

Questo matrimonio tra voce e internet è dunque il prossimo El Dorado delle aziende tecnologiche. Ben inteso, le possibilità di limitare le registrazioni o di andare a cancellarle ogni tanto per non dare modo ai nostri assistenti vocali di imparare tutto il nostro vocabolario di vita, beh, ci sono. Ci vuole un pomeriggio per scovarle ma ci sono. Per Google, per esempio, le descrive efficacemente Davide Battisti nel suo blog Entropia. Per Alexa si può cancellare l’archiviazione di tutti i device in qualche meandro delle impostazioni dell’account Amazon, ma lei, al prossimo “Alexa” ricomincerà ad ascoltarvi. La deriva è pericolosa perché la voce è il primo elemento immateriale e non fisicamente costruito (come lo è la scrittura) con il quale compiamo operazioni anche importanti. E guardate qui sotto… si può clonare in un minuto.

Da questa ricerca è nata una startup chiamata Lyrebird nel 2017 che è stata acquisita dalla Descritp, azienda specializzata nel mondo del podcast che coniuga audio, video e testi in una Dashboard che può automatizzare diversi passaggi grazie alla Voice recognition guidata dall’intelligenza artificiale. Naturalmente questo mondo è già stato preso di mira dagli hacker e dai creatori di fake news con diversi video di personaggi pubblici ai quali sono state fatte dire cose mai pronunciate in realtà.

Ma c’è di più…

Le truffe vocali

Pensate alla vostra voce e pensate a quanti danni vi potrebbe fare qualcuno che la sappia clonare adeguatamente. Non ci credete? Ecco una storia inquietante… e anche già vecchia.

Disporre un ricco bonifico usando la voce finta del proprio capo

L’ad di una società energetica britannica ha ricevuto una telefonata dal Ceo del gruppo di cui fa parte, nella quale veniva chiesto di disporre un trasferimento di denaro a favore di un fornitore ungherese. Un caso di deep fake che sta facendo parlare gli esperti di intelligenza artificiale

La reticenza dei tech giant

La voce del boss ha ingannato completamente il Ceo e il bonifico è partito… In questo momento, quindi, è già pensabile che la vostra voce potrebbe essere usata contro di voi. Senza che nessuno si accorga di alcunché. Sono innumerevoli le azioni malevoli che potrebbero essere perpetrate. I cyber Voice attacks sono l’ultima frontiera dei truffatori. Intanto noi abbiamo la nostra voce in qualche server di Amazon chissà dove. Tra l’altro i tech giant come Facebook sono sempre stati reticenti nel commentare le accuse rivolte loro che le app avessero i microfoni aperti per ascoltare gli utenti anche quando non sarebbero dovuti essere spalancati. Comunque lo confermo per esperienza diretta: Ok Google si è attivato più volte senza motivo davanti a me e il 24 giugno 2020 Siri si è attivata mentre vedevo un telefilm su Prime Video con la parola “tempo” detta da uno dei personaggi.

Voce e Internet: questo matrimonio ci trasformerà e ci leverà qualcosa di importante.

Naturalmente l’ascolto è a microfoni aperti quando abbiamo il telefonino acceso e le app aperte o che stanno lavorando in background. Il problema, però, resta e nessuno lo ha affrontato. Le aziende tecnologiche, ormai più potenti dei governi, ci hanno già fregato ogni possibilità di riprenderci la voce, almeno fino a quando qualcuno si deciderà a normare il fenomeno. Il futuro che ci aspetta è legato a doppia mandata con l’interazione vocale tra macchina e uomo, tra voce e internet. Questo matrimonio ci trasformerà e ci leverà qualcosa.

Un video dello youtuber Neville aveva scatenato già qualche anno fa il dibattito contro Facebook un po’ troppo… ascoltatrice.

Ci leverà esattamente la capacità di scrivere perché l’altro grande tema è la digitazione vocale che, presto, non ci farà più toccare le tastiere, visto il livello di accuratezza al quale è arrivata. Questo potrebbe provocare dei problemi di analfabetismo di ritorno nei bambini che, una volta abituati alla Voice Interaction con la macchina non sapranno più scrivere nemmeno mamma con la penna sulla carta. Bisogna porre attenzione anche a questo risvolto e capire come agire per integrare la voce e internet in modo sicuro e responsabile.

Image by Engin Akyurt from Pixabay

Lascia un commento