Una voce lontana nell’intelligenza artificiale
Maboroshi Come sempre le nuove tecnologie si sviluppano in varie direzioni e alcune di queste sono spesso poco discusse in quanto poco «mediatiche»
Maboroshi Come sempre le nuove tecnologie si sviluppano in varie direzioni e alcune di queste sono spesso poco discusse in quanto poco «mediatiche»
Nella serie animata giapponese del 1973, Kyashan – Il ragazzo androide, a capo dei malvagi c’è Braiking Boss, un androide dagli atteggiamenti e dalle fattezze naziste. La sua voce, nella versione originale giapponese è quella di Kenji Utsumi, attore che nella sua lunghissima carriera – è scomparso nel 2013 – ha interpretato personaggi divenuti parte dell’immaginario popolare dell’arcipelago quali Raoul in Ken il guerriero o Alex Louis Armstrong in Fullmetal Alchemist, ma che ha anche prestato la voce nel doppiaggio giapponese a grandi attori americani, tra cui Jack Nicholson.
Alcuni giorni fa è stata resa nota la notizia che la voce di Utsumi è stata ricreata attraverso un programma AI per essere usata in una serie di audiolibri in vendita nell’arcipelago. Si è passati, quindi, da Utsumi e la sua voce data ad un’intelligenza artificiale cinquant’anni fa in Kyashan, alla sua voce creata da un’intelligenza artificiale nel 2023.
Il progetto è stato realizzato dalla CoeFont, un’azienda specializzata nella realizzazione di programmi capaci di sintetizzare voci. Assieme a quella di Utsumi, sono state usate anche le voci di due altri famosi attori e come prevedibile, la scelta ha sollevato più di qualche dubbio sugli aspetti etici ed economici della faccenda.
Il discorso sul ruolo dell’intelligenza artificiale e dei suoi usi e abusi nella società sta prendendo piede quindi anche in Giappone, dove se ne parla anche in programmi televisivi generalisti, in modi e con approcci diversi. Si tratta naturalmente di un tema vasto e articolato, la questione qui trattata però è abbastanza specifica ed è limitata alla ricreazione e all’uso della voce di persone scomparse e che erano famose in vita, in progetti commerciali e soprattutto se e come regolamentarne l’utilizzo. Già alcuni anni fa, nel 2019, aveva fatto discutere la decisione di usare un ologramma di Misora Hibari (1937-1989) una delle cantanti più amate nella storia del dopoguerra giapponese, per uno dei programmi televisivi più seguiti nel Sol Levante, la gara canora del Kohaku Uta Gassen che ogni anno incolla milioni di telespettatori alla tv la sera del 31 dicembre.
In quell’occasione, erano state ricreate non solo le fattezze della famosa artista, ma attraverso un programma di AI era stata composta una nuova canzone cantata dalla voce ricreata per l’occasione. Lo show, organizzato in occasione del trentennale della sua scomparsa, aveva scatenato non poche polemiche, alcuni musicisti definirono l’idea una blasfemia, le critiche si rivolgevano soprattutto all’aspetto visivo dello spettacolo, che toccava il perturbante, non tanto a quelle sonore.
Canzone e voce erano stati realizzati da Vocaloid, un sintetizzatore software sviluppato dalla Yamaha assieme all’Università Pompeu Fabra di Barcellona circa venti anni or sono e che negli ultimi decenni ha dato il la alla nascita di una vera e propria cultura Vocaloid, popolarizzata dalla figura di Hatsune Miku, affascinante fenomeno pop che incrocia molti degli asserti della teoria della convergenza culturale.
Come sempre le nuove tecnologie si sviluppano in varie direzioni e alcune di queste sono spesso poco discusse in quanto poco «mediatiche». Tornando ad esempio a CoeFont, l’anno scorso la compagnia aveva dato il là ad un servizio commerciale per ricreare, attraverso l’intelligenza artificiale, la voce di malati di cancro che hanno perso o stanno per perdere la loro voce. Il problema è che, come spesso accade, essendo iniziative private, chi ha accesso a queste nuove tecnologie è solitamente solo chi se lo può permettere.
matteo.boscarol@gmail.com
I consigli di mema
Gli articoli dall'Archivio per approfondire questo argomento