Offerte in questo articolo

Nessuna offerta correlata trovata. Vedi tutte le offerte

Square Enix ha messo a punto uno strumento AI che supporta la generazione di lingue immaginarie, dinamiche e statiche

Tempo di lettura: 4 minuti

Dopo aver scoperto di avere un’improvvisa apertura nel mio programma al Game Developers Conference 2024, ho dato un’occhiata a uno dei display digitali che mostrava gli eventi del giorno. Un discorso al Machine Learning Summit ha catturato la mia attenzione: “Machine Learning Summit: Sintesi della parola fittizia per evitare il rischio nei contenuti generativi”. “

“Sintesi della parola fittizia?” Era interessante. Qualsiasi appassionato di fantasy degno del proprio sale sa quanto lavoro sia stato dedicato a lingue fittizie come l’Elvish ne Il Signore degli Anelli e il Klingon in Star Trek. È un progetto guidato dalla passione che porta a una grande costruzione del mondo. Square Enix sperava di utilizzare la tecnologia per impiegare in modo efficiente questa tecnica linguistica nei suoi numerosi giochi fantasy?

La risposta: non è chiaro. Il ricercatore di intelligenza artificiale Yusuke Mori non ha indicato se la sua ricerca fosse impiegata in una qualsiasi produzione di giochi attivi. Il talk era vicino a una presentazione accademica che esplorava la ricerca e le metodologie possibili per l’utilizzo della tecnologia, non lo sviluppo attivo.

Tuttavia, catturare un frammento del suo lavoro era intrigante. Quello che ha presentato non sembrava immediatamente utile per chi sperava di affrontare il Trono di Spade, ma assomigliava a una versione più raffinata del Simlish nel franchise The Sims o ai vari balbettii dei personaggi della serie Animal Crossing.

Ecco una rapida panoramica di ciò che Mori ha mostrato.

Lo strumento AI di Square Enix supporta la generazione di lingue dinamiche e statiche

Mori ha mostrato un paio di demo che spiegavano come la tecnologia potesse essere impiegata negli ambienti digitali. Il primo mostrava come lo strumento potesse essere utilizzato per tradurre la frase di apertura di Moby Dick di Herman Melville, il secondo mostrava come i giocatori potessero incontrare queste lingue in uno spazio 3D.

Nel primo, le parole “Chiamami Ismaele. Alcuni anni fa – poco importa quanto tempo precisamente – avendo pochi soldi in tasca e nulla di particolare che mi interessasse sulla terra ferma, pensai di fare un giro e vedere la parte acquosa del mondo “sono state pronunciate ad alta voce dallo strumento di testo in voce AI – ma l’unica parola che potevi distinguere era “Ismaele”. Mori ha invitato il pubblico a pensare a come suonerebbe Moby Dick in un mondo fantasy, letto ad alta voce da una persona che parla una lingua non proveniente dal pianeta Terra. I nomi propri sarebbero stati preservati, mentre ogni altra parola si sarebbe naturalmente adattata a quel mondo di gioco.

Ha mostrato tre iterazioni del testo fantasy, ciascuna più appositamente affinando le parole in una sintassi specifica, per garantire che non sembrasse “casuale”.

Nella demo successiva (renderizzata con asset 3D molto semplici), un giocatore si è avvicinato a un NPC che ha detto “Benvenuti nel nuovo mondo. Stiamo pianificando di stabilire la nostra città qui. “Poi si sono avvicinati a due altri NPC, che parlavano nella stessa lingua in una conversazione a due voci (Mori non è stato in grado di condividere esattamente cosa fosse stato detto).

La spiegazione successiva di Mori è stata leggermente confusa. Ha suggerito che se le parole apparissero in un modello coerente, i giocatori sarebbero stati in grado di dedurne il significato e tradurre eventualmente tutte le lingue nel gioco. Ha proposto piuttosto che le parole siano così randomizzate che “non ci siano risposte corrette” in modo che l’interpretazione del testo da parte di ogni giocatore sarebbe valida.

Attraverso la tecnologia, gli sviluppatori sarebbero in grado di scrivere testo nella propria lingua madre che viene automaticamente convertito nella lingua fantasy.

In realtà, non è del tutto corretto. Mori ha spiegato che alcune lingue erano più facili incorporare in questo sistema di altre. “È relativamente facile convertire testi giapponesi perché il testo include kanji, hiragana e katakana”, ha detto. “C’era un problema con le lingue scritte in un alfabeto [occidentale]”, ha detto.

Sembra che il testo scritto in inglese funzioni bene, ma il testo in francese e tedesco non si adatti perfettamente al sistema. Per l’orecchio non addestrato, non era facile distinguere quali fossero i problemi descritti da Mori.

Mori ha proposto una soluzione semplice: basta copiare il linguaggio da una lingua reale alla successiva, quindi inserirlo nello strumento.

Era difficile spiegare come funzionasse lo strumento, poiché era fondato sulla ricerca precedente di Mori sui “token” nella generazione di testo basata sull’apprendimento automatico.

Quali sono i rischi di questa tecnologia?

Mori è stato molto deciso nel discutere gli svantaggi derivanti dall’impiego di questa tecnologia. “I testi generici possono contenere contenuti dannosi”, ha riconosciuto. Non ha specificato se ciò si riferisse a messaggi odiosi che potrebbero emergere dalla bocca dei NPC, o se la tecnologia potesse erroneamente far uscire insulti se dati abbastanza tempo e variabili non controllate.

Sembra preoccupato che, sebbene le lingue fittizie possano essere coerenti, non catturerebbero il sistema grammaticale di come le lingue naturali si evolvono. La storia di una lingua e lo sfondo culturale del mondo non potrebbero essere generati con la stessa autenticità delle lingue reali.

Esiste anche la possibilità che, mentre i giocatori cercano di capire il significato della lingua, la interpretino al punto da trarre conclusioni errate su ciò che gli sviluppatori intendevano nel gioco.

“Come usarlo è molto importante”, ha sottolineato.

Quanto è affidabile questa tecnologia di lingua fittizia generata dall’IA?

Descrivendo la tecnologia con gli altri partecipanti intorno al GDC, sono stato regolarmente accolto da brontolii sulle sue applicazioni. Uno dei miei colleghi ha osservato che il processo elimina ciò che rende lingue come l’Elvish e il Klingon così ipnotiche: entrambe sono state create da esperti linguisti che potevano simulare alcune delle caratteristiche che la creazione di Mori manca.

C’è un altro elemento scomodo che parla di come gli attori vocali stiano lottando per proteggersi dal essere sostituiti da esibizioni vocali artificialmente generate.

La presentazione di Mori non era solo su come convertire il testo da una lingua parlata in una lingua fittizia, ma su come assemblare strumenti che rendessero possibile a un programma di lettura del testo di creare parole e regole di pronuncia al volo.

Ma interpretare come Square Enix avrebbe utilizzato questa tecnologia richiede un pizzico di autoconsapevolezza. Questo è fondamentalmente uno strumento per la traduzione artificiale e la traduzione dal giapponese all’inglese potrebbe aver influenzato il modo in cui i partecipanti al GDC hanno percepito il discorso di Mori. L’inglese non è la sua lingua madre, e potrebbero essere stati persi i dettagli sull’uso della tecnologia… beh, nella traduzione.

Sviluppatori di apprendimento automatico, ingegneri del suono e persino scrittori come me hanno qualcosa da guadagnare studiando i progressi di Square Enix con questa tecnologia. Se la generazione procedurale non riesce a superare i rischi descritti da Mori, forse un vecchio approccio umano alla generazione di lingue fittizie è ciò che garantirà un’esperienza molto migliore.

Game Developer e Game Developers Conference sono organizzazioni sorelle sotto Informa Tech.

Leggi di più su www.gamedeveloper.com

offerte in questo articolo

Nessuna offerta correlata trovata. Vedi tutte le offerte

Potrebbero interessarti