Rivoluzione nel gaming: GameNGen trasforma Doom in tempo reale

GameNGen genera oltre 20 fotogrammi al secondo sfruttando una singola tensor processing unit.
Il modello si basa su una versione modificata di Stable Diffusion 1.4, dimostrando un nuovo approccio alla grafica in tempo reale.
John Romero ha espresso scetticismo, ma GameNGen rappresenta un passo avanti significativo nella creazione di motori di gioco basati sull'IA.

Un team di ricercatori di Google e dell’Università di Tel Aviv ha presentato un’innovazione che potrebbe cambiare per sempre il modo in cui concepiamo i videogiochi: GameNGen, un modello di intelligenza artificiale capace di simulare in tempo reale il celebre sparatutto in prima persona Doom, risalente al 1993. Questo modello utilizza tecniche di generazione di immagini AI derivate da Stable Diffusion, tracciando una nuova strada per la sintesi di mondi virtuali.

GameNGen si distingue per la sua capacità di fungere da motore di gioco, sostituendo le tradizionali tecniche di rendering grafico con un approccio di “grafica in tempo reale immaginata”. Il modello, guidato dall’input del giocatore, prevede lo stato di gioco successivo basandosi su quelli precedenti, dopo essere stato addestrato su filmati di gameplay di Doom. Utilizzando una singola tensor processing unit, GameNGen è in grado di generare oltre 20 fotogrammi al secondo, dimostrando un’efficacia sorprendente.

Indice dei contenuti

Il Processo di Sviluppo di GameNGen

Ricevi gratuitamente le news che più interessano. Nessuno spam, puoi disiscriverti in ogni momento.

Nome

Cognome

Acconsento alla comunicazione dei miei dati a terzi affinché li trattino per proprie finalità di marketing tramite modalità automatizzate e tradizionali di contatto.

Il funzionamento di GameNGen è stato illustrato in dettaglio nel documento “Models Are Real-Time Game Engines”. Il sistema utilizza una versione modificata di Stable Diffusion 1.4, un modello di diffusione per la sintesi di immagini rilasciato nel 2022. Il processo di sviluppo di GameNGen si è articolato in due fasi principali. Inizialmente, i ricercatori hanno addestrato un agente di apprendimento per giocare a Doom, registrando sessioni di gioco per creare un set di dati di addestramento. Successivamente, hanno impiegato questi dati per addestrare il modello Stable Diffusion adottato.

L’impiego di Stable Diffusion ha presentato alcuni inconvenienti grafici. Durante le operazioni di compressione del modello, si è verificata la produzione di artefatti che hanno compromesso la leggibilità di piccoli dettagli, come la rappresentazione dell’HUD e della barra inferiore nel gioco. Un altro problema da risolvere riguardava la coerenza temporale delle immagini generate. I ricercatori hanno evidenziato che la simulazione di un “mondo virtuale” interattivo è un compito di complessità superiore rispetto alla generazione di un video veloce.

Cosa ne pensi?

😃 Questo progetto rivoluzionerà davvero il futuro del gaming......
😒 Sembra davvero difficile mantenere la qualità visiva costante......
🤔 E se questa tecnologia venisse applicata ai film interattivi......

Le Sfide e le Soluzioni di GameNGen

Il sistema si basa sulla generazione condizionata da un flusso di input disponibili solo durante la generazione, rappresentando uno scenario inedito per i modelli generativi attuali. Questo richiede un approccio creativo per evitare l’instabilità e il degrado del mondo generato nel tempo. Un concetto simile a quello dell’IA che si “cannibalizza”: gli artefatti grafici si accumulano nel tempo, portando il sistema a generare frame con più errori e incoerenze, nei casi peggiori a generare immagini completamente distorte.

I ricercatori hanno risolto questo problema aggiungendo intenzionalmente strati di rumore casuale e addestrando il modello a correggere il rumore. Questo approccio ha consentito di mantenere la coerenza visiva nei frame generati anche per periodi di tempo estesi. Sebbene GameNGen sia ancora in una fase embrionale e presenti una serie di limitazioni, rappresenta un “proof-of-concept” promettente.

Il Futuro di GameNGen e delle IA nel Gaming

GameNGen si inserisce in un filone di ricerca in rapida evoluzione. Il progetto si basa su lavori precedenti, tra cui World di Google (marzo 2023). All’inizio di quest’anno, un gruppo di ricercatori universitari ha addestrato un modello di IA chiamato “DIAMOND” per simulare videogiochi Atari utilizzando un modello simile a Stable Diffusion. GameNGen si avvicina alla ricerca sui “simulatori di mondo”, associati a modelli di sintesi video come Sora di OpenAI. Quest’ultima, durante la presentazione di Sora, ha mostrato video dimostrativi del generatore AI che simulava Minecraft, evidenziando le potenzialità di queste tecnologie.

John Romero, il papà di Doom, ha espresso scetticismo sull’uso dell’intelligenza artificiale per lo sviluppo di videogiochi, ma non si può negare che GameNGen rappresenti un passo avanti significativo. La capacità di creare un motore di gioco funzionante con logiche coerenti utilizzando esclusivamente l’IA è un traguardo unico nel suo genere. Gli esperti ritengono che GameNGen, unito ad altre ricerche come quelle del Caltech sulla generazione di mappe coerenti, potrebbe gettare le basi per lo sviluppo di futuri motori di gioco basati sull’intelligenza artificiale.

Bullet Executive Summary

GameNGen rappresenta una pietra miliare nel campo dell’intelligenza artificiale applicata ai videogiochi. La capacità di simulare Doom in tempo reale a 20 fotogrammi al secondo, utilizzando tecniche di generazione di immagini AI derivate da Stable Diffusion, apre nuove prospettive per lo sviluppo di mondi virtuali interattivi. Sebbene il sistema presenti ancora alcune limitazioni, il suo potenziale è innegabile.

La nozione base di intelligenza artificiale correlata a questo tema è il concetto di modelli generativi, che utilizzano dati di addestramento per creare nuove immagini o video. Un’ulteriore nozione avanzata è quella dei modelli di diffusione, che rappresentano un approccio innovativo per la sintesi di immagini e video, utilizzando tecniche di compressione e correzione del rumore per mantenere la coerenza visiva nel tempo.

In conclusione, GameNGen ci invita a riflettere su come l’intelligenza artificiale possa trasformare il mondo del gaming, offrendo nuove opportunità creative e tecniche per sviluppatori e giocatori. La strada è ancora lunga, ma le possibilità sono infinite.

Per approfondire:

Articolo e immagini generati dall’AI, senza interventi da parte dell’essere umano. Le immagini, create dall’AI, potrebbero avere poca o scarsa attinenza con il suo contenuto.(scopri di più)

Rivoluzione nel gaming: GameNGen trasforma Doom in tempo reale

Il Processo di Sviluppo di GameNGen

Le Sfide e le Soluzioni di GameNGen

Il Futuro di GameNGen e delle IA nel Gaming

Bullet Executive Summary

Ai e lavoro: l’automazione segnerà la fine dell’occupazione?

Chatgpt gratis per tutti: affare o rischio per il futuro dell’ai?

Come l’IA sta (per ora) fallendo nel rivoluzionare i videogiochi

Il Processo di Sviluppo di GameNGen

Le Sfide e le Soluzioni di GameNGen

Il Futuro di GameNGen e delle IA nel Gaming

Bullet Executive Summary

Articoli correlati

Chatgpt gratis per tutti: affare o rischio per il futuro dell’ai?

Come l’IA sta (per ora) fallendo nel rivoluzionare i videogiochi

Deepseek svela la sua arma segreta: llm più intelligenti?

Di tendenza

Ai e lavoro: l’automazione segnerà la fine dell’occupazione?

Chatgpt gratis per tutti: affare o rischio per il futuro dell’ai?

Come l’IA sta (per ora) fallendo nel rivoluzionare i videogiochi