World Models, oltre la generazione video: Architetture, Training e Simulazione della Realtà

Data

Gio 19 Feb 2026

Descrizione evento

L’avvento di recenti modelli generativi video, quali Sora (OpenAI) e Gen-3 (Runway), ha segnato un punto di svolta nella sintesi di contenuti multimediali ad alta fedeltà. Tuttavia, interpretare tali sviluppi esclusivamente nell’ottica della produzione creativa rischia di sottostimare la portata strutturale dell’evoluzione in atto nel campo del Machine Learning: l’affermazione dei World Models.

A differenza dei Large Language Models (LLM), che operano mediante predizione probabilistica di token testuali, i World Models sono progettati per costruire una rappresentazione interna coerente delle dinamiche fisiche e spaziali. La capacità di generare sequenze video plausibili non costituisce il fine ultimo di tali sistemi, bensì la dimostrazione empirica dell’acquisizione implicita di leggi fisiche fondamentali quali causalità, inerzia, gravità e permanenza degli oggetti.

Questo webinar propone un esame tecnico, superando l’interesse mediatico per l’output visivo, al fine di analizzare le architetture sottostanti. Si esplorerà come tali reti neurali apprendano a simulare scenari futuri basandosi sull’osservazione di vasti dataset non strutturati.

Principali tematiche trattate:

  1. Evoluzione Architetturale: Analisi critica dei limiti degli attuali modelli generativi autoregressivi a livello di pixel e introduzione all’approccio JEPA (Joint Embedding Predictive Architecture) promosso da Yann LeCun (Meta). Si discuterà la transizione verso modelli che operano su rappresentazioni astratte nello spazio latente, ottimizzando l’efficienza computazionale e la capacità di ragionamento.
  2. Metodologie di Addestramento: Approfondimento sulle tecniche di Self-Supervised Learning, Tokenizzazione Spazio-Temporale e compressione delle informazioni. Verrà esaminata la distinzione tra la mera ricostruzione visiva e la comprensione semantica delle conseguenze di un’azione.
  3. Ambienti di Simulazione e Dati Sintetici: Il ruolo strategico dei motori fisici e degli ambienti virtuali interattivi (come evidenziato nel caso di Google Genie) nell’accelerare il training dei modelli, fornendo contesti fisici deterministici privi del “rumore” presente nei dati reali.
  4. Applicazioni Industriali Strategiche: Oltre la generazione video, si delineeranno gli impatti concreti per l’industria 4.0. In particolare, si analizzerà l’importanza dei World Models per il Sim-to-Real transfer nella robotica avanzata, per i sistemi di pianificazione nella guida autonoma e per la simulazione predittiva in ambito scientifico e farmaceutico.

Iscriviti

Per poter visualizzare tutti i dettagli e iscriversi all’evento, è necessario accedere o registrarsi.

Contattaci