"Przedstawiamy GameNGen, pierwszy silnik do gier zasilany w całości przez model neuronowy, który umożliwia interakcję w czasie rzeczywistym z złożonym środowiskiem przy zachowaniu wysokiej jakości na długich trajektoriach. GameNGen potrafi symulować klasyczną grę DOOM w tempie ponad 20 klatek na sekundę na pojedynczym TPU. Prognozowanie kolejnej klatki osiąga PSNR na poziomie 29.4, co jest porównywalne z kompresją stratną JPEG. Oceny ludzkie pokazują, że osoby są tylko nieznacznie lepsze od przypadkowego zgadywania, gdy próbują odróżnić krótkie klipy z gry od klipów z symulacji.
GameNGen jest trenowany w dwóch fazach:
(1) agent RL (uczenia przez wzmacnianie) uczy się grać, a sesje treningowe są nagrywane, co tworzy dane do treningu modelu generatywnego (2) model dyfuzji jest trenowany do generowania kolejnych klatek na podstawie sekwencji poprzednich klatek i działań. Dodatkowe warunki wprowadzane do procesu trenowania umożliwiają stabilne generowanie autoregresywne na długich trajektoriach." Więcej: https://gamengen.github.io/
- 7 komentarzy
- 522 wyświetleń