在大家震驚Sora生成視頻逼真之余,谷歌緊隨其后推出了更為驚人的全新AI基礎(chǔ)世界模型——Genie。Genie是一個生成式交互環(huán)境,由時空視頻分詞器、自回歸動力學(xué)模型和簡單且可擴(kuò)展的潛在動作模型組成,擁有110億個參數(shù)。

與以往只關(guān)注世界生成的模型不同,Genie允許用戶與創(chuàng)建的環(huán)境進(jìn)行交互,通過文本、合成圖像、照片甚至草圖生成可玩的交互式環(huán)境和可控虛擬世界。這代表了生成式人工智能的重大進(jìn)步,為人工智能在虛擬世界中展現(xiàn)出無限可能性。

OpenAI和谷歌在AI領(lǐng)域的競爭激烈,Sora和Genie都致力于從視覺模型的角度模擬物理世界,實現(xiàn)通用人工智能。有趣的是,它們都采用了Visual Transformer模型,但訓(xùn)練數(shù)據(jù)的選擇不同。

Sora采用了分布式訓(xùn)練,將訓(xùn)練任務(wù)拆分成多個子任務(wù)并在多個節(jié)點上并行執(zhí)行,以提高訓(xùn)練速度。同時,Sora還采用了數(shù)據(jù)并行和模型并行的策略,使訓(xùn)練更高效。

Genie則在大量公開的互聯(lián)網(wǎng)視頻數(shù)據(jù)集上進(jìn)行了無動作標(biāo)簽的訓(xùn)練,可以將任何圖像轉(zhuǎn)換為簡單的2D平臺游戲。最獨特的地方在于,Genie可以通過無監(jiān)督學(xué)習(xí)理解游戲世界中角色的移動、控制和行動,并根據(jù)用戶操作預(yù)測未來幀,創(chuàng)造出功能性和可玩性的體驗。簡而言之,Genie具備了“自學(xué)成才”的能力。


Genie的問世證明了通過AI構(gòu)建虛擬世界已經(jīng)非常接近,AI通過視頻的自我訓(xùn)練可以學(xué)習(xí)到真實世界的物理規(guī)則,為AI在虛擬世界中的應(yīng)用帶來了更多可能性。這一進(jìn)展將對虛擬環(huán)境的發(fā)展和應(yīng)用產(chǎn)生深遠(yuǎn)影響,推動人工智能技術(shù)在游戲開發(fā)等領(lǐng)域的應(yīng)用和創(chuàng)新。

盡管AI在生成游戲方面取得了顯著進(jìn)展,但目前仍需要人類的輔助。雖然AI能夠理解并生成游戲的基本框架和規(guī)則,但深度的游戲設(shè)計、角色設(shè)定和劇情構(gòu)建等方面仍需要人類的創(chuàng)造力和策劃能力。人類設(shè)計師可以根據(jù)市場需求和玩家偏好,制定詳細(xì)的游戲設(shè)計方案,并為AI提供明確的指導(dǎo)和限制。

在游戲開發(fā)完成后,大量的測試和調(diào)試工作是必不可少的,以確保游戲在各種情況下的穩(wěn)定性和可玩性。這部分工作同樣需要人類的介入,因為AI可能無法覆蓋所有測試場景和異常情況。

AI在游戲開發(fā)領(lǐng)域有著廣泛的應(yīng)用前景。人類與AI的協(xié)作將成為未來游戲開發(fā)的重要趨勢,通過結(jié)合人類的創(chuàng)造力和AI的計算能力,可以實現(xiàn)更加創(chuàng)新和優(yōu)質(zhì)的游戲體驗。