具身智能如何突破「遙操作」的數(shù)據(jù)桎梏?商湯聯(lián)合創(chuàng)始人王曉剛領(lǐng)銜的大曉機器人,交出顛覆性答卷——發(fā)布全球首個開源商業(yè)落地世界模型「開悟3.0」。
在通往AGI的狂歡中,圖靈獎得主Yann LeCun卻一直像個執(zhí)著的「反叛者」。
他不止一次給大語言模型(LLM)潑冷水,直言靠預(yù)測下一個字符的概率游戲,永遠無法觸及真正的智能。
他眼中的未來,屬于「世界模型」。
直到李飛飛團隊World Labs發(fā)布的Marble,當(dāng)大家親眼看到那個可以生成、互動且符合邏輯的3D虛擬世界時,LeCun描繪的圖景才終于具象化了。
為什么實現(xiàn)AGI需要世界模型
為什么我們?nèi)绱似惹械匦枰澜缒P停?/div>
因為基于大語言模型的AI在物理世界里,是個嚴重的「偏科生」。
現(xiàn)實數(shù)據(jù)的采集太苦、太慢了!
教會機器人認識一件紅衣服,換成綠色的它可能就「懵」了;
更別提那些極端場景——我們總不能為了訓(xùn)練自動駕駛,真去撞毀一千輛車吧?(還有更多低概率的corner case)
于是,一場圍繞物理世界的「數(shù)字重構(gòu)」悄然打響,并分化出三大戰(zhàn)場:
游戲VR虛擬世界生成:以李飛飛的Marble為代表;
自動駕駛:以特斯拉FSD為代表;
具身智能:這是當(dāng)下最火的方向,也是下個十年的AI的重心。
而第三個戰(zhàn)場——具身智能,則是目前最難啃的「硬骨頭」。
這個領(lǐng)域正撞上一堵看似不可逾越的「數(shù)據(jù)墻」。
長期以來,行業(yè)被迫依賴「遙操作」——讓人類穿戴設(shè)備手把手教機器人。