特斯拉Robotaxi發佈後,具身智能話題再引熱議,涉及三大技術派
近日,特斯拉舉辦了名爲"We,Robot"的發佈會,正式揭開了Robotaxi的神秘面紗。在發佈會上,特斯拉CEO埃隆·馬斯克展示了一款專爲自動駕駛設計的全新車型——Cybercab。
據瞭解,Cybercab預計將依賴特斯拉的全自動駕駛(FSD)軟件,可能包括攝像頭和激光雷達技術。此外,在該場發佈會上,特斯拉還展示了一個專門的打車APP,用於召喚和支付Robotaxi服務。
在自動駕駛業界,FSD頗爲知名。一位行業從業者稱,國內自動駕駛系統較之還有差距。此輪公開展示,讓人們對自動駕駛引導具身智能的未來展開了想象。
數科星球DigitalPlanet認爲,FSD下的自動駕駛除駕駛技術高超外,在未來的人形機器人和具身智能領域也可能實現突破。
爲此話題,我們找到了國內的一些頂級企業,並就此問題展開了深入討論。多位企業高管或CEO表示,已經做好了和特斯拉"一起卷"的準備。
雖然對手強大,但幾派掌門仍有勝券在握。
01 Sora派崛起前的靜默
其實,不論是具身智能還是自動駕駛,根本上是機器對3D物理世界的理解。可以說,哪種技術能理解真實物理世界、進而進行決策,誰就有可能拿到具身智能的最終入場券。
原理上,在實現決策之前,只有通過精確地感知和理解周圍的環境,機器才能做出準確的決策並執行復雜的任務。
以目前的技術而言,或有三種方向有望成爲未來的佼佼者。
其一是以Sora爲代表的文生視頻派。其想在機器人植入"腦"。
視頻由一系列幀組成。這一派所秉持的,是讓機器人學習連續的圖像,並從中獲得關於物體和環境隨時間變化的豐富信息用以加深機器人的理解。
這一派的貢獻可能是,讓機器人可以在未來具備學習多種操作任務和在多種環境中泛化的潛能。
國內某家頂級的文生視頻公司對數科星球DigitalPlanet進行了獨家回覆。其科學家稱:"本質上這是一個雞生蛋、蛋生雞的問題,要讓機器人更聰明,就要部署更多機器人獲取數據,難點是推動飛輪效應的第一個動力在哪裡。"
他和他的團隊認爲,文生視頻是解決上述問題唯一的路。"我們所說的具身智能所面臨的問題,比汽車這種限定場景更爲複雜,你可以理解成,他們是大數據集裡的一個子集,"他補充。
這家公司解決的方案是,先通過視頻網站採集數據,然後通過視頻生成結果反饋到具身智能中,而通過力學採集、自動駕駛(雷達波)採集數據要在之後作爲補充。
在數科星球DigitalPlanet的再三追問下,其表示,最晚將在明年的此時公佈和Robotaxi差不多量級的產品發佈。而當下,各家文生視頻公司還處在"蓄力憋大招"的階段。
但好消息是,Sora派已在嘗試將AI大腦植入至機器人中。直到此文寫作之時,對方表示"已經在小數據集中形成了物理規律的學習"。"這一點,你可以在AI遊戲的進展中得知,別的就不方便透露了",這位企業家稱。
他的預期是,遊戲的scaling law(規模法則)既已完成,就預示着已經有了在大規模數據集中部署的可行性。
對於在機器人中植入"腦",已經很近了。
02 高精度物理模擬派
其二是以英偉達爲代表的,在虛擬環境中測試和優化機器人的技術派。他們規定了機器人的行爲動作。
因爲,CUDA有着優秀的並行計算能力,可提供高精度的物理模擬,可以讓編輯好的行爲部署到現實世界中。在英偉達衆多算法框架中,多種產品可以作爲機器人動作生成工具。
其中,例如在Omniverse平臺,提供了逼真的物理模擬,這對於訓練機器人理解3D物理世界有所幫助。這一派的優勢是,可以通過模擬不同的環境和情況,讓機器人可以在沒有實際風險的情況下學習和適應。
不過,這一派別極其依賴高質量的3D內容庫。
在數科星球DigitalPlanet此前分析中,對比GPT所依賴的高質量文本數據語料,高質量的3D內容存量僅僅爲前者的1/1000,大量數據並未公開且獲取難度大。
也因此,英偉達走上了構建3D市場和數字資產庫、與其他數據庫合作和利用AI生成3D內容的道路。
不過,以一些國內相關公司的進展來看,這條路似乎並不順暢。"一些項目開始做定製項目了,這似乎代表着其商業潛力沒得到應有的開發、或是僅此而已了",一位投資人稱。
在基於數據生成特定動作方面,還需觀察。僅以目前所掌握的情況而言,其作爲鮮有服務型機器人的升級版未來可期,但做到極度神似真人,還尚需時間。
03 自動駕駛、車路雲協同派
其三是自動駕駛、車路雲派。他們影響着機器人的"場"。
應該說,Robotaxi的具身智能發展方向有着代表性意義。一位資深從業者回答數科星球DigitalPlanet:"目前特斯拉FSD進入中國市場,幾乎已成爲確定性事件,而這個變局的影響纔剛剛開始。"
可以預計的是,FSD將成爲鮎魚,再次發生攪動效應。
在特斯拉發佈會中,幾個要點頗爲重要:
其一是,特斯拉的數據訓練規模龐大,據稱有數百萬車隊在做測試和收集數據;其二是,因技術同源性,其電池、電力電子系統、先進的電驅系統、軟件系統、人工智能計算機,都適用於人形機器人;其三是,特斯拉預計將來實現量產的人形機器人成本大約2萬到3萬美元,可能比一輛車還便宜。
我們得到的資料顯示,此機器人"可以當老師、照顧小孩、遛狗、修剪草坪、購物、幫你倒酒水飲料等等。"
所以,幾乎是在一瞬間,自動駕駛走向具身智能的通路被打開了。
元戎啓行CEO周光稱,"我們正在基於端到端模型和Thor芯片研發VLA模型",據瞭解,VLA(視覺-語言-動作)模型旨在使機器人能夠理解視覺信息、語言指令,並據此執行相應的動作。該公司率先提及VLA概念,並因此得到了發展先機。
結果是,在這家公司所引導的具身智能已初步具備"智慧"。比如,在一些潮汐路段,碰到堵車時,車輛堵着後面的車,自動駕駛系統會自動"向前挪一挪"。這被認爲是,系統已初步具備了少許智慧。
在這一派別的競爭中,核心點仍然是擁有海量的數據。
周光稱:"特斯拉未必能成爲破局者。"他給出的理由是,FSD入華需要一定時間進行本土化的訓練適配,國內主機廠仍具有一定的本土化優勢。他認爲,一旦智能駕駛系統在消費市場迅速鋪開,以這家公司爲例的本土廠商所獲得的數據量會大大提升,屆時與特斯拉的技術差距會逐漸縮小。
除了端到端,智能網聯的問題也尤爲重要。
中國工程院院士國家智能網聯汽車創新中心首席科學家李克強認爲:"FSD做的實際上是車雲協同,而在這個過程中車路雲一體化纔是自動駕駛的終極。"(CICV大會)
蘑菇車聯的內部員工提及,可以將具身智能看作智能體。在未來,當智能體變多之時,不同智能體之間的協同問題將會水漲船高。
在智能體變得越來越多的時候,協同問題或將成爲具身智能發展的關鍵。爲了解決這個問題,蘑菇車聯的方案是"通過建立‘通感算’網絡體系,爲車輛(自動駕駛車輛、非自動駕駛車輛)以及各種智能設備(機器人、無人機等)提供系統級實時數字孿生服務。"
他們還預估,未來將出現兩套網絡,"天網"由衛星系統構成,而"地網"就是車路雲網絡。原理是,智能體需要接入車路雲網絡,因爲車路雲網絡可以在系統級層面解決羣體安全、羣體效率與羣體博弈問題。
蘑菇車聯副總裁呂斌認爲,類似智能車這類"單點智能"場景會向着系統智能的方向進化。
目前,據數科星球DigitalPlanet所知,蘑菇車聯車路雲一體化項目已在北京、上海、深圳、天津、四川、遼寧、湖南、雲南、山東、湖北等多地實現落地運行。
當然,這也爲具身智能的大面積應用做好了充分的鋪墊。
結尾:Sora裝腦、Omniverse裝四肢、自動駕駛和路網雲做場,已構成一場關於自動駕駛和具身智能的新角鬥場。
數科星球DigitalPlanet看到,新的爭奪已悄然開始。而在FSD進入中國市場前夜,"自動駕駛三大家"之一的蘿蔔快跑等企業已摩拳擦掌,靜待競爭來臨。
作爲完全對標Robotaxi的企業,自2021年以來已在包括北京、上海、廣州、深圳、重慶、武漢、成都、長沙、合肥、陽泉、烏鎮在內的全國11個城市開放載人測試。
目前,國內的無人車已在成本方面有着巨大優勢。而其他自動駕駛公司也已在快速地跑馬圈地。
各路"神仙"似乎已在躍躍欲試。
在不遠的將來,街上遍佈人形機器人的情形將不會遙遠。可以確定的是,在這個過程中,國產Sora、3D大模型、自動駕駛、無人車和車路雲企業將爲此不遺餘力。
這勢必是一場激烈的戰鬥。