人形機器人井噴前夜|優必選秦文龍:人形機器人大規模量產就看近2、3年
人形機器人發展到現在,進廠打工正在成爲現實。優必選的Walker S已走進比亞迪(002594.SZ)、蔚來(09866.HK;NIO.US)、東風柳汽的汽車智能工廠,在流水線上與人類協作完成裝配、質檢等任務。
“人形機器人在快速發展階段,從0到1是很快的,但它從實驗室模型到工廠應用這一步必須走好。工廠需要的是成熟、穩定的產品,而非實驗室級別的原型機。”優必選科技副總裁、研究院執行院長焦繼超在接受媒體採訪時如此表示。
優必選科技運動控制算法高級工程師秦文龍在接受紅星資本局專訪時談到,數據積累在人形機器人發展上是一個重要共識。他認爲人形機器人從小規模量產跨越到大規模的時間,或將發生在近2、3年裡。
人形機器人更多聚焦於工業場景
仍需積累大量數據
紅星資本局:優必選人形機器人的場景推進進展如何?
秦文龍:現在是POC(概念驗證)階段,所有機器人進入到真實的車廠,完成實訓任務,爲將來大規模落地做前期準備。這階段我們會和客戶一起商定一些場景,比如搬運、質檢、分揀等,確定場景後我們在內部做技能開發與聯合調試,測試通過後進入車廠完成POC。一輪結束後我們會評估實施效果,再判斷下一輪POC的實施方向。我們POC的最終目的是積累實訓技能,爲批量落地交付進廠做準備。
現在我們更多聚焦工業,這種偏結構化的場景更適合於人形機器人現階段落地,工作範圍、任務內容都是相對確定的。家庭場景的環境還是相對複雜,不管是家務,還是跟家庭成員間互動,對機器人要求很高。
紅星資本局:在技術上有哪些共識?大模型爲人形機器人帶來哪些變量?
秦文龍:人形機器人現在技術上基本有比較明確的路線,就是要積累大量數據,具身智能強調通用性。實現通用性就需要大量數據,要讓人形機器人自己學會技能。
數據對於人工智能是重要的,對人形機器人也一樣。我們將深度學習、模仿學習、強化學習這些方法,應用到人形機器人身上,已經展現出技能泛化的效果,比如抗干擾的能力、拆解任務的能力。但現在的機器人的技能學習還處於初級階段,因爲人類在做這件事情的時候還是很複雜的,所以後面還是需要繼續積累大量數據,讓人工智能的scaling-law也映射到人形機器人上面去,實現智能水平的顯著提升。
大模型帶來的變化一個是交互能力很明顯,另外一個就是任務拆解。原先沒有大模型的話,機器人每一步做什麼需要預編程。現在大模型充當了一個很好的大腦的角色,做任務的拆解,去和人做一個交互。人形機器人智能水平的發展,將隨着人工智能、大模型的技術發展同步前進,這兩個技術是強相關的。
紅星資本局:各個場景間的技術和經驗是否是一通百通?
秦文龍:各個場景之間的轉換,模型變化上沒那麼大,更多還是數據,比如工業場景,只採集了工業場景的相關數據,這時候訓練出來的就是一個工人;如果需要家政服務人員,那“喂”的數據就是和那個場景相關的。數據相對於模型更關鍵,模型本身具有一定的通用性,通過同一個模型,可以既訓練它成爲一個會打螺絲的工人,又可以訓練它成爲會做家務的保姆角色。
數據本身採集的過程不會很困難,但數據量的積累是需要時間的。一線數據肯定是最好的,我們內部也會在簡易場景、仿真場景去生成積累。但非常重要的一點是,你要很清楚人形機器人要用什麼場景中,你才能知道現在要收集什麼數據。
國內外人形機器人發展“齊頭並進”
國內企業有應用場景的優勢
紅星資本局:在工業場景的機器人很多,人形機器人能做什麼?
秦文龍:人形機器人區別於工業機械、協作臂的優勢就是通用性。現在我們只讓它打螺絲,或者只讓它搬運、只讓它質檢,但是本質上是可以一臺機器實現三個功能的。
我們去企業調研發現,汽車生產線有大量的焊接機器人、AGV(自動導引運輸車),但依然有大量工位需要人工來做,特別是有一些工作甚至要長時間站立或等待,目前工業機器人沒有辦法很好地完成這些任務的自動化,可能涉及到對現場做一定的改造,比如說要實現整個物流的自動化,需要對整個車間做改造,對企業來說是巨大的成本投入,也有很大風險。
要滿足通用性要求,要能快速部署對產線不做大量改造,這樣的工位,人形機器人就有優勢。人形機器人可以小規模先試點,快速看到效果。
人形機器人不是在跟現有的工業機器人、協作機器人去競爭,都有各自的適用範圍。對人形機器人而言,它是初期進入到工業落地的階段,還沒有到要“卷”的階段,大家還都在嘗試。
紅星資本局:我們看國內很多企業會對標特斯拉的擎天柱,在國際競爭上優必選有何優勢?
秦文龍:國外也是一個初期、技術驗證的階段,應用端我們國內有應用場景的優勢,我們有更多的製造企業。技術層面,我認爲更多是“齊頭並進”或者各有優勢,也不存在技術代差。特斯拉擎天柱optimus也只是把機器人放到了車廠裡面,做了一個分揀這樣的單獨動作。
人形機器人落地是很複雜的事,每家公司都是分階段在做,先是幾十臺、幾百臺的小規模、小批量,再到成千上萬臺的大規模。
對我們來說,不會所有的技能都去訓練。而是通過POC去了解客戶、場景和需求,需要什麼樣的技能,就去對應訓練。這樣再進階到下一個量產階段,兩個階段時間跨度在我看來可能也就2、3年。
國外和我們在這方面也是你追我趕,距離完成高水平的多任務、完成客戶的完整需求方面還有一定差距。
現階段,大家在應用場景上還並沒有完全聚焦,國內企業作爲最接近應用場景的一方,我們更需要抓住自己的優勢,更需要去聚焦找到場景。
紅星新聞記者 王田
編輯 鄧凌瑤