訂閱
糾錯
加入自媒體

一場熱度空前的馬拉松,人形機器人在祛魅還是加速?

人形機器人真正走到我們身邊,大概還需要10年左右。

文|趙艷秋 游勇

編|周路平

北京亦莊的一場人形機器人半程馬拉松,在吸引著巨大關(guān)注的同時,也讓網(wǎng)友吵翻了天。

有人說,這場馬拉松讓熱鬧了半年的人形機器人“祛魅”了,它看起來更像是個遙控的大號電動玩具,在網(wǎng)絡(luò)上,人形機器人各種酷炫動作,但在現(xiàn)實中連路都走不穩(wěn);也有人說,對新產(chǎn)業(yè)應該給予更多的寬容,只有現(xiàn)在的起步,才有未來的發(fā)展,就像汽車在誕生之初跑得比馬車還慢,但并不妨礙汽車的進步。

北京經(jīng)開區(qū)管委會副主任梁靚介紹,此次“人機半馬”比賽,更像一次產(chǎn)業(yè)對話和機器人“大練兵”。相比于最后的成績,業(yè)內(nèi)普遍認為,這更像是一場人形機器人系統(tǒng)工程的極限演練。

雖然很多人對“首馬”中機器人的表現(xiàn)有些失望,但實際上人形機器人這兩年的發(fā)展在提速。以機器人本體為例,過去一兩年迭代的速度,可能超過了之前10年的迭代。

今年初,“具身智能”首次被寫入《政府工作報告》,成了產(chǎn)業(yè)界的熱詞。具身智能產(chǎn)業(yè)鏈足夠長,市場體量足夠大,而人形機器人是其中技術(shù)集成度最高的。在行業(yè)被熱捧的背后,人形機器人還面臨諸多挑戰(zhàn)。業(yè)界正在探索將大模型與機器人結(jié)合,一些企業(yè)在思考推動如何將人形機器人在產(chǎn)業(yè)中落地。“真正走到我們身邊,我認為大概還需要10年左右。”北京通用人工智能研究院院長朱松純說。

01

當科幻照進現(xiàn)實

4月19日,北京亦莊,作為全球首個人形機器人參與的半程馬拉松賽事,熱度非常高,尤其是在AI和具身智能概念火熱的當下,大家都在關(guān)注機器人在賽場上的表現(xiàn)。

在現(xiàn)場,機器人賽道和人工賽道中間有護欄分隔,很多報名參加了半馬的人都在跟著機器人一起奔跑,甚至站在兩旁為機器人加油歡呼。而無論在家中、地鐵上,很多人也在通過直播觀看人形機器人在馬拉松賽的首秀。

當天有20個機器人參賽,其中7個跑完了全程21公里,而第一個出發(fā)的天工機器人不負眾望拿下了冠軍,用時2小時40分鐘,配速達到了每小時八九公里,中途更換了3次電池。

不過,相比于在網(wǎng)絡(luò)視頻上人形機器人的酷炫表現(xiàn),真實的比賽現(xiàn)場讓很多人感覺到了落差。

比如松延動力的N2機器人“旋風小子”在最后的沖刺階段,不小心摔了一跤,把“頭”都摔掉了,甚至有些在外形上擬人化很高的機器人,剛起步就摔在了起跑線上;一些機器人在中途遇到了故障,不得不從補給車里拿出備用的機器人繼續(xù)完成后續(xù)的比賽。

很多機器人都需要人工在旁邊輔助,甚至用手攙扶著;一些機器人在賽道上不斷走出“S形”路線,陪跑工程師不得不出手拉回來;另外由于高強度運動,導致關(guān)節(jié)發(fā)熱,也需要在關(guān)鍵部位經(jīng)常噴冷卻液給機械結(jié)構(gòu)降溫。

以至于很多人說,最累的不是機器人,而是在旁邊跟隨的工程師,他們不僅要跟著奔跑,還需要時刻關(guān)注機器人的動向。

根據(jù)主辦方的介紹,這次參賽的隊伍有兩種參賽方式,一種是遙控模式,考察的主要是硬件層面的能力,比如關(guān)節(jié)、電機、能耗、散熱等;另一種是跟跑模式,需要機器人能夠準確跟隨、快速響應前方目標。

而現(xiàn)場大部分機器人采用的是遙控模式,會有工程師在旁邊控制機器人的奔跑速度和方向。雖然主辦方賽前會為人形機器人賽隊提供線路的GPS坐標數(shù)據(jù),但這些人形機器人并不能實現(xiàn)完全自主控制。

在網(wǎng)絡(luò)上關(guān)注度很高的宇樹機器人,當天的表現(xiàn)也不出色,起步就摔倒。針對表現(xiàn)不佳的質(zhì)疑,宇樹科技還專門發(fā)了一則聲明,稱有好幾個獨立團隊在使用,“不同人操作或開發(fā)情況下,機器人的表現(xiàn)差別很大,請大家不要誤解。”據(jù)悉,清華一個團隊拿著宇樹機器人去參賽,相當于是拿了宇樹的硬件去跑了自己訓練的算法。這個團隊當天也沒能跑完全程。不過也有網(wǎng)友質(zhì)疑,為什么宇樹官方不來參賽?之前又跑又跳、行云流水的視頻,是真的假的?

鈦虎機器人產(chǎn)品生態(tài)負責人諶威則在騰訊科技的一場直播中坦言,這次比賽不只是為了“跑”,它本質(zhì)上是在測試人形機器人的“基礎(chǔ)身體能力”。馬拉松是一種非常適合做“壓力測試”的場景,比如這次亦莊半馬的比賽地形,包含了平地、坡道,全程線路共包括6個左轉(zhuǎn)道、8個右轉(zhuǎn)道,最小轉(zhuǎn)彎角90度。這些都考驗了機器人精準的路徑規(guī)劃和靈活的轉(zhuǎn)向能力。

通過這樣實戰(zhàn)的方式,能夠看到問題和發(fā)現(xiàn)不足,比如關(guān)節(jié)精度、熱管理、電源系統(tǒng)、控制算法、通信干擾等問題,在這場馬拉松賽中得以全面暴露,從而推動整個行業(yè)快速迭代。而且在一段20多公里封閉路段的珍貴數(shù)據(jù),為企業(yè)提供了珍貴的數(shù)據(jù)。

諶威說,這次比賽最特別的一點是所有參賽企業(yè)都在統(tǒng)一標準下,誠實面對自己的技術(shù)狀態(tài),不再像過去那樣通過剪輯展示“機器人陪我一天”的表演場景。對于公眾來說,這次是非常難得的真實展示,也是一種科學普及。

02

是祛魅還是加速?

在馬拉松之后,有人說“對人形機器人祛魅了”。但從產(chǎn)業(yè)實際情況和發(fā)展速度來看,包括人形機器人在內(nèi)的具身智能,其發(fā)展是在加速。

“大模型出來之后,機器人行業(yè)最大的變化就是驅(qū)動范式的變化,從傳統(tǒng)的模型驅(qū)動方式,變?yōu)榱艘粋數(shù)據(jù)驅(qū)動的方式。因為人形機器人要進入到復雜未知場景中,現(xiàn)實中沒有這么多模型,那么它最終的理想情況,應該是以數(shù)據(jù)作為指導,或者說是行為數(shù)字化,把我們?nèi)嗽诂F(xiàn)實工作中的技能采集數(shù)據(jù)化,然后轉(zhuǎn)移給機器人。”樂聚機器人董事長冷小坤說。

而因為范式的變化,也給具身智能提出非常大的挑戰(zhàn),其一是數(shù)據(jù)。“相比無人駕駛,具身智能更大的挑戰(zhàn)是先有雞還是先有蛋的問題,即數(shù)據(jù)從哪來。”智源研究院院長王仲遠說。全球電動汽車因為有基本的運行功能,它的輔助駕駛系統(tǒng)每天都可以收集數(shù)據(jù)進行迭代。“而機器人如果不能完成具體的場景任務(wù),就沒辦法形成規(guī)模化銷量,也就無法收集數(shù)據(jù)、迭代模型,整體陷入了‘死循環(huán)’。”

這也能看出這次馬拉松賽事,創(chuàng)造出20多公里封閉路段,對機器人運動性能研發(fā)的珍貴性。很多機器人公司結(jié)束比賽后,已迫不及待地去分析數(shù)據(jù)。

“數(shù)據(jù)的稀缺,導致無法實現(xiàn)具身智能的泛化能力。”軟通動力副總裁兼技術(shù)研究院副院長雒冬梅告訴數(shù)智前線,“拿抓取這件事來說,在某一空間某一個節(jié)點上,機器人順利去實現(xiàn)抓取,但換一個空間維度,就做不到了。”

“整個產(chǎn)業(yè)目前采用了多種手段,例如虛擬采集、合成數(shù)據(jù)采集、多模態(tài)數(shù)據(jù)融合采集,來逐步解決數(shù)據(jù)問題。”雒冬梅說。

不過,這些獲得數(shù)據(jù)的技術(shù)路徑,也都存在不同程度的挑戰(zhàn)。比如,合成數(shù)據(jù)、生成動作序列的方法中,最大的挑戰(zhàn)是空間匹配度并不好。在虛擬空間形成的抓取數(shù)據(jù),放到機器人本體上,會出現(xiàn)抓取位置偏差、抓取姿態(tài)錯誤,甚至根本無法成功抓取目標物體,無法完成預期動作。

為此,今年北京、杭州、無錫、南京、重慶等地,都在積極建設(shè)數(shù)采中心,未來幾年將會陸續(xù)投產(chǎn)。“它有點像我們之前算力中心的投資邏輯。”雒冬梅說。數(shù)采中心是完全面向場景化的,投資很高,比如要采集抹墻機器人需要的數(shù)據(jù),就要搭建樓房場景,實際采集、驗證后,將數(shù)據(jù)集提供給機器人企業(yè),降低業(yè)界的開發(fā)成本,這也可以說是數(shù)據(jù)要素發(fā)展的另一種形態(tài)。

在這些數(shù)采中心中,實地采集打乒乓球、疊衣服、掃地等一個個技能的數(shù)據(jù)。如在北京人形機器人創(chuàng)新中心,正全力建設(shè)百萬量級的高密度、高質(zhì)量、高通用性數(shù)據(jù)集。這需要產(chǎn)業(yè)鏈各方聯(lián)手,如各機器人企業(yè)、百度智能云等模型和算力企業(yè)。

具身智能面臨的第二大挑戰(zhàn),是機器人本身對復雜任務(wù)的理解,以及在動作序列中能否形成連貫性,這是下一階段業(yè)界要去重點攻克的難題。

“比如有十位客人,請機器人給其中一個人倒杯水,它可以理解,也可以執(zhí)行倒水動作。”雒冬梅說,“但如果讓機器人引導客人到某個會議室,然后再給他倒杯水,兩三層任務(wù),機器人就沒法形成連貫性了。”

為什么今年受到關(guān)注的Manus,能實現(xiàn)一系列工作,而人形機器人就做不到?雒冬梅告訴數(shù)智前線,Manus是數(shù)字AI,而具身智能是“物理AI”,兩者之間唯一的區(qū)別,就是空間維度。而空間維度不斷變化,這比訓練輔助駕駛難度還要大,因為輔助駕駛還有一系列交通規(guī)則可以遵循,而通常的物理空間,沒有明確的規(guī)則,動態(tài)不確定。這還需要大模型的泛化性來解決。

北京通用人工智能研究院院長朱松純說,現(xiàn)在最大的難點在于(數(shù)字)智能體和硬件本體的融合,在全球無論是產(chǎn)業(yè)界還是學術(shù)界,現(xiàn)在已開始在探討這兩者的結(jié)合問題。

03

今年有真實的落地場景嗎?

既然人形機器人有這些需要逐步解決的挑戰(zhàn),它什么時候能落地?

其實,伴隨人工智能的火爆,今年以來,行業(yè)市場中涌現(xiàn)出急迫需求。中工互聯(lián)董事長智振告訴數(shù)智前線,他們打算購買機器人和機器狗,在工業(yè)場景下展開探索。“工藝流程要與設(shè)備關(guān)聯(lián),軟硬件結(jié)合,才能形成閉環(huán)和競爭力。”智振提出“具身智能體”概念,它既是智能體,有大模型優(yōu)化和決策能力,也具備執(zhí)行能力,比如控制閥門,還能根據(jù)外部反饋自我進化。

“以前我比較懷疑,人形機器人為什么要進工業(yè)場景?”樂聚機器人冷小坤說,但接觸一些企業(yè)后發(fā)現(xiàn),其實大量場景,現(xiàn)在只能用人。因為產(chǎn)品的品類太多了,可能每半天或一天就要更換一批產(chǎn)線,而沒有一種自動化設(shè)備把產(chǎn)線都覆蓋掉。在這種情況下,目前最優(yōu)解就是人形機器人。樂聚在通信和新能源車廠,都在做相同的研發(fā),讓人形機器人與場景結(jié)合。

冷小坤說,人形機器人什么時候能像博士一樣聰明,像家電一樣便宜,也就到了產(chǎn)業(yè)爆發(fā)的時刻。他預測5年內(nèi),人形機器人成本能達到一輛小轎車的水平。

雒冬梅則認為,機器人特別適合優(yōu)先考慮高危場景下的應用,而這還有很多難題要攻克。為此,軟通動力已與理工華匯,成立軟通天匯特種人形機器人實驗室,其中的關(guān)鍵技術(shù)之一是人形機器人防爆問題,F(xiàn)有防爆多是外掛或穿戴式,與機器人輕量化相矛盾,軟通天匯通過材料、電機等做了結(jié)構(gòu)性優(yōu)化。同時,實驗室中也在開展復雜動作研發(fā),涉及多模態(tài)識別、技能訓練。

不過,更多企業(yè)采取了“沿途下蛋”策略。“具身智能不只是賦能于人形機器人,也可以賦能于多種形態(tài)的智能裝備。”雒冬梅說。她看到今年一些大型企業(yè),已在一些具體場景中,提出強烈訴求。軟通天樞聯(lián)合生態(tài)伙伴,也推出了巡檢復合機器人、勘測復合機器人、測量放線復合機器人和天匯Phyxis平臺。

“從大模型到本體到控制到場景,人形機器人和工業(yè)機器人不一樣,靠任何一家公司是搞不定的,它必須是一個大的生態(tài),然后整個產(chǎn)業(yè)鏈一塊配合。”北京通用人工智能研究院院長朱松純說。

近些年,國家在頂層設(shè)計上對具身智能做了很多的布局和政策引導,人形機器人產(chǎn)業(yè)鏈因多年布局已逐漸成熟。上游關(guān)鍵零部件如機械臂、關(guān)節(jié)、絲杠等,國內(nèi)具備一定實力,供應穩(wěn)定;中游大模型、操作系統(tǒng)、機器人“大腦小腦”、仿真訓練企業(yè),則在搶占行業(yè)垂類賽道,才能發(fā)揮更大優(yōu)勢;下游各類人形機器人公司,多在2021年后創(chuàng)立。

“對人形機器人的發(fā)展不能期望太高、太快,因為大眾對人工智能的理解,總是在某些熱點上,一旦熱點來了,以為馬上就到了。但如果沒有馬上達到他的預期,他的態(tài)度馬上又翻轉(zhuǎn)到另一邊去了。”朱松純說。而相比這樣的情緒起伏,行業(yè)需要一個比較穩(wěn)定、長期的發(fā)展環(huán)境。

“過高的期望會損害這個產(chǎn)業(yè),因為確實還沒到那個成熟度。”智源研究院王仲遠說,“現(xiàn)在有些不切實際的期待是兩三年后,人形機器人遍地跑,然后哪都用上。這個期待恐怕會落空。”他說自己贊同,RoboCup聯(lián)盟預期的,人形機器人在2050年之前,戰(zhàn)勝足球世界杯冠軍。

       原文標題 : 一場熱度空前的馬拉松,人形機器人在祛魅還是加速?

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號