紅杉中國連投三輪,上海交大教授帶隊造機器人大腦
作者|向欣
編輯|白雪
今年,Deepseek 橫空出世。
超強性能、免費開源、低訓練成本等特點讓它如同一聲驚雷震撼了全世界,投資市場也在它的誕生和火爆中,看到中國企業(yè)做大模型的巨大潛力。
以具身智能大模型為代表的機器人大腦,現已成為具身智能領域,資本重點關注的核心賽道。
最近,具身智能大模型企業(yè)穹徹智能就完成了數億元 Pre-A++輪融資。盛宇投資、清科創(chuàng)投、嘉御資本、云啟資本、上?苿(chuàng)基金等機構參投。
現下具身智能大模型技術路線以 VLA(視覺-語言-動作模型)、VLM(視覺-語言模型)為主流。
而穹徹智能則另辟蹊徑,把力反饋融入機器人決策過程,選擇研發(fā)「以力為中心」的具身智能大模型和相關工具與平臺,發(fā)布了穹徹具身大腦(Noematrix Brain)。
這種技術路線在視覺、語言信息之外,增加了力反饋的信息,使得機器人能夠更全面地認識現實世界。
借助 Noematrix Brain,在 2024 年 7 月,機器人就學會了幫人刮胡子,還能削黃瓜、疊衣服、收納桌面物品。
這個被刮胡子的人就是穹徹智能創(chuàng)始人之一盧策吾
其中,機器人疊衣服這一技能的展示,比美國明星具身智能企業(yè) Physical Intelligence 早了 4 個月。
針對業(yè)界普遍頭疼的數據問題,穹徹智能也提出了多種低成本、高效率的數據收集與機器人訓練方案,包括 CoMiner 伴隨式數采系統(tǒng)、規(guī);Ψ答伳7聰祿c學習模型-力捕捉系統(tǒng) ForceMimic 等。
宇樹科技創(chuàng)始人王興興認為,相比硬件本體,機器人大腦才是目前最大的難題,全球都在等待機器人大腦的誕生。
穹徹智能給出了一個切實可行的答案。
創(chuàng)始人來自斯坦福
產業(yè)化經驗豐富
穹徹智能 2023 年 11 月成立,由成立近十年、估值達 10 億美元的智能機器人公司非夕科技孵化。
截至目前,穹徹智能已完成 4 輪融資。頂尖投資機構 Prosperity7、紅杉中國連續(xù)三輪加注,充分顯示出資本對這家公司技術路線的高度認可。
縱觀具身智能領域,受資本歡迎的企業(yè),在人才上一般為「科研精英+產業(yè)老將」的配置,穹徹智能也不例外。
高校,或許是連接兩位創(chuàng)始人的紐帶。
穹徹智能創(chuàng)始人盧策吾、王世全均來自在機器人領域長期領先的頂尖高!绹固垢4髮W,且目前都任職于上海交通大學。
盧策吾是斯坦福大學人工智能實驗室博士后,師從知名學者李飛飛和 Leo Guibas 教授(美國工程院院士)。
2016 年,盧策吾回國發(fā)展,現任上海交通大學人工智能學院副院長及教授。
與盧策吾一樣,王世全也在斯坦福大學人工智能實驗室工作過。
王世全是斯坦福大學仿生與靈巧操作實驗室及人工智能實驗室(機器人方向)博士,于 2016 年創(chuàng)辦非夕科技,在通用機器人本體 AI 技術融合與場景應用中積累了豐富經驗。
2021 年,王世全開始擔任上海交通大學客座教授,目前兼任上海市科協常委。
在團隊中,盧策吾代表的是前沿科學力量,而王世全則代表商業(yè)化能力。
盧策吾是國內最早研究具身智能領域的學者之一,也是該領域唯一的科學探索獎獲得者。
盧策吾在學術研究方面成果豐碩,他主導的科研團隊在《自然》、《自然-機器智能》、TPAMI、T-RO 等頂級期刊上發(fā)表了 100 多篇論文,獲國際機器人頂會最佳論文、最佳系統(tǒng)論文提名。
盧策吾團隊還原創(chuàng)提出了 AnyGrasp 抓取算法,讓機器人首次實現了在雜亂場景中也能像人一樣精準抓取物品。
團隊也是國內唯一獲邀加入 Open X Embodiment Dataset 國際聯合具身智能大規(guī)模數據集項目的學術力量。
實際上,AnyGrasp 抓取算法也是上海交大-非夕科技聯合實驗室的研究成果。
該實驗室于 2019 年成立,為后續(xù)非夕科技孵化穹徹智能奠定了基礎。穹徹智能多項技術成果都是與上海交通大學聯合推出的。
除了高?蒲匈Y源支持外,作為穹徹智能的產業(yè)支持方,非夕科技不僅讓穹徹智能繼承了其在機器人力控技術上的技術優(yōu)勢,也能夠為穹徹智能提供硬件基礎與產品落地能力,使其技術能夠得到規(guī);瘧。
非夕科技是一家自適應機器人公司,2022 年估值已達 10 億美元(約合人民幣 73 億),已發(fā)布兩款機器人產品,分別是七軸自適應機器人 RIZON 拂曉、自適應并聯機器人玄暉 Moonlight。
自適應機器人可以理解為能夠適應多個操作對象、多種環(huán)境、多類任務的智能機器人,兼具傳統(tǒng)工業(yè)機器人的高性能與協作機器人的安全性,主要形態(tài)為機械臂、四足機器人等。
2020 年,非夕科技就已實現了規(guī)模化量產,首批百臺自適應機器人在華南制造中心順利投產下線。
目前,非夕科技機器人產品已在工業(yè)制造、食品加工及醫(yī)療服務等多個行業(yè)廣泛應用,能夠執(zhí)行裝配、打磨拋光、汽車座椅熨燙、新能源汽車充電等多種復雜任務,產品已經過市場驗證。
這意味著相較其他具身智能大模型企業(yè),穹徹智能擁有天然的硬件優(yōu)勢。其在技術成果展示中,也多次使用非夕科技的機械臂作為載體。
雖然力控技術一脈相承,但兩家公司的路線仍然有差異,穹徹展示的技能大多面向家庭場景,而非夕科技的機器人多應用于工業(yè)場景。
頂尖科研力量與成熟產業(yè)化經驗的融合,使得穹徹智能更容易在技術深度與商業(yè)落地之間實現高效閉環(huán)。
讓機器人學會削黃瓜、疊衣服
自主性極高
穹徹智能的研發(fā)思路是,回歸問題本質提出解決方案,同時保證技術的可實現性與商業(yè)上的可落地性。
這兩點,恰好滿足了現在資本既追求前沿技術,又希望快速實現投資回報的需求。
穹徹智能主要解決具身智能領域兩個目前最核心的難題:大模型、數據,提出了創(chuàng)新的解決方案,并且一直以低成本、高效率、可規(guī)模化作為貫穿技術研發(fā)、方案設計全流程的重要原則。
大模型方面,穹徹智能推出了兼顧泛化性和落地性能要求的具身智能大腦 Noematrix Brain。
盧策吾認為,不能單純地通過復制語言大模型 Scaling Law 的方式來打造具身智能大模型。
因為語言大模型的訓練方法是填充海量的互聯網數據。具身智能相應需要的是大量來自現實世界的物理交互數據
按照這種技術路線,具身智能需要 1:1 的實際數據采集,但這些數據的生成、獲取難度和成本遠高于互聯網數據,在數量和質量上都無法滿足具身智能大模型的訓練需求。
所以,盧策吾團隊不依賴于傳統(tǒng)路徑,而是基于第一性原理,回歸到具身智能大模型需要知道「世界是什么」;其次它要知道「如何決策」這兩個本質問題上來思考解決方法,重新設計技術框架。
穹徹智能通過將操作的物理常識和力反饋結合在一起,打造了兩個大模型。
具身智能大腦 Noematrix Brain 就是由這兩個大模型組成,它們分別是:
實體世界大模型:教機器人掌握基本的物理常識,理解世界
機器人行為大模型:機器人結合物理常識和操作時的反饋力來調整動作,像人類一樣進行決策、使用力量。
兩個大模型構成一體,進行端到端的聯合訓練。
打個比喻,傳統(tǒng)的技術路線是讓人類老師親身給機器人示范動作,并且事無巨細告訴機器人現場的所有細節(jié),每面對一個新環(huán)境、新任務,需要重新進行基礎教學。
而穹徹智能的技術路線是,讓老師教機器人物理知識,理解物體之間的力學關系,結合語言/視覺大模型做預訓練或輔助,再讓機器人自己在現實世界中根據這些知識和力反饋進行學習。
理論上,穹徹智能創(chuàng)新的技術路線能夠降低具身智能大模型的數據量需求,使訓練變得低成本、可規(guī)模化。而在現實中,它已經展示出可行性。
2024 年 7 月舉辦的世界人工智能大會期間,具身智能大腦 Noematrix Brain 部署到雙臂機器人、單臂移動機器人上,在展會現場首次公開展示多種技能,成功執(zhí)行了整理、收納桌面/地面物品,疊衣服,削黃瓜等任務。
這些任務對于人類來說很簡單,對于機器人來說卻極其復雜,尤其是疊衣服與削黃瓜。
執(zhí)行這些任務涉及高精度的力控和運動規(guī)劃,對柔性物體的操作要求極高,需要機器人實時調整抓取力道,避免破損或滑動。
任務之間差異大,也要求大模型具備強大的泛化能力,以便應對不同形態(tài)和材質的物品,并根據環(huán)境實時調整策略完成操作。
自主性是這個大腦的重要特點。任務執(zhí)行過程中,具身大腦自主進行的操作包括但不限于物品識別、軌跡規(guī)劃、決策、避障等等。
降低數據獲取成本
數采系統(tǒng)已獲百套訂單
數據方面,穹徹智能聯合上交大研發(fā)了三種數據采集方式,并推出了一個數據集,包括:
Noematrix CoMiner 伴隨式數采系統(tǒng),基于「生產伴隨」式外骨骼數據采集方式研發(fā);
規(guī);Ψ答伳7聰祿c學習模型-力捕捉系統(tǒng) ForceMimic;
視覺-觸覺聯合記錄和追蹤系統(tǒng) ViTaM;
雙手復雜操作任務數據集 OakInk2:涵蓋廚房、書房、實驗室、浴室 4 大交互場景,包含 75 類物體。
這些數據采集方案,都在降低數據獲取成本的同時,提高了數據利用效率。
「生產伴隨」式外骨骼數據采集方式解決的是傳統(tǒng)遙操作設備昂貴且缺乏便攜性的問題。
研究團隊開發(fā)了一款開源、低成本、通用、便攜、持久耐用和易維護的外骨骼設備 AirExo,可適配多種機械臂。
AirExo 不僅支持雙臂機器人的遙操作完成數據采集,還能不局限于實驗室,直接記錄廣泛且經濟的野外演示數據。
團隊僅通過 3 分鐘的遙操作演示,結合 AirExo 收集的廣泛和多樣化的野外數據,所訓練的機器人策略能夠媲美通過超過 20 分鐘遙操作演示學習的策略,數采效率提升 7 倍。
規(guī);Ψ答伳7聰祿c學習模型-力捕捉系統(tǒng) ForceMimic,則是解決機器人力控數據收集的問題。力控技術在機器人操作中至關重要,而業(yè)界缺乏大規(guī)模力交互數據。
ForceMimic 系統(tǒng)由兩個部分組成:
ForceCapture:能「記錄人怎么操作東西」的設備,可精準、實時捕捉并記錄操作過程中的力、姿態(tài)及運動軌跡等多維度數據;
HybridIL:能「讓機器人學會人類怎么操作」的模仿學習算法。
實驗表明,ForceCapture 的數據采集效率幾乎是遙操作的 3 倍,且該設備幾乎無需任何額外培訓,比需要對操作員進行專業(yè)培訓的遙操作設備更具易用性。
系統(tǒng)的另一組成部分——算法 HybridIL 也表現出優(yōu)秀的性能,能夠在嚴苛的條件下保持 85% 的任務執(zhí)行成功率。
視覺-觸覺聯合記錄和追蹤系統(tǒng) ViTaM 解決的是數據收集過程中,存在視野盲區(qū)的問題。
ViTaM 系統(tǒng)同樣由兩個部分組成:
一個可伸縮的觸覺手套和一個 3D 相機:負責記錄操作過程;
一個基于視覺-觸覺的聯合學習框架:重建被手部遮擋或形變的物體細節(jié)。
人在操作時常常會遮擋關鍵部位,尤其是處理柔軟或易變形物體時,單靠視覺難以感知細節(jié)。
ViTaM 系統(tǒng)的作用就是,幫助機器人從現實世界中獲得操作數據的完整狀態(tài),從而實現和人類一樣的靈巧操作。
比如在拿一塊海綿時,ViTaM 系統(tǒng)能夠讓機器人感知到其柔軟性、面向手掌心部分的形變情況以及接觸的力度,從而精確地控制操作。
在商業(yè)化方面,穹徹智能的種種技術成果,得到了市場的初步認可,不僅獲得了訂單,也正在家庭服務、食品加工等場景嘗試落地。
穹徹智能具身智能大腦 Noematrix Brain 獲得單場景百套訂單的突破,基于「生產伴隨」式數據采集方式研發(fā)的數采系統(tǒng)也獲得了近百套訂單。
在家庭服務場景,穹徹智能與海爾機器人聯合研發(fā)了兩款家庭機器人,分別能夠自主閉環(huán)完成地面物品清理、衣物洗烘任務。
在食品加工領域,「穹徹智能」已與知名食品廠商達成合作意向,雙方將加快復雜食品生產、加工處理產線的智能化與自動化轉型。
具身智能仍面臨著許多技術和應用上的挑戰(zhàn),尤其是在大模型訓練的數據難題、低效的訓練方式以及如何讓機器人真正理解和適應復雜的現實世界等問題上進展緩慢。
結合低成本、高效率的數據收集、利用方式,以及創(chuàng)新的具身智能大模型技術路線,穹徹智能為行業(yè)提供了一個具有可持續(xù)性與可擴展性的技術方案,有望繼續(xù)拓展具身智能的應用邊界。
原文標題 : 紅杉中國連投三輪,上海交大教授帶隊造機器人大腦

請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達AI統(tǒng)治的開始
- 2 北電數智主辦酒仙橋論壇,探索AI產業(yè)發(fā)展新路徑
- 3 “AI寒武紀”爆發(fā)至今,五類新物種登上歷史舞臺
- 4 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 5 國產智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關稅,能否乘機器人東風翻身?