訂閱
糾錯
加入自媒體

人形機器人國內產(chǎn)業(yè)鏈后來居上,遇上DeepSeek端側模型風暴加速駛向具身終局

作者:李寧遠物聯(lián)網(wǎng)智庫 原創(chuàng)

上周DeepSeek發(fā)布了一篇關于NSA的技術論文報告,這是一種硬件對齊且原生可訓練的稀疏注意力機制,用于超快速長上下文訓練與推理。DeepSeek表示該機制可優(yōu)化現(xiàn)代硬件設計,加速推理同時降低預訓練成本,并且不犧牲性能。

DeepSeek與硬件協(xié)同發(fā)展帶動硬件設備升級與市場增長是資本市場概念熱潮褪去之后,下一階段落地到實體產(chǎn)業(yè)的發(fā)展關鍵。從不同終端硬件的技術發(fā)展來看也的確如此,終端設備正在經(jīng)歷新一輪的升級迭代,終端硬件廠商與DeepSeek的緊密合作正推動硬件設備向更智能、更高效的水平邁進。

終端硬件設備最具科技想象空間的無疑是機器人,今年尖端AI推理模型DeepSeek帶來的高質量小模型和多模態(tài)推理模型方面的創(chuàng)新,正在為機器人的商用應用和終端側推理落地做好準備,強大的模型能力已演進到一定程度能在終端側賦能硬件。宇樹科技CEO王興興近日也表示,在今年年底之前,整個AI人形機器人會達到一個新的量級。

從人形機器人的發(fā)展史上來看國內產(chǎn)業(yè)鏈很長時間都處于下風,但近年來這一態(tài)勢已發(fā)生逆轉,憑借深厚的技術積累和強大的供應鏈體系,國內企業(yè)在關節(jié)伺服、運動控制等傳統(tǒng)機器人技術領域取得顯著突破,而后趁著AI浪潮國內企業(yè)在硬件技術成熟度提升與模型賦能的雙重驅動下迅速崛起。

金融機構摩根士丹利最新發(fā)布的《The Humanoid 100: Mapping the Humanoid Robot Value Chain》(人形機器人 100:繪制人形機器人價值鏈圖譜)報告中羅列的全球人形機器人產(chǎn)業(yè)鏈上市公司百強名單中,亞洲公司占據(jù)73%其中中國公司占56%,還有77%的集成商來自亞洲其中45%來自中國。過去5年中人形機器人專利申請數(shù)中國以5688項遠超美國和日本,雄踞第一寶座。報告預計,到2030年,中國人形機器人市場規(guī)模將達到120億元人民幣,銷量達150萬臺;到2050年,中國的人形機器人市場規(guī)模將達到6萬億元,人形機器人總量達到 5900萬臺。

The Humanoid 100中的國產(chǎn)供應鏈,端側智能引領機器人發(fā)展

報告中將供應商分為三類,分別是負責半導體和模型軟件的“大腦”供應商、負責工業(yè)組件的“身體”供應商以及負責整機制造的“集成商”。

在“大腦”供應商部分,上榜的中國企業(yè)有百度、地平線機器人和臺積電;“身體”供應商部分,中國企業(yè)有旭升集團、億緯鋰能、寧德時代、雙林股份、拓普集團、三花智控、匯川技術、綠的諧波、雙環(huán)傳動、中大力德、雷賽智能、埃斯頓、兆威機電、鳴志電器、金力永磁、北方稀土、北特科技、恒立液壓、韋爾股份、柯力傳感、速騰聚創(chuàng);集成商部分有廣汽集團、小鵬汽車、比亞迪、小米集團、阿里巴巴、騰訊、埃斯頓、優(yōu)必選、美的集團。

作為在芯片類別唯一一家上榜的國內SoC廠商,地平線在邊緣側端側的AI SoC實力有目共睹,“地平線機器人”其創(chuàng)立設定的場景便是機器人、自動駕駛這樣需要實時完成計算的端側場景,其SoC產(chǎn)品所有的軟硬件架構都為端側的特殊需求設計。在硬件上,地平線打造的智能計算架構BPU,不僅是算力和功耗的優(yōu)化,還將感知、規(guī)控等各種任務統(tǒng)一到Transformer框架下,更好支撐模型帶來的新能力。DeepSeeK問世后地平線宣布支持DeepSeeK大模型,通過端側高效推理能力,幫助端側設備在訓練智能系統(tǒng)時,降低數(shù)據(jù)訓練成本,提升訓練效率。

“身體”供應商部分國產(chǎn)供應鏈覆蓋了關鍵零部件全鏈條,從電機到傳感器,再到精密結構件。電機領域明確的發(fā)展趨勢是電機智能化和高效節(jié)能化,在電機芯片領域,SoC級的解決方案并且具備更強的邊緣側計算和智能決策能力成為了下游市場的期許。所以現(xiàn)在眾多電機主控芯片都會配置DSP或者NPU來實現(xiàn)計算加速組件,讓主控能夠在端側運行AI算法智能優(yōu)化能效并增強終端設備的響應速度。

傳感器是機器人核心部件,人形機器人具身智能時代,端側傳感器與AI的結合絕對已經(jīng)成為必不可少的技術棧。幾家上榜的國內傳感器廠商,圖像傳感器龍頭韋爾股份、激光雷達賽道領軍企業(yè)速騰聚創(chuàng)等均在推動傳感器成為不再只是用于感知的硬件,而是在實時精準感知的基礎上,拓展更多和AI相關的功能。傳感側借力端側AI提供更多數(shù)據(jù)處理、分類、融合的價值,最終通過具身感知來增強智能體的理解和決策。

集成商作為機器人本體核心供應商,強化端側智能能力亦是重中之重,依托模型賦能,實現(xiàn)多模態(tài)感知與高效決策已成為他們的首要任務。國內人形機器人第一股優(yōu)必選已經(jīng)表示在人形機器人應用場景中驗證DeepSeek技術的有效性,如多模態(tài)人機交互、復雜環(huán)境中的指令理解、工業(yè)場景中的任務分解與規(guī)劃等。

從這份世界百強榜單中,國內企業(yè)的崛起彰顯了本土產(chǎn)業(yè)鏈的成熟與創(chuàng)新能力。雖然在芯片領域仍面臨國際巨頭擠壓,但在整個產(chǎn)業(yè)鏈上是領先的。端側智能化的大趨勢也在引領著國內機器人產(chǎn)業(yè)鏈軟硬件協(xié)同發(fā)展。

DeepSeek端側模型風暴加速機器人端側具身智能

雖然這份報告中并沒有提及DeepSeek,但顯然DeepSeek面世后機器人賽道變化不小。DeepSeek在模型能力不遜于其他主流模型基礎上,又做到了算力成本更低。除了上述百強榜單中的優(yōu)必選已經(jīng)開始驗證DeepSeek+機器人技術的有效性,小鵬汽車也在積極探索DeepSeek在自動駕駛領域的應用,后續(xù)用在自家的人形機器人Iron上也是大概率事件。這些百強之外,產(chǎn)業(yè)鏈上的公司也在積極布局,借助DeepSeek帶動的端側模型革新尋找端側具身智能的新范式。

已經(jīng)有消息傳出宇樹科技與DeepSeek達成深度合作;前段時間Figure終止與OpenAI合作也有很多人認為 Figure 是在基于DeepSeek R1等開源模型進行開發(fā)機器人AI;獵戶星空的機器人AgentOS也接入DeepSeek……以DeepSeek為代表的優(yōu)質模型已經(jīng)成為人形機器人推動端側智能邁向新高度的關鍵驅動力。

這些產(chǎn)業(yè)鏈上的舉動,從產(chǎn)業(yè)落地的角度來說,考量實現(xiàn)具身智能的成本是決定性因素之一。雖然人形機器人現(xiàn)階段相比于其他智能端側設備,對成本并沒有那么敏感,但硬件設備想普及成本是最實際的問題。機器人運控、感知、決策任意環(huán)節(jié)的任一細分方向的智能,都需要消耗大量算力來訓練數(shù)據(jù)。真機數(shù)據(jù)匱乏且貴是整個行業(yè)面臨的問題,模型仿真數(shù)據(jù)能緩解一部分數(shù)據(jù)匱乏的問題也還是需要模型篩選出高質量數(shù)據(jù)訓練解決泛化性和魯棒性問題。

DeepSeek通過高效推理能力降低數(shù)據(jù)訓練成本,提升訓練效率給機器人廠商開辟了一條更低成本的具身智能實現(xiàn)路線。從數(shù)據(jù)到性能的轉化性價比是機器人想要落地必須考量的,能夠以更低的數(shù)據(jù)成本訓練出性能更好的具身模型自然會吸引更多廠商投入研發(fā),加速端側具身智能的實現(xiàn)。

在算力上,從國外的英偉達、高通、英特爾,到瑞芯微、晶晨股份、星宸科技、國科微、富瀚微、國芯科技、恒玄科技、樂鑫科技、中科藍訊、炬芯科技、安凱微、寒武紀、黑芝麻智能等端側SoC、端側處理芯片廠商,包括廣和通、美格智能、移遠通信等端側模組廠商在內,都在積極擁抱DeepSeek帶來的端側智能算力熱潮,在機器人賽道上積極布局,進行軟硬協(xié)同優(yōu)化,解放端側算力效率推動具身智能愿景。

另一方面,在機器人端側模型的適配上,DeepSeek的“開源+低價+蒸餾”模式(如通過API低成本調用、模型蒸餾技術生成垂直小模型),顯著降低了AI技術的應用門檻,使機器人能夠快速集成先進的自然語言處理初步處理與分析,在交互上迅速提升智能化水平,還能結合多元信息進行推理與決策,提供更高階智能的服務。

和手機、PC、可穿戴等其他小型終端設備略有不同的是,人形機器人的算力并不會那么欠缺,在算力與能效的平衡上會更自由,能更好地支撐復雜端側模型的運行。通過DeepSeek代表性的跨維度知識蒸餾體系,將大模型的邏輯解構為思考推理,更適配機器人端側垂直應用場景,更人性化的思考也符合大家對具身智能的期待。

其開源特性,也讓人形機器人公司能夠自主的構建閉環(huán)的智能模型,模型與機器人適配度會更高,技術棧上也避免受制于人。Figure終止與OpenAI合作很大一部分考量也是在這方面。近日Figure宣布推出的重大AI更新——自主研發(fā)的通用具身智能VLA模型Helix,也的確是走了自研這條路。

人形機器人發(fā)展到高階智能,多模態(tài)理解能力是機器人VLA視覺語言行動模型的核心,亦是實現(xiàn)具身智能的關鍵。在觸覺信息處理能力成熟后,發(fā)展成全模態(tài)VTLA模型也是必要的。

DeepSeek已經(jīng)提出過視覺語言模型——DeepSeek-VL,能進行多模態(tài)數(shù)據(jù)訓練。近期北京大學聯(lián)合香港科技大學在則DeepSeek-R1基礎上發(fā)布了多模態(tài)版DeepSeek-R1——Align-DS-V,完成了從文本到視覺理解的拓展。北大團隊表示“這種全模態(tài)的信息流對于大模型范式轉向通用人工智能也一樣重要”。

除了廠商自研,充分利用DeepSeek構建機器人多模態(tài)模型也是一條不錯的技術路徑,這一改變帶來的助力將會在后續(xù)的發(fā)展中逐步顯現(xiàn)。

不論是在囊括一切信息流的VLA模型中,還是在具體任務落地中用到的 MoE小模型組合中,DeepSeek給了算法平臺商和終端本體廠商更多的技術路徑選擇,F(xiàn)在還很難說哪條技術路線能引領產(chǎn)業(yè)走向終局的物理AI,但不可否認的是DeepSeek出現(xiàn)帶動的端側模型的爆發(fā)與革新,解決了機器人在復雜決策場景中構建起感知-理解-推演的閉環(huán)認知體系的部分難題,推動了端側模型與人形機器人的結合落地,加速了端側實現(xiàn)具身智能。

寫在最后

中國具身智能人形機器人產(chǎn)業(yè)鏈的崛起,是技術突破、政策引導與場景落地的綜合結果;而優(yōu)質多模態(tài)模型的融合將加速機器人向智能化、多模態(tài)交互方向演進。未來,兩者的協(xié)同或成為全球AI與機器人產(chǎn)業(yè)競爭的核心變量。

       原文標題 : 人形機器人國內產(chǎn)業(yè)鏈后來居上,機器人遇上DeepSeek端側模型風暴加速駛向具身終局

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號