訂閱
糾錯(cuò)
加入自媒體

Physical AI:數(shù)據(jù)即燃料、仿真即現(xiàn)實(shí)

芝能智芯出品

人工智能浪潮席卷工業(yè)、醫(yī)療、交通等多個(gè)領(lǐng)域之后,機(jī)器人正逐步從數(shù)字世界走入現(xiàn)實(shí)空間,而推動這場進(jìn)化的核心力量,來自于對“物理AI”的深刻理解與技術(shù)落地。

在這場變革中,英偉達(dá)正在扮演一位關(guān)鍵推動者,不僅僅制造芯片,也在構(gòu)建從數(shù)據(jù)生成到機(jī)器人部署的完整生態(tài),并借助開源開放的力量,加速人形機(jī)器人和工業(yè)機(jī)器人進(jìn)入主流應(yīng)用的進(jìn)程。

AI代理本質(zhì)上可以被視為數(shù)字世界中的機(jī)器人,但要讓它們在物理世界中具備真正的感知與行動能力,就必須在遵循現(xiàn)實(shí)物理法則的模擬環(huán)境中進(jìn)行學(xué)習(xí)。

這意味著,打造一個(gè)高保真、接近現(xiàn)實(shí)物理反應(yīng)的仿真環(huán)境成為訓(xùn)練物理機(jī)器人的前提。

為此,英偉達(dá)聯(lián)合DeepMind與迪士尼研究院共同開發(fā)了當(dāng)前最先進(jìn)的物理引擎——Newton,并計(jì)劃于7月向全球開源。

Newton的發(fā)布不僅僅是引擎層面的技術(shù)突破,更標(biāo)志著“物理AI”成為AI技術(shù)下一個(gè)戰(zhàn)略高地。

物理AI不同于以往依賴大模型生成文本或圖像的生成式AI,它關(guān)注的是“動作的生成與理解”,即讓機(jī)器人具備感知、決策、執(zhí)行等全鏈路的能力。

英偉達(dá)為此搭建了一個(gè)全棧的軟硬件基礎(chǔ)設(shè)施,覆蓋三類關(guān)鍵計(jì)算平臺:DGX服務(wù)器作為AI訓(xùn)練中心,RTX PRO工作站與服務(wù)器承擔(dān)模擬與合成數(shù)據(jù)生成任務(wù),而Jetson AGX則是面向邊緣部署的機(jī)器人運(yùn)行平臺。

更重要的是,英偉達(dá)將所有這些計(jì)算平臺通過Omniverse打通,構(gòu)成一個(gè)完整的開發(fā)—訓(xùn)練—部署閉環(huán)。

在此基礎(chǔ)上,英偉達(dá)推出了Isaac GR00T這一開放式人形機(jī)器人開發(fā)平臺,瞄準(zhǔn)當(dāng)前增長最快的機(jī)器人領(lǐng)域——人形機(jī)器人。

Isaac GR00T不僅僅是一個(gè)框架,更是一個(gè)結(jié)合了基礎(chǔ)模型、數(shù)據(jù)生成、仿真與訓(xùn)練流程的AI基礎(chǔ)設(shè)施。

其最新發(fā)布的Isaac GR00T N1.5是一個(gè)開放、通用且完全可定制的人形機(jī)器人基礎(chǔ)模型,相較前代,其對新環(huán)境的適應(yīng)性和復(fù)雜任務(wù)執(zhí)行能力明顯提升,特別是在物體識別與拾取放置方面的準(zhǔn)確率有顯著增強(qiáng)。

這一模型的開源,讓全球開發(fā)者能夠基于不同機(jī)器人品牌進(jìn)行個(gè)性化訓(xùn)練,并與Isaac GR00T-Dreams藍(lán)圖結(jié)合,以生成大規(guī)模的合成訓(xùn)練數(shù)據(jù)。

生成數(shù)據(jù)能力的增強(qiáng),是加速機(jī)器人研發(fā)的關(guān)鍵所在。

傳統(tǒng)人工演示的采集方式費(fèi)時(shí)費(fèi)力,無法滿足人形機(jī)器人對多樣化動作學(xué)習(xí)的需求。Isaac GR00T-Dreams藍(lán)圖正是為此而生。它依托英偉達(dá)Cosmos物理AI世界基礎(chǔ)模型,可以將有限的人工演示擴(kuò)展成大規(guī)模的“夢境”,即機(jī)器人在模擬環(huán)境中執(zhí)行任務(wù)的可視化視頻。

這些“夢境”不僅具備真實(shí)物理反應(yīng),還能通過推理引擎篩選出高質(zhì)量樣本,進(jìn)一步轉(zhuǎn)化為3D動作軌跡,從而用于訓(xùn)練Isaac GR00T N1.5。

這一過程在短短36小時(shí)內(nèi)就能完成,而傳統(tǒng)方式可能需要數(shù)月。GR00T-Dreams的出現(xiàn),使得一個(gè)小型團(tuán)隊(duì)即可完成原本需要數(shù)千人才能完成的數(shù)據(jù)采集工作,極大地降低了人形機(jī)器人開發(fā)門檻。

這種從“真實(shí)數(shù)據(jù)驅(qū)動”向“真實(shí)到真實(shí)”的合成數(shù)據(jù)驅(qū)動的范式轉(zhuǎn)變,也在工業(yè)機(jī)器人領(lǐng)域展現(xiàn)出巨大潛力。

臺積電、富士康、和碩、廣達(dá)等企業(yè),正在借助英偉達(dá)Omniverse平臺構(gòu)建工廠數(shù)字孿生,將復(fù)雜制造流程在虛擬世界中提前預(yù)演與優(yōu)化。

例如,臺積電通過Omniverse和cuOpt平臺構(gòu)建AI驅(qū)動的數(shù)字孿生管線系統(tǒng),將傳統(tǒng)的2D CAD圖紙轉(zhuǎn)化為互動式3D工廠模型,并借助視覺語言模型提升晶圓缺陷識別效率,實(shí)現(xiàn)從芯片設(shè)計(jì)、光刻到制造的全流程加速。

這種虛實(shí)結(jié)合的流程改造,使新廠規(guī)劃時(shí)間縮短數(shù)月,節(jié)省上千萬美元成本。

富士康同樣在其臺灣工廠部署了基于Omniverse的Fii數(shù)字孿生平臺,并結(jié)合Isaac GR00T-N1模型和GR00T-Mimic藍(lán)圖,訓(xùn)練工業(yè)機(jī)械臂完成從電纜插入到組裝的復(fù)雜任務(wù)。

通過使用虛擬機(jī)器人在Omniverse中完成大規(guī)模訓(xùn)練,再部署至現(xiàn)實(shí)車間,使物理AI真正融入生產(chǎn)線。

此外,通過構(gòu)建液冷POD中的超級芯片模擬平臺,富士康還能測試AI工廠的真實(shí)運(yùn)行條件,從而更高效地配置硬件資源。

這些工業(yè)實(shí)踐背后,昭示著一個(gè)趨勢:未來機(jī)器人的開發(fā)不再依賴大規(guī)模線下測試,而是借助數(shù)字孿生與合成數(shù)據(jù)完成大量預(yù)訓(xùn)練、迭代優(yōu)化,最終實(shí)現(xiàn)高效部署。

這種方法不僅適用于人形機(jī)器人,也可擴(kuò)展至協(xié)作機(jī)器人、自主移動機(jī)器人和AI代理等其他形態(tài)。

英偉達(dá)提供的軟硬件堆棧、Omniverse平臺、Isaac工具集以及開源的數(shù)據(jù)生成藍(lán)圖,正在成為機(jī)器人開發(fā)者的“標(biāo)準(zhǔn)裝備”。

而在城市級場景中,Linker Vision與高雄市政府也在利用Omniverse打造城市級數(shù)字孿生系統(tǒng),模擬不可預(yù)測情境,并借助AI agents實(shí)現(xiàn)實(shí)時(shí)響應(yīng)機(jī)制。

這一模式表明,數(shù)字孿生與物理AI的結(jié)合已超越工廠邊界,邁向智慧城市、公共安全等更廣泛的領(lǐng)域。

小結(jié)

從構(gòu)建物理世界的數(shù)字鏡像,到用像素生成動作軌跡,再到將AI植入機(jī)器人完成任務(wù)執(zhí)行,英偉達(dá)正通過一整套開放生態(tài)推動機(jī)器人開發(fā)進(jìn)入“數(shù)據(jù)即燃料、仿真即現(xiàn)實(shí)”的新階段。

而物理AI,也正是驅(qū)動這一變革的核心引擎。在不久的未來,我們或許會看到更多能夠自由行走、理解命令、執(zhí)行任務(wù)的人形機(jī)器人走入工廠、醫(yī)院、商場甚至家庭,而這一切的背后,都離不開數(shù)據(jù)生成能力的變革和物理仿真引擎的革命。

       原文標(biāo)題 : Physical AI:數(shù)據(jù)即燃料、仿真即現(xiàn)實(shí)

聲明: 本文由入駐維科號的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報(bào)。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個(gè)字

您提交的評論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號