谷歌第七代TPU來(lái)了,號(hào)稱最強(qiáng)大的AI處理器
前言:
預(yù)計(jì)至2025年,AI領(lǐng)域?qū)⒔?jīng)歷一次重大轉(zhuǎn)型,生成式AI的應(yīng)用將不再局限于回答簡(jiǎn)單問(wèn)題,而是通過(guò)智能系統(tǒng)解決更為復(fù)雜的問(wèn)題。
AI的未來(lái)發(fā)展不僅局限于更大規(guī)模的模型構(gòu)建,更在于模型能夠?qū)?wèn)題進(jìn)行分解、執(zhí)行多步驟推理,并模擬人類思維過(guò)程。
作者| 方文三
圖片來(lái)源|網(wǎng) 絡(luò)
谷歌第七代TPUIronwood正式發(fā)布
在本周三,谷歌公司正式推出了其第七代張量處理單元(TPU)——Ironwood。該公司宣稱,在大規(guī)模部署的條件下,該AI加速器的計(jì)算性能可達(dá)到全球最快超級(jí)計(jì)算機(jī)性能的24倍以上。
這款在Google Cloud Next 25大會(huì)上亮相的新芯片,標(biāo)志著谷歌在AI芯片研發(fā)領(lǐng)域十年戰(zhàn)略的關(guān)鍵轉(zhuǎn)折點(diǎn)。
此前谷歌自行研發(fā)的幾代TPU主要針對(duì)AI的訓(xùn)練和推理任務(wù),而Ironwood則是首款專為推理任務(wù)設(shè)計(jì)的芯片。
Ironwood芯片旨在滿足生成式AI下一發(fā)展階段的巨大計(jì)算和通信需求。
Ironwood芯片具備卓越的技術(shù)規(guī)格,當(dāng)每個(gè)pod擴(kuò)展至9216塊芯片時(shí),它能提供42.5 exaflops的AI計(jì)算能力。
這一數(shù)值遠(yuǎn)超目前全球最快的超級(jí)計(jì)算機(jī)El Capitan的1.7 exaflops。每塊Ironwood芯片的峰值計(jì)算能力可達(dá)4614 TFLOPs。
在單芯片規(guī)格方面,Ironwood顯著提升了內(nèi)存和帶寬性能,每塊芯片配備192GB高帶寬內(nèi)存(HBM),是去年推出的上一代TPU Trillium的六倍。
每塊芯片的內(nèi)存帶寬達(dá)到7.2 terabits/s,是Trillium的4.5倍。
該芯片專為AI推理任務(wù)而設(shè)計(jì),象征著AI從[響應(yīng)式]模型向[主動(dòng)式]模型的演進(jìn)。
換言之,它標(biāo)志著從僅提供實(shí)時(shí)信息的模型向能夠主動(dòng)生成洞察和解讀的模型的轉(zhuǎn)變。
其目標(biāo)在于賦予智能體(Agent)主動(dòng)檢索、數(shù)據(jù)生成及協(xié)作推理的能力,而不僅僅是被動(dòng)地響應(yīng)查詢。
此外,Ironwood芯片首次支持FP8計(jì)算格式,并在張量核和矩陣數(shù)學(xué)單元中實(shí)現(xiàn)了這一功能,從而在處理大規(guī)模推理任務(wù)時(shí)顯著提升了效率。
盡管英偉達(dá)的B200芯片在某些性能指標(biāo)上略占優(yōu)勢(shì)(例如內(nèi)存帶寬達(dá)到8 Tbps,略高于Ironwood的7.2 Tbps),但I(xiàn)ronwood的整體性能依然非常接近,甚至在某些方面超越了B200。
在對(duì)谷歌Ironwood與英偉達(dá)B200進(jìn)行對(duì)比分析時(shí),從競(jìng)爭(zhēng)格局的角度來(lái)看,谷歌通過(guò)TPU與Google Cloud、Pathways軟件棧的深度集成,吸引了OpenAI創(chuàng)始團(tuán)隊(duì)等客戶,從而加強(qiáng)了其在生成式AI市場(chǎng)的地位。
AI超級(jí)計(jì)算架構(gòu)不斷完善和升級(jí)
生產(chǎn)力的革新始于谷歌在基礎(chǔ)設(shè)施層面的全面AI化。
預(yù)計(jì)到2025年,谷歌將投資約750億美元用于服務(wù)器和數(shù)據(jù)中心的建設(shè)。
此外,為了進(jìn)一步協(xié)助客戶擁抱AI,Google Cloud 宣布將提供接近零延遲的云廣域網(wǎng)(Cloud WAN)服務(wù),向全球數(shù)十億用戶提供。
與其它托管及開(kāi)源Kubernetes 產(chǎn)品相比,Cloud WAN 能夠?qū)⒕W(wǎng)絡(luò)性能提升40%,同時(shí)將總擁有成本(TOC)降低40%。
自去年與英偉達(dá)建立戰(zhàn)略合作伙伴關(guān)系以來(lái),谷歌提供了基于英偉達(dá)GPU的廣泛產(chǎn)品線,使得用戶能夠在 Google Cloud 上使用英偉達(dá)最新硬件訓(xùn)練生成式AI模型。
今年,谷歌進(jìn)一步推出了搭載英偉達(dá)B200 和 GB200 Blackwell GPU 的 A4 和 A4X 虛擬機(jī),顯著增強(qiáng)了其GPU產(chǎn)品組合。
據(jù)透露,Google Cloud 將成為首批提供英偉達(dá)下一代 Vera Rubin GPU 的公司之一,該 GPU 每個(gè)機(jī)架可提供高達(dá) 15 exaflops 的 FP4 推理性能。
除了芯片技術(shù)之外,谷歌認(rèn)為存儲(chǔ)是減少訓(xùn)練和推理瓶頸的關(guān)鍵因素。
為了實(shí)現(xiàn)更高的數(shù)據(jù)吞吐量和更低的延遲,谷歌此次對(duì)存儲(chǔ)層面也進(jìn)行了更新。
特別是,Ironwood的設(shè)計(jì)目標(biāo)是在執(zhí)行大規(guī)模張量運(yùn)算時(shí),盡可能地減少芯片上的數(shù)據(jù)傳輸和延遲。
谷歌為Ironwood TPU量身打造了低延遲、高帶寬的ICI網(wǎng)絡(luò),以支持在全TPU集群規(guī)模下的協(xié)調(diào)與同步通信。
Ironwood 芯片搭載了第三代 SparseCore 加速器,該加速器首次應(yīng)用于 TPU v5p,并在去年的 Trillium 芯片中得到了進(jìn)一步的優(yōu)化。
SparseCore 芯片最初旨在加速推薦模型的運(yùn)行,這些模型通過(guò)使用嵌入技術(shù)來(lái)實(shí)現(xiàn)跨用戶類別的推薦功能。
推理優(yōu)化將成為AI模型發(fā)展新趨勢(shì)
Ironwood芯片,作為谷歌推出的首款專為推理運(yùn)算設(shè)計(jì)的TPU,承擔(dān)著將經(jīng)過(guò)訓(xùn)練的AI模型應(yīng)用于實(shí)際場(chǎng)景,進(jìn)而產(chǎn)生預(yù)測(cè)或響應(yīng)的任務(wù)。
推理運(yùn)算相較于訓(xùn)練過(guò)程,每日在全球范圍內(nèi)發(fā)生數(shù)十億次,其成本與效率對(duì)于AI技術(shù)的經(jīng)濟(jì)性具有決定性影響。
長(zhǎng)期以來(lái),業(yè)界致力于構(gòu)建規(guī)模日益龐大的基礎(chǔ)模型,各大公司主要在模型參數(shù)量級(jí)和訓(xùn)練能力上展開(kāi)競(jìng)爭(zhēng)。
然而,當(dāng)前階段,部署效率和推理能力的重要性日益凸顯。
谷歌的這一戰(zhàn)略轉(zhuǎn)變,不僅標(biāo)志著AI領(lǐng)域的一個(gè)關(guān)鍵轉(zhuǎn)折點(diǎn),也預(yù)示著我們正邁入一個(gè)以部署效率和推理能力為核心的全新發(fā)展階段。
Ironwood芯片的推出,降低了運(yùn)行復(fù)雜AI模型的經(jīng)濟(jì)負(fù)擔(dān)和操作難度,使得更廣泛的商業(yè)實(shí)體能夠承受并部署先進(jìn)的AI系統(tǒng)。
此外,Ironwood芯片的高能效特性有助于減少數(shù)據(jù)中心的能源消耗,這對(duì)于推動(dòng)AI技術(shù)的可持續(xù)發(fā)展具有積極意義。
谷歌還提出了多智能體系統(tǒng)的構(gòu)想,通過(guò)Agent開(kāi)發(fā)套件(ADK)和Agent間互操作性協(xié)議(A2A),旨在實(shí)現(xiàn)不同框架和供應(yīng)商構(gòu)建的AI代理之間的通信。
這種互操作性預(yù)期將打破AI系統(tǒng)的孤立狀態(tài),促進(jìn)AI技術(shù)在企業(yè)中的更廣泛運(yùn)用。
谷歌正與Salesforce、ServiceNow、SAP等超過(guò)五十家行業(yè)領(lǐng)先企業(yè)合作,共同推進(jìn)這一AI互操作性標(biāo)準(zhǔn)的實(shí)施。
結(jié)尾:
顯而易見(jiàn),經(jīng)過(guò)多年的尖端技術(shù)革新,谷歌在AI領(lǐng)域的探索邊界正不斷擴(kuò)展。
其發(fā)展路徑從單一工具演進(jìn)至端到端的AI平臺(tái),從通用領(lǐng)域深入至垂直行業(yè),從封閉系統(tǒng)轉(zhuǎn)向開(kāi)放生態(tài)的構(gòu)建,以及從AI的初步嘗試到規(guī);渴。
目前,谷歌所展現(xiàn)的模型、平臺(tái)與芯片三位一體的差異化優(yōu)勢(shì)正逐步顯現(xiàn)。
部分資料參考:機(jī)器之心:《42.5 Exaflops:谷歌新TPU性能超越最強(qiáng)超算24倍,智能體協(xié)作協(xié)議A2A出爐》,信創(chuàng)芯球:《谷歌推出第七代TPUIronwood AI芯片,將重塑AI推理新格局》,Infoc:《TPU 性能提升10倍,開(kāi)源 A2A 顛覆智能體交互》
原文標(biāo)題 : AI芯天下丨熱點(diǎn)丨谷歌第七代TPU來(lái)了,號(hào)稱迄今為止最強(qiáng)大的AI處理器

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車】汽車E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書(shū)】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開(kāi)始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺(tái)
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來(lái)商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽(yáng)光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開(kāi)成長(zhǎng)空間
- 8 地平線自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?