亚洲三及1片,欧美1819在线观看

當(dāng)前位置： OFweek 人工智能網(wǎng) > 正文

谷歌第七代TPU來(lái)了，號(hào)稱最強(qiáng)大的AI處理器

2025-04-17 14:16

前言：

預(yù)計(jì)至2025年，AI領(lǐng)域?qū)⒔?jīng)歷一次重大轉(zhuǎn)型，生成式AI的應(yīng)用將不再局限于回答簡(jiǎn)單問(wèn)題，而是通過(guò)智能系統(tǒng)解決更為復(fù)雜的問(wèn)題。

AI的未來(lái)發(fā)展不僅局限于更大規(guī)模的模型構(gòu)建，更在于模型能夠?qū)?wèn)題進(jìn)行分解、執(zhí)行多步驟推理，并模擬人類思維過(guò)程。

作者| 方文三

圖片來(lái)源|網(wǎng) 絡(luò)

谷歌第七代TPUIronwood正式發(fā)布

在本周三，谷歌公司正式推出了其第七代張量處理單元（TPU）——Ironwood。該公司宣稱，在大規(guī)模部署的條件下，該AI加速器的計(jì)算性能可達(dá)到全球最快超級(jí)計(jì)算機(jī)性能的24倍以上。

這款在Google Cloud Next 25大會(huì)上亮相的新芯片，標(biāo)志著谷歌在AI芯片研發(fā)領(lǐng)域十年戰(zhàn)略的關(guān)鍵轉(zhuǎn)折點(diǎn)。

此前谷歌自行研發(fā)的幾代TPU主要針對(duì)AI的訓(xùn)練和推理任務(wù)，而Ironwood則是首款專為推理任務(wù)設(shè)計(jì)的芯片。

Ironwood芯片旨在滿足生成式AI下一發(fā)展階段的巨大計(jì)算和通信需求。

Ironwood芯片具備卓越的技術(shù)規(guī)格，當(dāng)每個(gè)pod擴(kuò)展至9216塊芯片時(shí)，它能提供42.5 exaflops的AI計(jì)算能力。

這一數(shù)值遠(yuǎn)超目前全球最快的超級(jí)計(jì)算機(jī)El Capitan的1.7 exaflops。每塊Ironwood芯片的峰值計(jì)算能力可達(dá)4614 TFLOPs。

在單芯片規(guī)格方面，Ironwood顯著提升了內(nèi)存和帶寬性能，每塊芯片配備192GB高帶寬內(nèi)存（HBM），是去年推出的上一代TPU Trillium的六倍。

每塊芯片的內(nèi)存帶寬達(dá)到7.2 terabits/s，是Trillium的4.5倍。

該芯片專為AI推理任務(wù)而設(shè)計(jì)，象征著AI從[響應(yīng)式]模型向[主動(dòng)式]模型的演進(jìn)。

換言之，它標(biāo)志著從僅提供實(shí)時(shí)信息的模型向能夠主動(dòng)生成洞察和解讀的模型的轉(zhuǎn)變。

其目標(biāo)在于賦予智能體（Agent）主動(dòng)檢索、數(shù)據(jù)生成及協(xié)作推理的能力，而不僅僅是被動(dòng)地響應(yīng)查詢。

此外，Ironwood芯片首次支持FP8計(jì)算格式，并在張量核和矩陣數(shù)學(xué)單元中實(shí)現(xiàn)了這一功能，從而在處理大規(guī)模推理任務(wù)時(shí)顯著提升了效率。

盡管英偉達(dá)的B200芯片在某些性能指標(biāo)上略占優(yōu)勢(shì)（例如內(nèi)存帶寬達(dá)到8 Tbps，略高于Ironwood的7.2 Tbps），但I(xiàn)ronwood的整體性能依然非常接近，甚至在某些方面超越了B200。

在對(duì)谷歌Ironwood與英偉達(dá)B200進(jìn)行對(duì)比分析時(shí)，從競(jìng)爭(zhēng)格局的角度來(lái)看，谷歌通過(guò)TPU與Google Cloud、Pathways軟件棧的深度集成，吸引了OpenAI創(chuàng)始團(tuán)隊(duì)等客戶，從而加強(qiáng)了其在生成式AI市場(chǎng)的地位。

AI超級(jí)計(jì)算架構(gòu)不斷完善和升級(jí)

生產(chǎn)力的革新始于谷歌在基礎(chǔ)設(shè)施層面的全面AI化。

預(yù)計(jì)到2025年，谷歌將投資約750億美元用于服務(wù)器和數(shù)據(jù)中心的建設(shè)。

此外，為了進(jìn)一步協(xié)助客戶擁抱AI，Google Cloud 宣布將提供接近零延遲的云廣域網(wǎng)（Cloud WAN）服務(wù)，向全球數(shù)十億用戶提供。

與其它托管及開(kāi)源Kubernetes 產(chǎn)品相比，Cloud WAN 能夠?qū)⒕W(wǎng)絡(luò)性能提升40%，同時(shí)將總擁有成本（TOC）降低40%。

自去年與英偉達(dá)建立戰(zhàn)略合作伙伴關(guān)系以來(lái)，谷歌提供了基于英偉達(dá)GPU的廣泛產(chǎn)品線，使得用戶能夠在 Google Cloud 上使用英偉達(dá)最新硬件訓(xùn)練生成式AI模型。

今年，谷歌進(jìn)一步推出了搭載英偉達(dá)B200 和 GB200 Blackwell GPU 的 A4 和 A4X 虛擬機(jī)，顯著增強(qiáng)了其GPU產(chǎn)品組合。

據(jù)透露，Google Cloud 將成為首批提供英偉達(dá)下一代 Vera Rubin GPU 的公司之一，該 GPU 每個(gè)機(jī)架可提供高達(dá) 15 exaflops 的 FP4 推理性能。

除了芯片技術(shù)之外，谷歌認(rèn)為存儲(chǔ)是減少訓(xùn)練和推理瓶頸的關(guān)鍵因素。

為了實(shí)現(xiàn)更高的數(shù)據(jù)吞吐量和更低的延遲，谷歌此次對(duì)存儲(chǔ)層面也進(jìn)行了更新。

特別是，Ironwood的設(shè)計(jì)目標(biāo)是在執(zhí)行大規(guī)模張量運(yùn)算時(shí)，盡可能地減少芯片上的數(shù)據(jù)傳輸和延遲。

谷歌為Ironwood TPU量身打造了低延遲、高帶寬的ICI網(wǎng)絡(luò)，以支持在全TPU集群規(guī)模下的協(xié)調(diào)與同步通信。

Ironwood 芯片搭載了第三代 SparseCore 加速器，該加速器首次應(yīng)用于 TPU v5p，并在去年的 Trillium 芯片中得到了進(jìn)一步的優(yōu)化。

SparseCore 芯片最初旨在加速推薦模型的運(yùn)行，這些模型通過(guò)使用嵌入技術(shù)來(lái)實(shí)現(xiàn)跨用戶類別的推薦功能。

推理優(yōu)化將成為AI模型發(fā)展新趨勢(shì)

Ironwood芯片，作為谷歌推出的首款專為推理運(yùn)算設(shè)計(jì)的TPU，承擔(dān)著將經(jīng)過(guò)訓(xùn)練的AI模型應(yīng)用于實(shí)際場(chǎng)景，進(jìn)而產(chǎn)生預(yù)測(cè)或響應(yīng)的任務(wù)。

推理運(yùn)算相較于訓(xùn)練過(guò)程，每日在全球范圍內(nèi)發(fā)生數(shù)十億次，其成本與效率對(duì)于AI技術(shù)的經(jīng)濟(jì)性具有決定性影響。

長(zhǎng)期以來(lái)，業(yè)界致力于構(gòu)建規(guī)模日益龐大的基礎(chǔ)模型，各大公司主要在模型參數(shù)量級(jí)和訓(xùn)練能力上展開(kāi)競(jìng)爭(zhēng)。

然而，當(dāng)前階段，部署效率和推理能力的重要性日益凸顯。

谷歌的這一戰(zhàn)略轉(zhuǎn)變，不僅標(biāo)志著AI領(lǐng)域的一個(gè)關(guān)鍵轉(zhuǎn)折點(diǎn)，也預(yù)示著我們正邁入一個(gè)以部署效率和推理能力為核心的全新發(fā)展階段。

Ironwood芯片的推出，降低了運(yùn)行復(fù)雜AI模型的經(jīng)濟(jì)負(fù)擔(dān)和操作難度，使得更廣泛的商業(yè)實(shí)體能夠承受并部署先進(jìn)的AI系統(tǒng)。

此外，Ironwood芯片的高能效特性有助于減少數(shù)據(jù)中心的能源消耗，這對(duì)于推動(dòng)AI技術(shù)的可持續(xù)發(fā)展具有積極意義。

谷歌還提出了多智能體系統(tǒng)的構(gòu)想，通過(guò)Agent開(kāi)發(fā)套件（ADK）和Agent間互操作性協(xié)議（A2A），旨在實(shí)現(xiàn)不同框架和供應(yīng)商構(gòu)建的AI代理之間的通信。

這種互操作性預(yù)期將打破AI系統(tǒng)的孤立狀態(tài)，促進(jìn)AI技術(shù)在企業(yè)中的更廣泛運(yùn)用。

谷歌正與Salesforce、ServiceNow、SAP等超過(guò)五十家行業(yè)領(lǐng)先企業(yè)合作，共同推進(jìn)這一AI互操作性標(biāo)準(zhǔn)的實(shí)施。

結(jié)尾：

顯而易見(jiàn)，經(jīng)過(guò)多年的尖端技術(shù)革新，谷歌在AI領(lǐng)域的探索邊界正不斷擴(kuò)展。

其發(fā)展路徑從單一工具演進(jìn)至端到端的AI平臺(tái)，從通用領(lǐng)域深入至垂直行業(yè)，從封閉系統(tǒng)轉(zhuǎn)向開(kāi)放生態(tài)的構(gòu)建，以及從AI的初步嘗試到規(guī)�；渴�。

目前，谷歌所展現(xiàn)的模型、平臺(tái)與芯片三位一體的差異化優(yōu)勢(shì)正逐步顯現(xiàn)。

部分資料參考：機(jī)器之心：《42.5 Exaflops：谷歌新TPU性能超越最強(qiáng)超算24倍，智能體協(xié)作協(xié)議A2A出爐》，信創(chuàng)芯球：《谷歌推出第七代TPUIronwood AI芯片，將重塑AI推理新格局》，Infoc：《TPU 性能提升10倍，開(kāi)源 A2A 顛覆智能體交互》

原文標(biāo)題 : AI芯天下丨熱點(diǎn)丨谷歌第七代TPU來(lái)了，號(hào)稱迄今為止最強(qiáng)大的AI處理器

本地收藏打印推薦給朋友

聲明： 本文由入駐維科號(hào)的作者撰寫(xiě)，觀點(diǎn)僅代表作者本人，不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題，請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

共0條評(píng)論，0人參與

登錄登錄即可訪問(wèn)所有OFweek服務(wù)

用戶名/郵箱/手機(jī)：
密碼：
忘記密碼？
用其他賬號(hào)登錄： QQ | 微信 | 新浪微博

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

暫無(wú)評(píng)論

暫無(wú)評(píng)論

圖片新聞

最新發(fā)布

最新活動(dòng)更多

一周熱點(diǎn) 月點(diǎn)擊榜

企業(yè)服務(wù) 廣告服務(wù) 獵頭服務(wù) 薪酬報(bào)告

人工智能獵頭職位更多

掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容

文章糾錯(cuò)

x

_*文字標(biāo)題：

_*糾錯(cuò)內(nèi)容：

聯(lián)系郵箱：

_*驗(yàn) 證碼：

看不清，點(diǎn)擊換一張

粵公網(wǎng)安備 44030502002758號(hào)

感谢您访问我们的网站，您可能还对以下资源感兴趣：

在线观看中文字幕亚洲

免费无码国产在线观看69 国产高潮无套免费视频国产精品日韩综合无码专区无码a∨高潮抽搐流白浆av