訂閱
糾錯
加入自媒體

AI大模型的2025年:智能體、多模態(tài)、更普惠

在2024年,全球科技領(lǐng)域取得了眾多突破性進展,人工智能(AI)、量子計算、清潔能源、生物技術(shù)等領(lǐng)域的成就深刻改變了我們的生活。展望2025,科技發(fā)展將進一步呈現(xiàn)加速態(tài)勢,同時也將與社會、經(jīng)濟和環(huán)境的需求更緊密地結(jié)合。未來一年,不僅是技術(shù)創(chuàng)新的關(guān)鍵節(jié)點,也將是技術(shù)從突破到成熟應(yīng)用的加速時期。

其中人工智能行業(yè)更是全球關(guān)注的重點。那么在2025年,人工智能行業(yè)將有什么趨勢呢?

01可能的趨勢一:智能體風起云涌

第一個可能的趨勢是智能體這種應(yīng)用形態(tài)將風起云涌。在2024年,智能體已開始被各大科技公司重視起來。而到2025年,智能體或?qū)⒂瓉泶蟀l(fā)展。

在2025年ICT行業(yè)趨勢年會上,中國工程院院士鄔賀銓表示,即將到來的2025年不僅是智能體的元年,也將是AI終端的元年。

OpenAI CEO奧特曼不久前也曾說:“我們會擁有越來越好的模型,但我認為下一個巨大突破來自智能體。”

這背后的驅(qū)動力在于基礎(chǔ)大模型是由海量知識庫組成的“大腦”,能按提問和任務(wù)給出相應(yīng)地回答和操作,但仍有不足之處。具體體現(xiàn)在,大模型作為Copilot(助手),快思考、有廣度但缺深度、欠精準;大模型回答的質(zhì)量取決于提問的水平或?qū)θ蝿?wù)的精確描述;在共情方面,大模型在工程或醫(yī)療等領(lǐng)域未經(jīng)實驗或臨床實踐,書本知識難成感悟;對特定任務(wù),基礎(chǔ)大模型的大而全不僅大材小用且效率比較低。

而所謂AI智能體,實際上就是由AI驅(qū)動的軟件工具,只需要給出最小的監(jiān)督,它就可以執(zhí)行多步驟任務(wù)。除了自然語言處理,AI智能體還可以做決策、解決問題、執(zhí)行任務(wù)時與環(huán)境互動。智能體本身是一種可接受自然語言命令、可與場景互動并具有初步思維鏈的小程序,可拆分任務(wù),具有記憶、規(guī)劃、調(diào)用工具和執(zhí)行行動的能力。不僅如此,智能體通過在行動中閉環(huán)長思考將大模型的知識轉(zhuǎn)化為長期記憶甚至感悟,可獨立于大模型執(zhí)行特定任務(wù)。

在賦予了大模型“先驗”的世界知識之后,AI正在學會感知、檢索、分析、推理、規(guī)劃、決策、執(zhí)行,變成智能體。它能干活,陪伴和融入人類的場景之中。2025年,一些企業(yè)將會像培訓員工一樣構(gòu)建智能體,讓它們使用工具,在不同的應(yīng)用和平臺之間調(diào)用函數(shù)與功能,協(xié)助或獨立完成任務(wù)。智能體之間還會協(xié)作,它們改寫軟件和服務(wù)。創(chuàng)造價值,AI就是智能體。

信息技術(shù)服務(wù)和咨詢公司凱捷(Capgemini)發(fā)布的報告稱,雖然目前只有約10%的企業(yè)已經(jīng)開始使用AI智能體,但82%的企業(yè)計劃在未來三年內(nèi)將智能體整合到工作流中。

02可能的趨勢二:多模態(tài)市場增長

第二個可能的趨勢是多模態(tài)市場的增長。多模態(tài)是人類世界的本來樣貌,AGI的發(fā)展趨勢一定是朝向多模態(tài)的。技術(shù)將實現(xiàn)從文本、圖像、視頻,再到聲、光、電,甚至分子、原子等各類模態(tài),而且具備跨模態(tài)遷移的特性。

隨著通用人工智能漸行漸近,大模型將走向多模態(tài)。當前,大模型正在向端側(cè)轉(zhuǎn)移,端側(cè)大模型具有本地數(shù)據(jù)處理效率更高、節(jié)省云端服務(wù)器帶寬和算力成本、對用戶數(shù)據(jù)更好的隱私保護、開啟更多交互新方式和新體驗等獨特優(yōu)勢,或?qū)⒊蔀槲磥斫换バ氯肟凇?/p>

同時,人工智能在數(shù)學推理、新藥研發(fā)、材料發(fā)現(xiàn)、蛋白質(zhì)合成等領(lǐng)域大顯身手,“AI科學家”有望加速問世。隨著數(shù)字交互引擎與GenAI等技術(shù)的加速融合,未來將打造更多超級數(shù)字場景,助力數(shù)實融合走向新高度。

因此在2025年,多模態(tài)AI或許將成為企業(yè)采用AI的主要驅(qū)動力。這種技術(shù)通過整合圖像、視頻、音頻和文本等多種數(shù)據(jù)源,使AI能夠以前所未有的準確性從更廣泛的上下文源中學習,提供更精確、定制化的輸出,創(chuàng)造自然直觀的體驗。

谷歌相關(guān)報告預計,全球多模態(tài)AI市場規(guī)模將在2025年達到24億美元,到2037年底達到989億美元。

03可能的趨勢三:更加普惠便捷

第三個可能的趨勢是更加普惠便捷。大模型天然是一個應(yīng)用導向的技術(shù),有兩條大的發(fā)展曲線:一條曲線是能力上升,一條曲線是成本下降,帶來技術(shù)能力快速地落地和應(yīng)用。

縱觀人類科技發(fā)展史,就是一個用更低的價格做出更好的產(chǎn)品、完成最大程度普惠的過程。

如芯片上晶體管密度在摩爾定律的指導下快速提升,但單位晶體管的制造成本卻以更快的速度下降,這也才有了后來所有人都能用得起的電視、電腦、手機以及互聯(lián)網(wǎng)。

在動輒百億的資本開支面前,大模型作為某種意義上的基礎(chǔ)設(shè)施,其規(guī)模效應(yīng)需要盡早浮現(xiàn),其商業(yè)化路徑需要盡早清晰化。

關(guān)于AI普惠,國內(nèi)的大廠已經(jīng)開始行動。例如火山引擎旗下豆包視覺理解模型價格,每千tokens輸入價格為3厘。據(jù)介紹,1元錢就可處理284張720P的圖片,比行業(yè)價格便宜85%。

再如12月31日,阿里云宣布本年度第三輪大模型降價,通義千問視覺理解模型全線降價超80%。其中Qwen-VL-Plus直降81%,輸入價格僅為0.0015元/千tokens,創(chuàng)下全網(wǎng)最低價格;更高性能的Qwen-VL-Max降至0.003元/千tokens,降幅高達85%。按照最新價格,1塊錢可最多處理約600張720P圖片,或1700張480P圖片。

04結(jié)語:人工智能行業(yè)迎來新起點

隨著2025年的到來,人工智能行業(yè)正站在一個新的起點上。智能體的蓬勃發(fā)展、多模態(tài)市場的快速增長以及技術(shù)的普惠化,共同勾勒出一個更加智能、互聯(lián)和個性化的世界。這些趨勢不僅預示著技術(shù)的創(chuàng)新,也將深刻影響我們的工作方式、生活習慣乃至社會結(jié)構(gòu)。

智能體的興起,讓我們看到了AI從被動響應(yīng)到主動執(zhí)行的轉(zhuǎn)變。它們將成為我們?nèi)粘9ぷ髦械牡昧χ,不僅提高效率,更在某些領(lǐng)域展現(xiàn)出超越人類的能力。多模態(tài)AI的發(fā)展,將使得大模型能夠更好地理解和響應(yīng)復雜的查詢,提供更加豐富和直觀的交互體驗。而技術(shù)的普惠化,則意味著更多的人和企業(yè)能夠負擔得起并利用AI技術(shù),這將極大地推動社會的整體進步和創(chuàng)新。

- End -

       原文標題 : AI大模型的2025年:智能體、多模態(tài)、更普惠

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號