大模型時(shí)代進(jìn)入尾聲:場(chǎng)景式模型接棒
文/彭藝信
編輯/侯煜
ChatGPT像里科技行業(yè)里的鲇魚(yú),攪動(dòng)一池春水。自從它出現(xiàn)之后,中國(guó)科技企業(yè)扎堆發(fā)布AI大模型。
有人嘲諷,ChatGPT在中國(guó)即將“畝產(chǎn)過(guò)萬(wàn)”;也有人調(diào)侃,下個(gè)階段該是“全民大模型,ChatGPT進(jìn)萬(wàn)家”了吧;還有人直言,ChatGPT是十月懷胎,中國(guó)大模型一個(gè)月成型。
中國(guó)大模型為何能飛速成型?究竟是養(yǎng)在深閨人未識(shí),還是跟風(fēng)造概念?阿里云CTO周靖人說(shuō)過(guò),動(dòng)輒超千億參數(shù)的大模型研發(fā),不是單一的算法問(wèn)題,也不是靠簡(jiǎn)單堆積GPU就能實(shí)現(xiàn)的。大模型是囊括了底層算力、網(wǎng)絡(luò)、存儲(chǔ)、大數(shù)據(jù)、AI框架、AI模型等復(fù)雜技術(shù)的系統(tǒng)性工程,需要AI-云計(jì)算的全棧技術(shù)能力。
在當(dāng)下增長(zhǎng)乏力的科技互聯(lián)網(wǎng)產(chǎn)業(yè)生態(tài)中,互聯(lián)網(wǎng)企業(yè)把大模型當(dāng)做救命草。不過(guò),盡管市場(chǎng)火熱,但潮退后才能見(jiàn)識(shí)真實(shí)力。
中國(guó)科技圈,大模型的大躍進(jìn)如火如荼,但在本月初, OpenAI 的 CEO 在演講中警告稱(chēng):我們已經(jīng)處在大模型時(shí)代的尾聲,并表示如今的生成式AI (AIGC )發(fā)展中,將數(shù)據(jù)模型進(jìn)一步做大,塞進(jìn)更多數(shù)據(jù)的方式,已經(jīng)是目前人工智能發(fā)展中最后一項(xiàng)重大進(jìn)展,并且還聲稱(chēng)目前還不清楚未來(lái)的發(fā)展方向如何。
可以預(yù)言的是,當(dāng)下大模型技術(shù)對(duì)于 AIGC 的發(fā)展至關(guān)重要,但從長(zhǎng)遠(yuǎn)來(lái)講,AI 的發(fā)展絕不會(huì)永遠(yuǎn)依賴(lài)大模型的參數(shù)提升和算力的堆砌。未來(lái),針對(duì)更具體的應(yīng)用場(chǎng)景,開(kāi)發(fā)更小更精準(zhǔn)、針對(duì)應(yīng)用場(chǎng)景的模型才是發(fā)展的方向。
本文將盤(pán)點(diǎn)目前市場(chǎng)上呼聲較高的大模型,中國(guó)大模型究竟是曇花一現(xiàn),還是千錘百煉不斷精進(jìn),讓我們持續(xù)關(guān)注。
OpenAI
2021年11月,OpenAI推出了GPT3.0。它是運(yùn)用1759億個(gè)參數(shù)所實(shí)現(xiàn)的預(yù)訓(xùn)練語(yǔ)言模型。去年年底ChatGPT問(wèn)世,該系統(tǒng)發(fā)布后五天內(nèi)就吸引了超過(guò)100萬(wàn)用戶(hù)。
ChatGPT是人工智能技術(shù)驅(qū)動(dòng)的自然語(yǔ)言處理工具,其使用的人類(lèi)反饋的強(qiáng)化學(xué)習(xí)技術(shù),可以更容易推斷出用戶(hù)的意圖,產(chǎn)生更自然和更合理的回答,像人類(lèi)一樣來(lái)聊天交流,完成撰寫(xiě)視頻腳本、文案、代碼、論文等任務(wù)。
今年2月OpenAl投資人微軟宣布推出由ChatGPT支持的最新版本人工智能搜索引擎Bing(必應(yīng))和Edge瀏覽器,到今年3月15日,OpenAI推出GPT-4文本生成AI系統(tǒng),但僅向Plus付費(fèi)訂閱用戶(hù)及企業(yè)和開(kāi)發(fā)者開(kāi)放。
OpenAI公布的訓(xùn)練GPT模型由于訓(xùn)練過(guò)程復(fù)雜,數(shù)據(jù)不透明,加上長(zhǎng)期的技術(shù)迭代等,其在算法層和硬件層積累起巨大優(yōu)勢(shì),外界想要復(fù)制ChatGPT并不容易,ChatGPT目前在大模型領(lǐng)域的霸主地位無(wú)人能夠撼動(dòng),OpenAI市場(chǎng)估值已經(jīng)達(dá)到290億美元,成為世界上估值最高的初創(chuàng)公司。
現(xiàn)在的ChatGPT面對(duì)的不只是商業(yè)化和監(jiān)管的壓力,由馬斯克、圖靈獎(jiǎng)得主Bengio等千人聯(lián)名的“暫停高級(jí)AI研發(fā)”的公開(kāi)信,目前簽名數(shù)量已有9000多人,此外,它也受到越來(lái)越多的國(guó)家的抵制,在其出現(xiàn)的兩個(gè)月后,意大利就宣布禁止使用ChatGPT,原因是認(rèn)為ChatGPT平臺(tái)不安全并且會(huì)非法收集大量用戶(hù)信息。
特點(diǎn):可以直接面向C端用戶(hù)群體。
參數(shù)量大:ChatGPT-3模型使用了1750億個(gè)參數(shù), ChatGPT-4的參數(shù)量更大,
迭代快:OpenAI在原本官網(wǎng)產(chǎn)品下拉菜單中的ChatGPT已換成了GPT-4。
百度“文心一言”大模型
作為國(guó)內(nèi)人工智能(AI)領(lǐng)域的旗手,今年3月,百度就推出直接對(duì)標(biāo)ChatGPT的文心一言。
文心一言也擁有文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理邏輯推算、中文理解、多模態(tài)生成的能力。百度文心一言的發(fā)布會(huì)后一小時(shí)內(nèi),排隊(duì)申請(qǐng)文心一言企業(yè)版 API 調(diào)用服務(wù)測(cè)試的企業(yè)用戶(hù)超 3 萬(wàn)家,申請(qǐng)產(chǎn)品測(cè)試網(wǎng)頁(yè)多次被擠爆。
根據(jù)后期大量試用的反饋,文心一言也暴露出通過(guò)模式和規(guī)則來(lái)生成文本等問(wèn)題,對(duì)比之下,業(yè)界出現(xiàn)了“百度搶占大模型市場(chǎng)的心態(tài)操之過(guò)急”的看法,也讓大家看到了國(guó)內(nèi)外自然語(yǔ)言處理大模型方面的差距。
事實(shí)上百度在大模型領(lǐng)域沉淀已久,百度早在2019年就推出了文心大模型ERNIE 1.0,而目前,ERNIE 3.0每天接受數(shù)十億用戶(hù)的搜索請(qǐng)求。文心一言會(huì)基于飛槳深度學(xué)習(xí)平臺(tái)和文心知識(shí)增強(qiáng)大模型,持續(xù)從海量數(shù)據(jù)和大規(guī)模知識(shí)中融合學(xué)習(xí),具有知識(shí)增強(qiáng)、檢索增強(qiáng)和對(duì)話(huà)增強(qiáng)的技術(shù)特色。
已有650家企業(yè)伙伴加入文心一言生態(tài),包括小度和自動(dòng)駕駛Apollo等產(chǎn)品,以及愛(ài)奇藝等公司也已經(jīng)接入百度的文心一言模型。
特點(diǎn):擁有三級(jí)大模型技術(shù)體系
形成了“基礎(chǔ)-任務(wù)-行業(yè)”三級(jí)大模型技術(shù)體系,擁有NLP、計(jì)算機(jī)視覺(jué)(CV)、跨模態(tài)等基礎(chǔ)大模型,以及對(duì)話(huà)、跨語(yǔ)言、搜索等任務(wù)大模型,還有生物計(jì)算領(lǐng)域大模型、各行業(yè)大模型及支撐大模型應(yīng)用的工具平臺(tái)。
阿里通義大模型
4月11日,阿里云智能首席技術(shù)官周靖人在阿里云峰會(huì)上正式官宣阿里巴巴“通義千問(wèn)”。
打開(kāi)通義千問(wèn),是一個(gè)聊天對(duì)話(huà)框,與競(jìng)品相似,通義千問(wèn)在作為“問(wèn)答機(jī)器人”基礎(chǔ)上還新增了圖片生成應(yīng)用功能,通過(guò)拍照上傳一張功能草圖,便可以自動(dòng)生成低代碼業(yè)務(wù)應(yīng)用。
實(shí)際上,早在2022年9月阿里巴巴達(dá)摩院就發(fā)布了“通義”大模型,打造了國(guó)內(nèi)首個(gè)AI統(tǒng)一底座,并且通義M6使用的參數(shù)規(guī)模超過(guò)了ChatGPT,是全球參數(shù)規(guī)模最大的AI模型。
去年11月阿里還正式提出“Model as a Service”理念,牽頭搭建了國(guó)內(nèi)規(guī)模最大的AI模型服務(wù)社區(qū)“魔塔”,公布的數(shù)據(jù)顯示,魔塔社區(qū)目前已有超100萬(wàn)活躍用戶(hù),模型累計(jì)下載次數(shù)超1600萬(wàn),模型總數(shù)達(dá)800個(gè),與十幾個(gè)頂尖人工智能機(jī)構(gòu)合作。
接下來(lái),阿里所有App,包括天貓、淘寶、釘釘?shù)任磥?lái)都會(huì)接入通義千問(wèn),進(jìn)行全面改造。
通義大模型更偏向?yàn)锽端服務(wù),周靖人在峰會(huì)上強(qiáng)調(diào),未來(lái)每一個(gè)企業(yè)在阿里云上既可以調(diào)用“通義千問(wèn)”的全部能力,也可以結(jié)合企業(yè)自己的行業(yè)知識(shí)和應(yīng)用場(chǎng)景,訓(xùn)練自己的企業(yè)大模型。在2022年阿里就將AI應(yīng)用于電力調(diào)度,聯(lián)合電網(wǎng)研發(fā)出高精度電網(wǎng)負(fù)荷預(yù)測(cè)模型,現(xiàn)已在山東德州落地。
特點(diǎn):服務(wù)B端、瞄準(zhǔn)企業(yè)客戶(hù)
商湯“日日新大模型”
在4月10日的商湯技術(shù)交流日活動(dòng)上,商湯“日日新SenseNova”大模型體系正式問(wèn)世,作為中文大模型,其包含自然語(yǔ)言處理、內(nèi)容生成、自動(dòng)化數(shù)據(jù)標(biāo)注、自定義模型訓(xùn)練等多種大模型及能力,商湯還公布了基于該體系的AI內(nèi)容生成式平臺(tái)——包括秒畫(huà)、如影、瓊宇、格物等。
目前商湯在AI領(lǐng)域的投入規(guī)模已經(jīng)超過(guò)百億,商湯已打造CV(計(jì)算機(jī)視覺(jué))、NLP(自然語(yǔ)言處理)、AIGC(人工智能內(nèi)容生成)多個(gè)AI大模型,歷時(shí)五年,商湯一直秉持“模型重在能力而非規(guī)模”的看法,在2019年于上海臨港建設(shè)的商湯人工智能計(jì)算中心,共有5000P算力,大裝置擁有2.7萬(wàn)塊GPU芯片卡,實(shí)現(xiàn)自供算力以訓(xùn)練大模型。
商湯也發(fā)布了自研類(lèi)ChatGPT產(chǎn)品“商量”,作為千億級(jí)參數(shù)的自然語(yǔ)言處理模型,其能夠提供以下功能:編程助手,幫助開(kāi)發(fā)者編寫(xiě)和調(diào)試代碼;健康咨詢(xún)助手,為用戶(hù)提供個(gè)性化的醫(yī)療建議;PDF文件閱讀助手,能輕松從復(fù)雜文檔中提取和概括信息等能力,商湯科技聯(lián)合創(chuàng)始人王曉剛則表示“商量”大模型未來(lái)主要面向To B端。
此外商湯的大模型研發(fā)體系在多種行業(yè)場(chǎng)景中落地,比如為政企客戶(hù)提供包括視覺(jué)感知通用任務(wù)與標(biāo)注服務(wù)等多種靈活的API接口和服務(wù),客戶(hù)根據(jù)實(shí)際應(yīng)用需求調(diào)用大模型的各種AI技術(shù)能力。“日日新SenseNova”應(yīng)用在智能駕駛領(lǐng)域,實(shí)現(xiàn)了可識(shí)別3000類(lèi)物體的BEV環(huán)視通用感知算法的實(shí)車(chē)量產(chǎn),也構(gòu)建了感知決策一體化的自動(dòng)駕駛多模態(tài)模型,能夠給環(huán)境、行為、動(dòng)機(jī)解碼能力帶來(lái)突破。
特點(diǎn):場(chǎng)景式大模型,關(guān)注具體的使用場(chǎng)景
Meta
2023年2月25日,作為硅谷三巨頭之一的Meta,在官網(wǎng)公布了一個(gè)新的大型語(yǔ)言模型 LLaMA(Large Language Model Meta AI),Meta提供了70億、130億、330億和650億四種參數(shù)規(guī)模的 LLaMA 模型,由Meta的FAIR團(tuán)隊(duì)開(kāi)發(fā),接受了20種語(yǔ)言的訓(xùn)練。Guillaume Lample 在其Twitter上聲稱(chēng):LLaMA130億參數(shù)版本的表現(xiàn),在大多數(shù)測(cè)試上表現(xiàn)優(yōu)于GPT-31750億參數(shù)版。
為了區(qū)別于ChatGPT,Meta首席執(zhí)行官馬克·扎克伯格表示,LLaMA 模型旨在幫助研究人員推進(jìn)工作,在生成文本、對(duì)話(huà)、總結(jié)書(shū)面材料、證明數(shù)學(xué)定理或預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)等更復(fù)雜的任務(wù)方面有很大的前景。
據(jù)了解,LLaMA 模型也有著其他大語(yǔ)言模型的通。簳(huì)產(chǎn)生偏見(jiàn)性、虛假的內(nèi)容。Meta會(huì)向非商用的研究機(jī)構(gòu)開(kāi)放 LLaMA源代碼,根據(jù)具體情況授予學(xué)術(shù)研究人員訪(fǎng)問(wèn)權(quán)限,開(kāi)源吸引來(lái)的更多的研究者可以幫助解決這些問(wèn)題。
除此之外,Meta AI在官網(wǎng)發(fā)布了圖像分割大模型SAM,該模型在圖片元素識(shí)別與分割上的表現(xiàn)遠(yuǎn)超預(yù)期。英偉達(dá)AI科學(xué)家Jim Fan在社交媒體上表示,SAM讓計(jì)算機(jī)視覺(jué)(CV)迎來(lái)“GPT-3時(shí)刻”,它已經(jīng)了解了物體的一般概念,即使對(duì)于未知對(duì)象、不熟悉的場(chǎng)景(例如水下圖像)和在模棱兩可的情況下也能很好地進(jìn)行圖像分割。
特點(diǎn):開(kāi)源、圖像識(shí)別能力強(qiáng)
谷歌
2023年2月,Google發(fā)布了Bard大模型,這是一款用于對(duì)抗ChatGPT、在一個(gè)大型語(yǔ)言模型(LLM)基礎(chǔ)上推出的智能聊天機(jī)器人,Bard作為谷歌對(duì)話(huà)應(yīng)用語(yǔ)言模型,可以說(shuō)是LLaMDA的一個(gè)輕量和優(yōu)化版本。3月21日,谷歌向公眾開(kāi)放了Bard的訪(fǎng)問(wèn)權(quán)限,但目前僅支持年滿(mǎn)18歲的美英用戶(hù)注冊(cè)試用,且只支持英文提問(wèn)。
Bard也為用戶(hù)提供了一個(gè)單獨(dú)的聊天界面,從AI功能上來(lái)看,Bard跟其他AI模型大同小異,用戶(hù)可以在文本框中進(jìn)行提問(wèn)和搜索,比如讓Bard幫你寫(xiě)一篇文章、列一個(gè)計(jì)劃、解決一個(gè)題目得出結(jié)果等。
然而在谷歌短短的幾秒展示里,Bard就出現(xiàn)了大問(wèn)題:被問(wèn)到“我可以告訴我 9 歲的孩子關(guān)于詹姆斯·韋伯太空望遠(yuǎn)鏡(簡(jiǎn)稱(chēng)JWST)的哪些新發(fā)現(xiàn)?”時(shí), Bard的回答里面有一個(gè)巨大的錯(cuò)誤:回答里提到“ JWST 拍攝到了太陽(yáng)系外行星的第一張照片”,事實(shí)上,第一張系外行星照片應(yīng)該是2004年由歐洲南方天文臺(tái)的Very Large Telescope拍攝的。
由于有了上線(xiàn)后曾出現(xiàn)的混亂和批評(píng)的前車(chē)之鑒,現(xiàn)在谷歌Bard整個(gè)界面都透露出谷歌滿(mǎn)滿(mǎn)的求生欲。在你開(kāi)始使用Bard之前,會(huì)有一個(gè)免責(zé)聲明,明確提醒你Bard目前還只處于實(shí)驗(yàn)階段。無(wú)論是在提問(wèn)的文本框下面還是答案生成框下方,時(shí)刻都寫(xiě)著一行小字,提醒用戶(hù)“Bard可能生成不準(zhǔn)確或者略帶攻擊性的信息,但并不代表谷歌官方觀點(diǎn)”。
特點(diǎn):聊天大模型、準(zhǔn)確性不佳
360
3月29日,在“2023數(shù)字安全與發(fā)展高峰論壇”上,周鴻祎現(xiàn)場(chǎng)演示了360自研的人工智能語(yǔ)言模型在360瀏覽器上的應(yīng)用,并宣布了360的人工智能發(fā)展戰(zhàn)略。
360于4月9日公告,基于360GPT大模型開(kāi)發(fā)的人類(lèi)智能產(chǎn)品矩陣“360 智能腦”將落地搜索場(chǎng)景,面向企業(yè)用戶(hù)開(kāi)放內(nèi)測(cè)。據(jù)了解,企業(yè)用戶(hù)在PC端360 搜索首頁(yè)申請(qǐng)并獲得測(cè)試資格后,可通過(guò)企業(yè)安全云體驗(yàn)使用。未來(lái),360 智腦將與瀏覽器、數(shù)字助理、蘇打辦公、智能營(yíng)銷(xiāo)等場(chǎng)景應(yīng)用深度結(jié)合,全面提升用戶(hù)工作效率。
特點(diǎn):面向B端
昆侖萬(wàn)維
昆侖萬(wàn)維公眾號(hào)在4月10日宣布:由昆侖萬(wàn)維和奇點(diǎn)智源合作自研的,中國(guó)第一個(gè)真正實(shí)現(xiàn)智能涌現(xiàn)的國(guó)產(chǎn)大語(yǔ)言模型——“天工3.5”發(fā)布在即,并于4月17日啟動(dòng)邀請(qǐng)測(cè)試。
昆侖萬(wàn)維甚至宣稱(chēng)“天工”大模型已經(jīng)非常接近OpenAI ChatGPT的智能水平。ChatGPT是基于GPT3.5大模型,所以把這個(gè)版本命名為“天工3.5”。昆侖萬(wàn)維研發(fā)團(tuán)隊(duì)2020年從一億級(jí)模型做起,上升至十億級(jí)模型,再到百億級(jí)模型,在三年后將研究成果放入大模型之戰(zhàn),選擇開(kāi)源的方式入局。
特點(diǎn):偏向C端的語(yǔ)言大模型
原文標(biāo)題 : 大模型時(shí)代進(jìn)入尾聲:場(chǎng)景式模型接棒

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車(chē)電子技術(shù)在線(xiàn)大會(huì)
-
4月30日立即下載>> 【村田汽車(chē)】汽車(chē)E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線(xiàn)下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線(xiàn)會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書(shū)】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專(zhuān)題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開(kāi)始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 “AI寒武紀(jì)”爆發(fā)至今,五類(lèi)新物種登上歷史舞臺(tái)
- 4 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來(lái)商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽(yáng)光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開(kāi)成長(zhǎng)空間
- 8 地平線(xiàn)自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?