訂閱
糾錯(cuò)
加入自媒體

DeepSeek——中國(guó)大模型產(chǎn)業(yè)的“春雷”,A股市場(chǎng)的“驚蟄”

本文為西京研究院發(fā)表的第808篇文章,根據(jù)研傳會(huì)旬度直播內(nèi)容整理,有刪節(jié)。

春節(jié)期間,杭州的80后小伙突然打破了世界科技舞臺(tái)上沉默許久的平靜,也同步給全球資本市場(chǎng)帶來(lái)了巨大擾動(dòng),特別是對(duì)以英偉達(dá)為代表的美股巨頭造成了直接沖擊。這對(duì)靠AI產(chǎn)業(yè)支撐的美股來(lái)說(shuō),無(wú)疑是一只黑天鵝。雖然這幾天英偉達(dá)股價(jià)有所修復(fù),但巨大的跳空缺口及被打擊的信心何時(shí)能夠完全修復(fù)仍需更多時(shí)間觀察。對(duì)于投資而言,我們需要了解的是,這到底是一次短暫的技術(shù)沖擊,還是一次具有深遠(yuǎn)意義的技術(shù)相變。

我們之前強(qiáng)調(diào)過(guò)924是一次政策相變——貨幣大放水,顯示了頂層經(jīng)濟(jì)思路的改變也彰顯了維護(hù)資本市場(chǎng)的信心,推動(dòng)了一次估值水平的整體修復(fù)。新的政策看跌期權(quán)保證了指數(shù)在3200點(diǎn)左右的新中樞開(kāi)始運(yùn)行,即使再有波動(dòng)也不會(huì)輕易打破那一次的低點(diǎn)。從924相變后,科技板塊已經(jīng)取得非常明顯的上漲,科技股估值中樞已大幅上移。目前,我們需要考慮的是科技端是否也存在趨勢(shì)性提升的可能,Deepseek是否正在促發(fā)一場(chǎng)革命性、顛覆性的科技領(lǐng)域相變。

一、一次重大的工程創(chuàng)新

當(dāng)前我們首先需要思考的是Deepseek的影響該如何定義?要拋開(kāi)自媒體“國(guó)運(yùn)論”與“鬧劇論”簡(jiǎn)單的極端論述,客觀的從技術(shù)研究本身對(duì)其進(jìn)行思考。首先,先談我的結(jié)論,通過(guò)這些天較為深入的調(diào)研、研究,我想說(shuō)的是目前我對(duì)Deepseek的最新認(rèn)知與我前些天那篇《DeepSeek是國(guó)運(yùn)崛起還是一個(gè)奇跡》的觀點(diǎn)仍保持一致。雖然不能說(shuō)Deepseek是一次偉大的技術(shù)革命,但它確實(shí)是一次里程碑式的工程創(chuàng)新,是中國(guó)工程師文化內(nèi)核優(yōu)勢(shì)的再一次完美體現(xiàn)。

我們可以把技術(shù)革命分為科學(xué)革命和工業(yè)革命兩個(gè)過(guò)程去看。人工智能的發(fā)展也一樣,人工智能其實(shí)早已有著很長(zhǎng)的研究與發(fā)展歷史,差不多從上世紀(jì)60年代就已經(jīng)正式開(kāi)始。如果從圖靈提出的相關(guān)概念開(kāi)始算起,那時(shí)間會(huì)更早。而真正讓Ai被大家所認(rèn)知的則是微軟的阿爾法Go,與GPT相似他們都采用了強(qiáng)化學(xué)習(xí)(RL)方式,通過(guò)大量實(shí)際交互在與高手過(guò)招的過(guò)程中進(jìn)行學(xué)習(xí)。阿爾法Go的厲害之處在于它并非完全基于過(guò)去的預(yù)訓(xùn)練,而是依靠記憶能力不斷地學(xué)習(xí)和強(qiáng)化,是人工智能革命中一次重要的技術(shù)里程碑。

汽車(chē)不是中國(guó)發(fā)明的,但今天的中國(guó)是汽車(chē)第一生產(chǎn)大國(guó),新能源汽車(chē)的核心技術(shù)也不是中國(guó)發(fā)明的,但中國(guó)現(xiàn)在的新能源車(chē)可以橫掃全球。要知道,歐洲中世紀(jì)的圣經(jīng)抄寫(xiě)工作非常昂貴,而中國(guó)的活字印刷術(shù)傳到歐洲后,使得圣經(jīng)變得非常便宜且迅速流行,讓每個(gè)人都可以閱讀圣經(jīng)。知識(shí)不再被壟斷,人的價(jià)值就被凸顯出來(lái),這直接導(dǎo)致了歐洲的宗教革命、科學(xué)革命和文藝啟蒙等一系列變革,也就是所謂的啟蒙運(yùn)動(dòng)。真正讓美國(guó)人能開(kāi)得起汽車(chē)的是福特流水線的功勞,它是流程優(yōu)化,是成本降低。究竟是發(fā)明汽車(chē)的科學(xué)家偉大,還是讓每個(gè)人都開(kāi)上汽車(chē)的工程師偉大?

人工智能也是如此,如果沒(méi)有Deepseek的出現(xiàn),那我們這個(gè)世界距離大模型應(yīng)用的平民化就還有很長(zhǎng)一段距離。許多海外公司,包括硅谷的工程師甚至一些海外傳統(tǒng)的不友好媒體,對(duì)Deepseek的評(píng)價(jià)其實(shí)是很高的,有的甚至贊不絕口?梢哉f(shuō)這是一次重大的工程改造,甚至可以認(rèn)為是人工智能領(lǐng)域的一次工業(yè)革命。

二、從deepseek的崛起看Ai的發(fā)展路徑與趨勢(shì)

2017年,Google推出了一個(gè)專(zhuān)門(mén)從事機(jī)器翻譯的架構(gòu)模型,它引入了自注意力機(jī)制,能夠更高效地捕捉序列數(shù)據(jù)中的長(zhǎng)距離依賴(lài)關(guān)系,而且支持并行計(jì)算,大大提高了訓(xùn)練和推理的速度,這就是Transformer架構(gòu)。依靠這一優(yōu)勢(shì)特點(diǎn),Transformer迅速擴(kuò)展到自然語(yǔ)言處理的其他領(lǐng)域,并逐漸成為大語(yǔ)言模型處理的主流架構(gòu),從實(shí)質(zhì)上推動(dòng)了生成式人工智能的發(fā)展。

人工智能的本質(zhì)是數(shù)學(xué)與物理的運(yùn)用問(wèn)題,是在電力革命和芯片革命等物理學(xué)革命的基礎(chǔ)上逐漸實(shí)現(xiàn)的,而模型的工作原理其實(shí)并不難,是非常典型的數(shù)學(xué)應(yīng)用問(wèn)題,主要運(yùn)用三個(gè)數(shù)學(xué)理論,即線性代數(shù),統(tǒng)計(jì)學(xué)與微積分。首先運(yùn)用線性代數(shù)將文字轉(zhuǎn)化為數(shù)字向量,之后使用語(yǔ)言統(tǒng)計(jì)學(xué)將文字形成一串?dāng)?shù)字編碼,并進(jìn)行回歸運(yùn)算。人工智能通過(guò)海量的數(shù)據(jù)運(yùn)算,利用空間的廣度實(shí)現(xiàn)無(wú)限可能,如果時(shí)間足夠長(zhǎng),空間足夠大,就可能演化出各種運(yùn)算結(jié)果。

硅谷的數(shù)學(xué)家和物理學(xué)家是一批有理想的知識(shí)精英,他們引領(lǐng)了這場(chǎng)技術(shù)革命。然而,他們往往忽視工程學(xué)問(wèn)題,比如如何節(jié)約成本和提高效率。Deepseek的厲害之處就在于它用Fp8,也就是8位二進(jìn)制數(shù)值的浮點(diǎn)計(jì)算能力,解決了國(guó)外Fp32運(yùn)算能力所能實(shí)現(xiàn)的工作,讓硅谷高傲的精英模型突然變成了拼多多,讓更多普通大眾能夠用的起Ai。但在旨在追求星辰大海的硅谷科學(xué)家來(lái)看,對(duì)比先進(jìn)的 Fp32 浮點(diǎn)格式,使用Fp8 是一種倒退,即使 Fp8 可以大幅降低成本,可以說(shuō)方法都是逼出來(lái)的。DeepSeek在訓(xùn)練端和推理端都進(jìn)行了重大的工程優(yōu)化,特別是蒸餾技術(shù)的應(yīng)用。

硅谷的科學(xué)家們往往專(zhuān)注于前沿技術(shù)的開(kāi)發(fā),在要錢(qián)有錢(qián),要芯片有芯片的優(yōu)渥環(huán)境中,他們?nèi)菀缀鲆暢杀镜膯?wèn)題。但高端芯片價(jià)格高昂,大模型訓(xùn)練成本巨大,普通人難以參與。這種分化導(dǎo)致了技術(shù)的門(mén)檻越來(lái)越高,而且未來(lái)可能會(huì)更加嚴(yán)重,只有少數(shù)人能夠引領(lǐng)技術(shù)的發(fā)展。而且隨著歷史可用數(shù)據(jù)的不斷消耗,以及訓(xùn)練成本越來(lái)越高,模型預(yù)訓(xùn)練效果難以持續(xù)提升,預(yù)訓(xùn)練時(shí)代也可能即將結(jié)束。所以有的公司開(kāi)始探索新的訓(xùn)練方法,比如強(qiáng)化學(xué)習(xí)和監(jiān)督微調(diào),以減少對(duì)預(yù)訓(xùn)練的依賴(lài),從而在降低成本的同時(shí)提高模型的效率。此外,還有一些公司還采用了混合專(zhuān)家模式和多頭注意力機(jī)制,進(jìn)一步優(yōu)化了推理過(guò)程。通過(guò)這種方式,模型可以在推理時(shí)只調(diào)用必要的參數(shù),從而節(jié)省大量算力。新技術(shù)的應(yīng)用可能會(huì)帶來(lái)一場(chǎng)新的工業(yè)革命,推動(dòng)全球技術(shù)生態(tài)的發(fā)展。

我認(rèn)為這場(chǎng)技術(shù)革命不僅會(huì)改變科技行業(yè),還會(huì)對(duì)整個(gè)社會(huì)產(chǎn)生深遠(yuǎn)影響。成本的降低可能會(huì)使更多人能夠使用這些技術(shù),推動(dòng)工業(yè)化制造能力的提升和人類(lèi)認(rèn)知平權(quán)事業(yè)的發(fā)展。同時(shí),這也可能會(huì)引發(fā)一系列社會(huì)和經(jīng)濟(jì)問(wèn)題,需要我們密切關(guān)注。

最后,我再次做個(gè)提示供大家思考,就是這次deepseek引發(fā)的大模型工程創(chuàng)新,會(huì)不會(huì)蓄力2024年924以來(lái)的A股牛市,從“貨幣牛”轉(zhuǎn)換到“科技牛”,類(lèi)似2022年11月chatgpt橫空出世以后的美股。當(dāng)然,美股的“科技牛”七成靠七巨頭,中國(guó)的“科技牛”有沒(méi)有這樣的七巨頭支撐呢?我保持著一定程度的樂(lè)觀。

       原文標(biāo)題 : 趙建:DeepSeek——中國(guó)大模型產(chǎn)業(yè)的“春雷”,A股市場(chǎng)的“驚蟄”

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)