OpenAl終于出手!官宣開源新模型,這次是摸著 Deepseek過河
編輯:Yuki | ID:YukiYuki1108
在暗示推出一款開源模型的一個多月后(2025年4月1日),OpenAI CEO山姆·奧特曼(Sam Altman)在社交平臺X上正式宣布:OpenAI計劃在未來幾個月內發(fā)布一款具備推理能力的“開放權重”(open-weight)大模型。這一消息迅速引發(fā)了科技媒體和行業(yè)觀察者的廣泛關注。許多中文媒體以“OpenAI預告/即將發(fā)布開源模型”為標題進行報道;一些業(yè)內人士則將其視為OpenAI重新走向開源的標志性一步。
然而,“開放權重”是否等同于“開源”?這一問題的答案并不簡單。從OpenAI的措辭
到行業(yè)實踐,“開放權重”與“開源”之間存在著顯著差異。本文將深入探討這一話題。
一、“開放權重”與“開源”:概念辨析
首先需要明確的是,“開放權重”(open-weight)與“開源”(open-source)是兩個不同的概念。
“開放權重”:指的是在模型訓練完成后公開其參數(weights),允許開發(fā)者基于這些參數進行部署、測試甚至微調。然而,“開放權重”并不包括訓練數據、完整訓練代碼或明確的使用權限。這意味著開發(fā)者可以利用這些參數進行本地部署和推理服務(如對話生成或文本分類),但無法復現完整的訓練過程或完全自由地修改模型的底層架構。
“開源”:則是一個更廣泛的概念。它不僅包括代碼公開(如訓練代碼和推理代碼),還可能涉及訓練數據、方法透明性以及使用權限的自由度。開源的核心理念是全面透明和自由使用。
從這個角度來看,“開放權重”更像是開源的一個子集——它降低了模型的使用門檻(如本地部署和微調),但無法滿足真正的可驗證性與可重現性需求。
二、行業(yè)實踐:“開放權重”已成為主流
盡管“開放權重”與“開源”存在差異(如缺少訓練數據和完整
訓練代碼),但從行業(yè)實踐來看,“開放權重”已經成為當前大模型的主流模式。
以DeepSeek、Qwen(阿里)和LLaMA(Meta)為例:
DeepSeek:其V2、V3和R1等系列均采用了“開放權重”策略。此外DeepSeek還提供了技術報告并采用了限制極少的MIT開源協議——允許任何人自由地使用、修改、分發(fā)和商業(yè)化軟件或模型。
Qwen(阿里):Qwen系列不僅公開了權重還采用了Apache2.0協議——允許用戶自由地使用修改分發(fā)代碼包括商業(yè)用途僅要求保留原始版權聲明許可聲明。
LLaMA(Meta):雖然LLaMA系列也公開了參數推理腳本但其使用協議限制更多從LLaMA2開始Meta采用了更寬松許可證(LLaMA3又更開放了一點)但仍需申請使用且不能直接用于某些商業(yè)應用發(fā)布服務導致其落地場景受限。
這些案例表明盡管三者都自稱“開源”,但如果將“開源”拆解為幾個維度來看——如是否公開完整訓練數據是否提供可復現訓練代碼等——你會發(fā)現沒有一家是真正意義上做到全開。
三、“o3-mini級別”:OpenAI新模型的定位
根據Sam Altman在今年2月的暗示以及最新推文中提到的“powerful new open-weight model with reasoning”,可以推測出OpenAI在開源路線上最終選擇了一個“o3-mini級別”的推理型大語言來打開局面。
所謂“o3-mini級別”,指的是具備較強推理能力且適合輕量化部署的中小型大語言——這類既能夠滿足企業(yè)級應用需求又能夠降低硬件成本使其成為當前市場上最受歡迎類型之一。
四、“重返”還是“妥協”?
對于OpenAI來說這次重返社區(qū)意義遠不止發(fā)布那么簡單過去兩年間Meta Mistral Qwen DeepSeek輪番上場一邊打造一邊打造生態(tài)甚至逐漸形成規(guī)模龐大生態(tài)尤其在DeepSeek-V3/R1之后越來越多硬件軟件廠商加入其中使得整個行業(yè)格局發(fā)生顯著變化而作為曾經引領者卻因閉源策略逐漸被邊緣化因此這次部分回歸可以看作是對競爭壓力回應同時也是對自身定位調整。
五、“真開”還是“假開”?
盡管很多人以為是以起家但實際上至少在GPT-2時期就有了閉源路線打算2019年初GPT-2發(fā)布開始以惡意使用風險名義拒絕公開但在外界一致認為夸大風險輿論下才在年底公開滿血版15億參數GPT-2不論如何從GPT-3開始徹底走上閉源路線不再公開權重代碼或訓練數據因此這一次重新也可以視為對社區(qū)釋放信號但需要明確是從Sam Altman采用字眼來看大概率將和今天DeepSeek Qwen LLaMA一樣:
優(yōu)點:降低門檻支持本地部署微調適配缺點:無法復現完整過程難以滿足真正需求
原文標題 : OpenAl終于出手!官宣開源新模型,這次是摸著 Deepseek過河

最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達AI統治的開始
- 2 北電數智主辦酒仙橋論壇,探索AI產業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關稅,能否乘機器人東風翻身?