訂閱
糾錯(cuò)
加入自媒體

OpenAI o3-pro 震撼發(fā)布!卻暗藏這些 “槽點(diǎn)”?

2025-06-11 11:33
山自
關(guān)注

在 AI 領(lǐng)域的激烈競(jìng)爭(zhēng)中,OpenAI 再次投下重磅炸彈!近日,OpenAI 正式推出了全新 AI 模型 o3-pro,官方更是自信宣稱(chēng)這是其有史以來(lái)最強(qiáng)大的模型。消息一出,立刻在全球科技圈掀起軒然大波,無(wú)數(shù)目光聚焦于此,大家都迫切想知道:這個(gè)號(hào)稱(chēng) “最強(qiáng)” 的 o3-pro,究竟有何過(guò)人之處?又會(huì)給我們的生活和工作帶來(lái)怎樣的改變?

全新升級(jí),推理能力再突破

o3-pro 其實(shí)是 OpenAI 今年早些時(shí)候推出的推理模型 o3 的升級(jí)版。推理模型的核心優(yōu)勢(shì)在于能夠像人類(lèi)一樣,一步一步地拆解和解決問(wèn)題,這種 “思考” 方式打破了傳統(tǒng) AI 模型的局限。傳統(tǒng) AI 模型往往是基于大量數(shù)據(jù)的模式匹配來(lái)給出答案,而推理模型則更注重邏輯推導(dǎo)。以數(shù)學(xué)領(lǐng)域?yàn)槔,?dāng)面對(duì)一道復(fù)雜的幾何證明題時(shí),o3-pro 會(huì)先分析題目給出的條件,再調(diào)用已有的幾何定理,通過(guò)嚴(yán)謹(jǐn)?shù)牟襟E推導(dǎo),最終得出正確結(jié)論;在編程方面,它可以深入理解代碼需求,從功能實(shí)現(xiàn)邏輯出發(fā),逐步編寫(xiě)和優(yōu)化代碼,大幅減少代碼中的錯(cuò)誤和漏洞。這種獨(dú)特的推理能力,讓 o3-pro 在物理、數(shù)學(xué)和編程等對(duì)邏輯要求極高的領(lǐng)域,表現(xiàn)得比傳統(tǒng)模型更加可靠和精準(zhǔn),也為其在專(zhuān)業(yè)領(lǐng)域的深度應(yīng)用奠定了堅(jiān)實(shí)基礎(chǔ) 。

圖片

圖片

逐步開(kāi)放,定價(jià)引發(fā)熱議

從 6 月 10 日(周二)起,ChatGPT Pro 和 Team 用戶(hù)已經(jīng)可以率先體驗(yàn) o3-pro,它直接取代了之前的 o1-pro 模型。而 Enterprise 和 Edu 用戶(hù)則需要再等一周才能使用。同時(shí),o3-pro 也于當(dāng)天下午在 OpenAI 的開(kāi)發(fā)者 API 中上線。在 API 中,o3-pro 的定價(jià)為每百萬(wàn)輸入 tokens 20 美元,每百萬(wàn)輸出 tokens 80 美元。tokens 作為 AI 處理信息的基本單元,其數(shù)量與實(shí)際文本量緊密相關(guān)。一百萬(wàn)輸入 tokens 大約相當(dāng)于 750,000 個(gè)單詞,比《戰(zhàn)爭(zhēng)與和平》的篇幅還要長(zhǎng)一些。這樣的定價(jià)策略,對(duì)于普通用戶(hù)來(lái)說(shuō)影響較小,但對(duì)于依賴(lài) API 進(jìn)行大規(guī)模數(shù)據(jù)處理和應(yīng)用開(kāi)發(fā)的企業(yè)和開(kāi)發(fā)者而言,成本問(wèn)題成為關(guān)注焦點(diǎn)。不少開(kāi)發(fā)者開(kāi)始重新評(píng)估項(xiàng)目預(yù)算,思考如何在享受 o3-pro 強(qiáng)大功能的同時(shí),合理控制使用成本,這也在一定程度上引發(fā)了行業(yè)內(nèi)關(guān)于 AI 服務(wù)定價(jià)模式的討論。

性能卓越,亮點(diǎn)功能豐富

OpenAI 在更新日志中透露,在專(zhuān)家評(píng)估中,評(píng)審人員在所有測(cè)試類(lèi)別中都一致更青睞 o3-pro,尤其是在科學(xué)、教育、編程、商業(yè)和寫(xiě)作輔助等關(guān)鍵領(lǐng)域。在科學(xué)研究方面,o3-pro 能夠幫助科研人員快速分析大量實(shí)驗(yàn)數(shù)據(jù),提出新的研究假設(shè);教育領(lǐng)域中,它可以根據(jù)學(xué)生的學(xué)習(xí)情況,生成個(gè)性化的學(xué)習(xí)方案和習(xí)題解析;商業(yè)場(chǎng)景里,能為企業(yè)提供精準(zhǔn)的市場(chǎng)分析和商業(yè)策略建議。而且,評(píng)審人員還認(rèn)為 o3-pro 在表達(dá)清晰度、內(nèi)容全面性、指令遵循度和回答準(zhǔn)確性等方面都要優(yōu)于以往的模型。

圖片

此外,o3-pro 還具備強(qiáng)大的工具調(diào)用能力,堪稱(chēng) “全能助手”。它可以進(jìn)行網(wǎng)頁(yè)搜索,實(shí)時(shí)獲取最新的信息和數(shù)據(jù),為用戶(hù)提供更全面的回答;能夠分析各類(lèi)文件,無(wú)論是文檔、表格還是代碼文件,都能準(zhǔn)確提取關(guān)鍵信息并進(jìn)行解讀;支持處理視覺(jué)輸入,比如對(duì)圖片中的物體、場(chǎng)景進(jìn)行分析和描述;熟練使用 Python 編程,滿(mǎn)足開(kāi)發(fā)者各種編程需求;甚至能利用記憶功能實(shí)現(xiàn)個(gè)性化回復(fù),根據(jù)用戶(hù)之前的提問(wèn)和交互歷史,提供更貼合用戶(hù)需求的答案,大大提升了交互體驗(yàn) 。

美中不足,存在發(fā)展局限

不過(guò),o3-pro 并非十全十美。OpenAI 坦言,該模型的響應(yīng)時(shí)間通常比 o1-pro 更長(zhǎng),也就是說(shuō),用戶(hù)可能需要多等一會(huì)兒才能得到它的答案。這對(duì)于一些追求即時(shí)反饋的場(chǎng)景,如實(shí)時(shí)聊天、在線客服等,可能會(huì)造成一定的體驗(yàn)下降。此外,目前 ChatGPT 中與 o3-pro 的臨時(shí)聊天功能因 “技術(shù)問(wèn)題” 暫時(shí)禁用,這無(wú)疑限制了用戶(hù)在日常交流場(chǎng)景中的使用。o3-pro 也無(wú)法生成圖像,在當(dāng)下圖文結(jié)合的信息傳播時(shí)代,這讓它在一些創(chuàng)意設(shè)計(jì)、營(yíng)銷(xiāo)宣傳等領(lǐng)域的應(yīng)用受到阻礙。而且 OpenAI 的 AI 工作空間功能 Canvas 也不被 o3-pro 支持,對(duì)于依賴(lài) Canvas 進(jìn)行團(tuán)隊(duì)協(xié)作和項(xiàng)目管理的用戶(hù)來(lái)說(shuō),不得不繼續(xù)使用其他模型或工具 。

實(shí)力強(qiáng)勁,基準(zhǔn)測(cè)試成績(jī)優(yōu)異

盡管存在這些不足,o3-pro 在 AI 基準(zhǔn)測(cè)試中的表現(xiàn)卻十分亮眼。根據(jù) OpenAI 的內(nèi)部測(cè)試,在評(píng)估數(shù)學(xué)技能的 AIME 2024 測(cè)試中,o3-pro 的得分超過(guò)了谷歌表現(xiàn)最好的 AI 模型 Gemini 2.5 Pro;在測(cè)試博士級(jí)科學(xué)知識(shí)的 GPQA Diamond 測(cè)試中,o3-pro 也擊敗了 Anthropic 最近發(fā)布的 Claude 4 Opus。這些成績(jī)不僅證明了 o3-pro 在專(zhuān)業(yè)知識(shí)處理上的卓越實(shí)力,也凸顯了 OpenAI 在 AI 技術(shù)研發(fā)上的領(lǐng)先地位。這也讓其他 AI 研發(fā)企業(yè)感受到了巨大的壓力,促使整個(gè)行業(yè)加快技術(shù)創(chuàng)新的步伐,推動(dòng) AI 技術(shù)不斷向前發(fā)展。

o3-pro 的發(fā)布,標(biāo)志著 AI 技術(shù)又向前邁出了一大步。它既帶來(lái)了更強(qiáng)大的功能和更精準(zhǔn)的回答,也暴露出一些有待完善的地方。對(duì)于廣大用戶(hù)和開(kāi)發(fā)者來(lái)說(shuō),o3-pro 既是一個(gè)充滿(mǎn)機(jī)遇的新工具,也是一個(gè)需要進(jìn)一步探索和適應(yīng)的新挑戰(zhàn)。從企業(yè)角度看,如何將 o3-pro 融入現(xiàn)有的業(yè)務(wù)流程,提升工作效率和服務(wù)質(zhì)量,是接下來(lái)需要思考的問(wèn)題;對(duì)于開(kāi)發(fā)者而言,利用 o3-pro 的強(qiáng)大功能開(kāi)發(fā)出更具創(chuàng)新性的應(yīng)用,將成為在競(jìng)爭(zhēng)中脫穎而出的關(guān)鍵。而對(duì)于普通用戶(hù),期待 o3-pro 在未來(lái)能夠克服現(xiàn)有局限,為我們的生活帶來(lái)更多便利和驚喜。未來(lái),隨著技術(shù)的不斷迭代,o3-pro 能否克服現(xiàn)有局限,持續(xù)刷新我們對(duì) AI 的認(rèn)知?讓我們拭目以待!

       原文標(biāo)題 : OpenAI o3-pro 震撼發(fā)布!史上最強(qiáng) AI 來(lái)襲,卻暗藏這些 “槽點(diǎn)”?

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)