要聞

GPT-5來(lái)了，微軟搶先接入：一鍵生成網(wǎng)頁(yè)、博士級(jí)智能，所有用戶免費(fèi)使用；馬斯克不服

每日經(jīng)濟(jì)新聞 2025-08-08 12:39:32

每經(jīng)編輯｜程鵬杜宇

當(dāng)?shù)貢r(shí)間8月7日，OpenAI推出大型語(yǔ)言模型GPT-5，這一成果歷經(jīng)多次推遲后終于面世。這距離GPT-4的發(fā)布已過(guò)去了兩年半。OpenAI稱它是“世界上最好的模型”，將免費(fèi)提供給用戶。

CFF20LXzkOx4czmaia3NdROcEhiaQHjFiae5AdxKPDVKP5x0cUZjccibCuLa4bUfrNWibiahy2BSicwnlMdhIKXPRrn1g.jpg 圖片來(lái)源：OpenAI官網(wǎng)

首席執(zhí)行官山姆·奧爾特曼在發(fā)布會(huì)上形容，與GPT-5對(duì)話“就像在與某個(gè)領(lǐng)域的博士級(jí)專家交流”。這一版本首次采用集成模型架構(gòu)，將根據(jù)任務(wù)自動(dòng)選擇推理深度，無(wú)需用戶切換模式。

目前Plus、Pro、團(tuán)隊(duì)和免費(fèi)用戶均已接入GPT-5，企業(yè)版與教育版用戶預(yù)計(jì)將在一周內(nèi)覆蓋，免費(fèi)用戶將在數(shù)天內(nèi)完成覆蓋。

也有業(yè)內(nèi)人士認(rèn)為GPT-5“不夠驚艷”，馬斯克在社交媒體表示“不服”稱，GPT-5在ARC-AGI-2上沒(méi)有打敗Grok 4。

eFJHus9stzdnBcOEicb4YqdVpLExjCYqDYlc8pH5aShZ1voYnrticAlqKFW77n50fibicMWTK3D2g4NLOiaDPZZl1Iw.png

CFF20LXzkOwNfsay86cib4p0S2T0NfBIZicSMl7tYnKBaibmLibs8uIQI1mZYasibU5KFf6wlMM5EENdMic3ibFTHCmUw.png

面向所有用戶開(kāi)放

OpenAI在新聞稿中寫(xiě)道，GPT-5的智能性能遠(yuǎn)超公司之前的所有模型，在編碼、數(shù)學(xué)、寫(xiě)作、健康、視覺(jué)感知等領(lǐng)域均擁有卓越的性能。

聲明補(bǔ)充稱，GPT-5是一個(gè)統(tǒng)一的系統(tǒng)，能夠識(shí)別何時(shí)快速響應(yīng)，何時(shí)需要更長(zhǎng)時(shí)間的思考以提供專家級(jí)的應(yīng)答，不必由用戶手動(dòng)選擇使用常規(guī)語(yǔ)言模型還是推理系統(tǒng)。

OpenAI表示，GPT-5將面向所有用戶開(kāi)放。即C端免費(fèi)用戶也可以使用GPT-5，但有使用次數(shù)限制，每天可以聊“幾個(gè)小時(shí)”，當(dāng)達(dá)到上限后，會(huì)自動(dòng)切換到GPT-5 mini模型。Plus用戶則將擁有比免費(fèi)用戶“高得多”的使用額度，基本滿足日常應(yīng)用。Pro會(huì)員則可訪問(wèn)GPT-5 Pro版本——該版本具有擴(kuò)展推理能力，可提供更全面、更準(zhǔn)確的答案。

對(duì)于開(kāi)發(fā)者API用戶來(lái)講，GPT-5幾乎給出了一個(gè)難以拒絕的價(jià)格：每百萬(wàn)token輸入1.25美元，輸出10美元。這個(gè)價(jià)格不僅比GPT 4o便宜，也僅為Claude Opus 4.1的1/15，甚至比一直以“低價(jià)”著稱的Gemini 2.5 Pro更便宜。

先前，OpenAI首席執(zhí)行官薩姆·奧爾特曼（Sam Altman）稱GPT-5是一次“重大升級(jí)”。

ChatGPT團(tuán)隊(duì)負(fù)責(zé)人Nick Turley表示，新模型在響應(yīng)速度、回答準(zhǔn)確性以及減少“幻覺(jué)”方面都優(yōu)于前代產(chǎn)品，“你跟它對(duì)話時(shí)，會(huì)感覺(jué)自然了不少。”

在8月7日的簡(jiǎn)報(bào)會(huì)上，奧爾特曼對(duì)GPT-5給予了極高評(píng)價(jià)，將GPT-5定位為通往AGI的重要里程碑。他表示：“在以往歷史上任何時(shí)期，擁有像GPT-5這樣的東西都是不可想象的。”

“這是第一次感覺(jué)就像在與任何領(lǐng)域的專家交談。”Altman在簡(jiǎn)報(bào)會(huì)上甚至不惜用“踩”GPT-4抬高GPT-5。他說(shuō)：“我嘗試過(guò)用回GPT-4，但效果相當(dāng)糟糕。”

CFF20LXzkOx4czmaia3NdROcEhiaQHjFiaem0yEEjibMAYXxlops1ibNpD0gjibRnLFay92sTRnn838hsJS4Px7OMMoA.jpg 圖片來(lái)源：視覺(jué)中國(guó)

CFF20LXzkOwNfsay86cib4p0S2T0NfBIZicSMl7tYnKBaibmLibs8uIQI1mZYasibU5KFf6wlMM5EENdMic3ibFTHCmUw.png

一鍵生成網(wǎng)頁(yè)、像詩(shī)人一樣寫(xiě)作

更懂健康問(wèn)題

根據(jù)OpenAI介紹，作為OpenAI的“最強(qiáng)大模型”，GPT-5在三個(gè)關(guān)鍵領(lǐng)域?qū)崿F(xiàn)了顯著提升。

首先是編程能力。GPT-5是OpenAI迄今為止最強(qiáng)大的編碼模型，在復(fù)雜的前端生成和大型代碼庫(kù)調(diào)試方面表現(xiàn)突出，能夠僅憑一個(gè)提示就創(chuàng)建美觀響應(yīng)式的網(wǎng)站、應(yīng)用程序App和游戲。早期測(cè)試者注意到其在間距、排版和留白等設(shè)計(jì)選擇方面的改進(jìn)。

在從GitHub獲取現(xiàn)實(shí)世界編碼任務(wù)的基準(zhǔn)測(cè)試SWE-bench Verified中，GPT-5思考后首次嘗試的準(zhǔn)確率達(dá)74.9%，高于OpenAI推理模型o3的69.1%和GPT-4o的30.8%。

CFF20LXzkOx4czmaia3NdROcEhiaQHjFiaelzULGYPxlEeMsrSzvaAibO197CrVGmONK0SD8lSmQ0dC7gGF6eYF8sQ.jpg

評(píng)論指出，這意味著，GPT-5的表現(xiàn)略勝于Anthropic周二推出的Claude Opus 4.1和谷歌DeepMind的Gemini 2.5 Pro，后兩者在SWE-bench Verified測(cè)試的得分分別為74.5%和59.6%。

不過(guò)，在衡量數(shù)學(xué)、人文和自然科學(xué)領(lǐng)域模型表現(xiàn)的各學(xué)科專家級(jí)能力Humanity’s Last Exam測(cè)試中，帶有擴(kuò)展推理功能的GPT-5增強(qiáng)版本GPT-5 pro在使用工具的情況下得分42%。這略低于得分44.4%的xAI模型Grok 4 Heavy。

CFF20LXzkOx4czmaia3NdROcEhiaQHjFiaez6V93mYYS166ODQzha7trFPmmlONnNwnWBLjp2moDoRG21F76TkYKg.jpg

奧爾特曼稱，GPT-5尤其擅長(zhǎng)按需啟動(dòng)整個(gè)軟件App，也就是所謂的“氛圍編碼”、即用AI根據(jù)自然語(yǔ)言提示生成功能代碼，從而加快開(kāi)發(fā)速度。

作為實(shí)例，OpenAI的研究者演示了，要求GPT-5創(chuàng)建一款網(wǎng)頁(yè)App，幫助說(shuō)英語(yǔ)的用戶學(xué)習(xí)法語(yǔ)，且該App必須有一個(gè)引人入勝的主題，包含抽認(rèn)卡、測(cè)驗(yàn)、經(jīng)典的貪吃蛇游戲，以及追蹤每日學(xué)習(xí)進(jìn)度的方法。

研究者將相同的提示詞提交到兩個(gè)GPT-5 窗口中，幾分鐘后生成了兩個(gè)不同的App。OpenAI的負(fù)責(zé)人稱，這些App“存在一些缺陷”，但用戶可以根據(jù)個(gè)人喜好再調(diào)整AI生成的軟件，例如更改背景或添加更多標(biāo)簽頁(yè)。

在創(chuàng)意寫(xiě)作方面，GPT-5能夠處理結(jié)構(gòu)復(fù)雜的寫(xiě)作任務(wù)，如無(wú)韻律的抑揚(yáng)格五音步詩(shī)或自然流動(dòng)的自由詩(shī)，猶如詩(shī)人。OpenAI的ChatGPT業(yè)務(wù)副總Nick Turley表示，GPT-5在創(chuàng)意任務(wù)上表現(xiàn)出“更好的品味”，響應(yīng)更自然。

CFF20LXzkOx4czmaia3NdROcEhiaQHjFiaecO2DKtR4iciaK5OTc4TaiaqlQBbC3Z86IO7ssemDfIpLhd9aqIzX46slA.jpg

健康咨詢是第三個(gè)重要提升領(lǐng)域。

GPT-5能更積極地標(biāo)記潛在健康問(wèn)題，幫助用戶解析醫(yī)療結(jié)果，盡管OpenAI強(qiáng)調(diào)，ChatGPT不能替代醫(yī)療專業(yè)人員。

在名為HealthBench Hard Hallucinations的測(cè)試中，具備思考能力的GPT-5出現(xiàn)幻覺(jué)的錯(cuò)誤信息率僅為1.6%。這遠(yuǎn)低于GPT-4o和o3模型，后兩者的錯(cuò)誤信息率分別為15.8%和12.9%。

CFF20LXzkOwNfsay86cib4p0S2T0NfBIZicSMl7tYnKBaibmLibs8uIQI1mZYasibU5KFf6wlMM5EENdMic3ibFTHCmUw.png

幻覺(jué)可能性顯著降低新的安全訓(xùn)練模式

OpenAI稱，GPT-5相比此前的模型更可靠和實(shí)用，它能更準(zhǔn)確地回答現(xiàn)實(shí)世界的疑問(wèn)，出現(xiàn)幻覺(jué)的可能性顯著降低。

在對(duì)代表ChatGPT生產(chǎn)流量的匿名提示詞啟用網(wǎng)絡(luò)搜索后，GPT-5響應(yīng)中包含事實(shí)錯(cuò)誤的可能性比GPT-4o低約45%；在思考后，GPT-5響應(yīng)中包含事實(shí)錯(cuò)誤的可能性比o3低約 80%。下圖可見(jiàn)，GPT-5響應(yīng)的錯(cuò)誤信息率僅為4.8%，GPT-4o為20.6%，o3為22%。

CFF20LXzkOx4czmaia3NdROcEhiaQHjFiae5LMlQqMUxahdyMAhIibFibcxFexiaWYks1WfQ9qSicuCb7SfU9a0DCc50A.jpg

OpenAI還表示，為GPT-5引入了一種新的安全訓(xùn)練形式，名為安全補(bǔ)全（safe completions）。它教模型在安全范圍內(nèi)盡可能給出最有幫助的答案。有時(shí)，這可能意味著部分回答用戶的問(wèn)題，或者只提供高水平的回答。

如果需要拒絕，經(jīng)過(guò)訓(xùn)練的GPT-5會(huì)以透明的方式告知用戶拒絕的原因，并提供安全的替代方案。

在受控的實(shí)驗(yàn)和OpenAI的生產(chǎn)模型中，OpenAI都發(fā)現(xiàn)這種安全補(bǔ)全的方法更加細(xì)致入微，能夠更好地引導(dǎo)雙重用途問(wèn)題，增強(qiáng)對(duì)模糊意圖的魯棒性，并減少不必要的過(guò)度拒絕。

OpenAI的后訓(xùn)練負(fù)責(zé)人Michelle Pokrass表示：“GPT-5已經(jīng)過(guò)訓(xùn)練，能夠識(shí)別任務(wù)何時(shí)無(wú)法完成，避免猜測(cè)，并能更清晰地解釋局限性，相比之前的模型，這減少了無(wú)根據(jù)的斷言。”

CFF20LXzkOwNfsay86cib4p0S2T0NfBIZicSMl7tYnKBaibmLibs8uIQI1mZYasibU5KFf6wlMM5EENdMic3ibFTHCmUw.png

推出四種可選的 ChatGPT聊天預(yù)設(shè)性格

OpenAI稱，GPT-5在指令執(zhí)行方面表現(xiàn)提升，其執(zhí)行自定義指令的能力也得到了相應(yīng)的提升。OpenAI將為所有ChatGPT用戶推出四種預(yù)設(shè)性格的全新研究預(yù)覽版。

初始的四種性格選項(xiàng)——憤世嫉俗者（Cynic）、機(jī)器人（Robot）、傾聽(tīng)者（Listener）和書(shū)呆子（Nerd）都是可選的，用戶可在設(shè)置中隨時(shí)調(diào)整，用以匹配ChatGPT和用戶的溝通風(fēng)格。

eFJHus9stzdnBcOEicb4YqdVpLExjCYqDF0kOofUYrxRfMz4UeQxskM1IbGXUy6U1aeyXjGEO9JLAkGdriaObCCA.png

上述四種性格最初適用于文本聊天，之后將擴(kuò)展到語(yǔ)音聊天，讓用戶無(wú)需編寫(xiě)自定義提示詞即可設(shè)置ChatGPT的交互方式——無(wú)論是簡(jiǎn)潔專業(yè)的、周到支持的，還是略帶諷刺的。

此外，微軟在GPT-5發(fā)布當(dāng)日即宣布，將其整合到廣泛的產(chǎn)品線中。在企業(yè)級(jí)應(yīng)用方面，Microsoft 365 Copilot將利用GPT-5更好地處理復(fù)雜問(wèn)題、在長(zhǎng)對(duì)話中保持專注并理解用戶上下文。企業(yè)用戶可通過(guò)推理功能處理電子郵件、文檔和文件。

對(duì)于消費(fèi)者，Microsoft Copilot的新智能模式將利用GPT-5幫助用戶發(fā)現(xiàn)最佳解決方案。用戶可通過(guò)copilot.microsoft.com或Windows、Mac、Android和iOS設(shè)備上的Copilot應(yīng)用免費(fèi)體驗(yàn)GPT-5。

CFF20LXzkOx4czmaia3NdROcEhiaQHjFiaedOTQ4kvFhOPianyllx2ntgltbe1ObG4PFzAeU3KeDpRyM0SAaLw5yJA.jpg

開(kāi)發(fā)者將通過(guò)GitHub Copilot和Visual Studio Code獲得GPT-5支持，用于編寫(xiě)、測(cè)試和部署代碼。Azure AI Foundry平臺(tái)將提供所有GPT-5模型，配備AI驅(qū)動(dòng)的模型路由器，根據(jù)每個(gè)任務(wù)的復(fù)雜性、性能需求和成本效率選擇最優(yōu)模型。

CFF20LXzkOwNfsay86cib4p0S2T0NfBIZicSMl7tYnKBaibmLibs8uIQI1mZYasibU5KFf6wlMM5EENdMic3ibFTHCmUw.png

馬斯克拆臺(tái)

值得注意的是，在GPT-5的發(fā)布會(huì)上，現(xiàn)場(chǎng)也出了一些小bug，直播中展示的性能圖表存在數(shù)據(jù)與圖表顯示不匹配的情況，例如在編程基準(zhǔn)測(cè)試（swe-bench）的圖表中，GPT-5的準(zhǔn)確率標(biāo)注為52.8%，但對(duì)應(yīng)的柱狀圖高度卻超過(guò)了標(biāo)注為69.1%的舊模型O3的柱狀圖，引發(fā)了網(wǎng)友的廣泛質(zhì)疑。奧特曼也承認(rèn)了錯(cuò)誤：

KmXPKA19gW80Lhc0tgswpbtQ4ck2trIBibSeQ73FrsmGKnN3zv1uNwmaiaaQDgqlBALwxctibjw96icktUdptdAnbA.png

更尷尬的是，馬斯克也跑來(lái)拆臺(tái)，轉(zhuǎn)發(fā)了GPT-5在ARC-AGI-2上沒(méi)有打敗Grok 4的消息：

KmXPKA19gW80Lhc0tgswpbtQ4ck2trIBiaqIjfhXAjqnJWNWWOSTWBUCMC6blysSuRrXFI4qKIb6rG98QQNG1tQ.png

據(jù)證券時(shí)報(bào)報(bào)道，有人工智能資深研究員認(rèn)為，GPT-5 仍然只是“漸進(jìn)式優(yōu)化”，而非顛覆性、跨越式的提升。GPT-5表現(xiàn)不夠驚艷的核心原因在于，大模型訓(xùn)練遵循Scaling Laws（縮放定律），即模型性能隨著參數(shù)規(guī)模、訓(xùn)練數(shù)據(jù)量、計(jì)算資源的增加而提升。如今這一定律正在放緩，預(yù)訓(xùn)練帶來(lái)的邊際收益在減弱，而且全球高質(zhì)量數(shù)據(jù)已經(jīng)枯竭，這也使得OpenAI的訓(xùn)練資源面臨瓶頸，模型性能提升十分有限。

GPT-5這次發(fā)布或許還與OpenAI近期資本運(yùn)作有關(guān)。

據(jù)參考消息網(wǎng)援引《金融時(shí)報(bào)》網(wǎng)站8月1日?qǐng)?bào)道，OpenAI已獲得83億美元新資本，估值達(dá)到3000億美元。據(jù)知情人士透露，這筆新資金來(lái)自黑石集團(tuán)、得克薩斯太平洋集團(tuán)資本公司、富達(dá)管理與研究公司和普徠仕公司等原有及新加入的投資者。

GPT-5的發(fā)布，將進(jìn)一步鞏固O(píng)penAI在大模型技術(shù)領(lǐng)域的領(lǐng)先優(yōu)勢(shì)，提振投資者信心，有助于公司估值的增長(zhǎng)及股票二次出售計(jì)劃的實(shí)施。

編輯|程鵬杜宇易啟江

校對(duì)|段煉

封面圖片來(lái)源：截圖

CFF20LXzkOyYmal29zn37N5Bg2NQ4tyN4ylvMFyM3VmF4x90Uj4cDmoEphibia4RN55ibIXmqU1Od9w2Q5nhA08lA.png

每日經(jīng)濟(jì)新聞綜合自OpenAI官網(wǎng)、證券時(shí)報(bào)、21世紀(jì)經(jīng)濟(jì)報(bào)道、第一財(cái)經(jīng)、公開(kāi)資料

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán)，嚴(yán)禁轉(zhuǎn)載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

上一篇文章

政策助力腦機(jī)接口概念股走強(qiáng)，滬指半日微漲0.07%

返回每經(jīng)網(wǎng)首頁(yè)

下一篇文章

家長(zhǎng)不在家，孩子凌晨被人入戶抽血？衛(wèi)健局介入，當(dāng)?shù)鼗貞?yīng)：給家長(zhǎng)多次打電話未接通，派民警和醫(yī)生前往確認(rèn)

相關(guān)文章

熱文精選

點(diǎn)擊排行

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

日韩欧美成人网,日韩欧美在线观看一区二区,日韩黄色片免费看,在线国产麻豆,制服丝袜在线91,亚洲一级片网站,91插插库

GPT-5來(lái)了，微軟搶先接入：一鍵生成網(wǎng)頁(yè)、博士級(jí)智能，所有用戶免費(fèi)使用；馬斯克不服

GPT-5來(lái)了，微軟搶先接入：一鍵生成網(wǎng)頁(yè)、博士級(jí)智能，所有用戶免費(fèi)使用；馬斯克不服