OpenAI這次要open了,奧爾特曼所說(shuō)的“開放權(quán)重模型”是什么?
原創(chuàng)
2025-04-01 12:51 星期二
科創(chuàng)板日?qǐng)?bào) 朱凌
①OpenAI將在未來(lái)幾個(gè)月內(nèi)發(fā)布一個(gè)強(qiáng)大的帶有推理能力的全新開放模型。
②這是自2019年發(fā)布GPT-2以來(lái),OpenAI時(shí)隔六年首次宣布新的開放模型計(jì)劃。
③這次開放模型可能是o3-mini級(jí)別模型,其將是開放權(quán)重模型,但不是完全開源的模型。

《科創(chuàng)板日?qǐng)?bào)》4月1日訊(編輯 朱凌)北京時(shí)間4月1日凌晨,OpenAI首席執(zhí)行官薩姆·奧爾特曼(Sam Altman)在社交媒體X平臺(tái)宣布:OpenAI將在未來(lái)幾個(gè)月內(nèi)發(fā)布一個(gè)“強(qiáng)大的帶有推理能力的全新開放權(quán)重(open-weight)模型”。

這是自2019年發(fā)布GPT-2以來(lái),OpenAI時(shí)隔六年首次宣布新的開放模型計(jì)劃。

回顧過(guò)往,OpenAI雖然以“開放”命名,但自從GPT-3開始,逐步轉(zhuǎn)向封閉。尤其是ChatGPT問(wèn)世后,OpenAI模型只能通過(guò)其自家平臺(tái)或者微軟Azure等合作伙伴訪問(wèn)或使用API接口。用戶無(wú)法在自己的硬件上自行部署運(yùn)行GPT-3、4、4o、4.5等,無(wú)法對(duì)它們進(jìn)行修改或二次開發(fā)。

或許是隨著DeepSeek等開放模型迅速崛起,OpenAI壓力逐漸增大。

在今年2月1日的OpenAI o3-mini產(chǎn)品發(fā)布后,奧爾特曼公開承認(rèn)DeepSeek削弱了OpenAI在AI領(lǐng)域的領(lǐng)先地位。

他認(rèn)為,OpenAI在開源AI方面一直站在歷史的錯(cuò)誤一邊,“我們需要想出一個(gè)不同的開源策略”。

并非完全開源模型

2月18日,奧爾特曼在X平臺(tái)上發(fā)起對(duì)OpenAI下一個(gè)開源項(xiàng)目的民意調(diào)查:是做一個(gè)雖然體積小、但仍需要GPU運(yùn)行的o3-mini級(jí)別模型,還是做一個(gè)適配手機(jī)的輕量模型?

投票結(jié)果偏向前者,這也預(yù)示了這次開放模型可能是o3-mini級(jí)別模型。但從奧爾特曼發(fā)起投票時(shí)的措辭來(lái)看,不會(huì)直接是o3-mini,而是一個(gè)與o3-mini類似,但有所不同的模型。

即便是開放模型,OpenAI依舊會(huì)保留一些“秘方”——例如模型訓(xùn)練數(shù)據(jù)、預(yù)訓(xùn)練細(xì)節(jié)或者關(guān)鍵架構(gòu)組件等。換句話說(shuō),這是一個(gè)開放權(quán)重模型,但不是一個(gè)完全開源的模型。

事實(shí)上,由于AI模型不僅包括代碼,還涉及數(shù)據(jù)、參數(shù)和權(quán)重等,開源模型的定義并不像開源軟件般清晰,目前尚未形成統(tǒng)一定義。

Linux基金會(huì)提出的模型開放性框架(MOF)把開放模型分為了三個(gè)逐步擴(kuò)展的層級(jí)——第三級(jí)“開放模型”、第二級(jí)“開放工具”和第一級(jí)“開放科學(xué)”。

DeepSeek、Qwen2.5等模型只通過(guò)了MOF第三級(jí)評(píng)估,第三級(jí)“開放模型”開放范圍包括模型架構(gòu)、模型參數(shù)(最終參數(shù))、模型卡、數(shù)據(jù)卡、技術(shù)報(bào)告和評(píng)估結(jié)果,距離最開放的第一級(jí)“開放科學(xué)”仍有空間。

而OpenAI將發(fā)布的開放模型是否能達(dá)到第三級(jí),目前還不得而知。

開放權(quán)重模型意味著什么?

奧爾特曼在X上表示,“我們希望與開發(fā)者深入探討如何最大化發(fā)揮其作用,我們很高興能將它打造為一個(gè)非常非常優(yōu)秀的模型?!?/p>

他還透露,OpenAI將在舊金山、歐洲和亞太地區(qū)舉辦開發(fā)者活動(dòng),以收集反饋并提供早期原型試用機(jī)會(huì)。

奧爾特曼稱,很期待看到開發(fā)人員的成果,以及大公司和政府如何使用它來(lái)運(yùn)行自己的模型。

這似乎表明,這次開放模型主要針對(duì)開發(fā)人員、企業(yè)和政府,而不是個(gè)人用戶。

開放模型可以本地部署,在特殊應(yīng)用場(chǎng)景中具有更大的優(yōu)勢(shì)。企業(yè)和政府可以在自己的服務(wù)器上運(yùn)行開放模型,無(wú)需連接外網(wǎng)或接入云端算力,在本地處理數(shù)據(jù),利用特定領(lǐng)域的數(shù)據(jù)進(jìn)行訓(xùn)練,能夠保護(hù)隱私,還可以擺脫對(duì)OpenAI平臺(tái)的依賴,避免云服務(wù)帶來(lái)的延遲、安全和成本問(wèn)題,同時(shí)提供緊急情況下的快速響應(yīng)。

而且,開放模型可控性和可審計(jì)性增強(qiáng),開發(fā)者可以深入理解模型運(yùn)行機(jī)制,更容易調(diào)試和調(diào)整策略。

此外,開發(fā)者可以基于自有數(shù)據(jù)對(duì)模型進(jìn)行開放模型微調(diào),開發(fā)專屬的垂直領(lǐng)域應(yīng)用,構(gòu)建衍生模型,甚至將其提煉為在智能手機(jī)等智能終端上就能單機(jī)運(yùn)行起來(lái)的AI模型。

英偉達(dá)也推出了個(gè)人AI超級(jí)計(jì)算機(jī),使企業(yè)和開發(fā)者能夠以相對(duì)較低的成本運(yùn)行開放模型。

不過(guò),對(duì)于普通個(gè)人用戶而言,能夠流暢運(yùn)行開放模型的硬件成本仍然較高,云端模型依然具有更高的實(shí)用性,尤其在面對(duì)復(fù)雜任務(wù)時(shí),云端模型在算力和易用性方面仍擁有明顯優(yōu)勢(shì)。

收藏
95.54W
我要評(píng)論
歡迎您發(fā)表有價(jià)值的評(píng)論,發(fā)布廣告和不和諧的評(píng)論都將會(huì)被刪除,您的賬號(hào)將禁止評(píng)論。
發(fā)表評(píng)論
要聞
股市
關(guān)聯(lián)話題
5.05W 人關(guān)注
2.11W 人關(guān)注