多模態(tài)又考驗(yàn)算力了!ChatGPT文生圖功能太火爆 奧爾特曼:GPU“冒煙了”
原創(chuàng)
2025-03-28 09:25 星期五
科創(chuàng)板日?qǐng)?bào) 宋子喬
①OpenAI將暫時(shí)對(duì)ChatGPT生成圖片的功能引入一些速率限制;
②讓AI生成更精確、更高清的圖像依賴于GPU的大規(guī)模并行計(jì)算;
③OpenAI因新功能面臨的問(wèn)題,折射了AI多模態(tài)技術(shù)發(fā)展中的資源與需求平衡難題。

《科創(chuàng)板日?qǐng)?bào)》3月28日訊(編輯 宋子喬) 隨著OpenAI的圖像生成功能完成重大升級(jí),新的問(wèn)題出現(xiàn)了。

OpenAI創(chuàng)始人Sam Altman表示:ChatGPT的文生圖應(yīng)用需求過(guò)高,我們的GPU“冒煙了”(melting,原為融化之意),在努力提高效率的同時(shí),將暫時(shí)對(duì)ChatGPT生成圖片的功能引入一些速率限制。

image

image

這意味著,OpenAI將對(duì)ChatGPT的圖像生成功能實(shí)施臨時(shí)限速,降低單位時(shí)間內(nèi)的請(qǐng)求處理量,緩解GPU過(guò)載壓力,并優(yōu)先保障文本生成、對(duì)話等核心功能的穩(wěn)定性,或許將暫時(shí)放緩圖像生成的技術(shù)優(yōu)化節(jié)奏。

此前3月26日,OpenAI推出基于GPT-4o模型的圖像生成功能——Images in ChatGPT,用戶可在ChatGPT及Sora平臺(tái)直接通過(guò)自然語(yǔ)言指令生成、編輯圖像,支持多輪迭代優(yōu)化。這標(biāo)志著ChatGPT正式將文本、圖像、代碼等多模態(tài)能力深度整合,實(shí)現(xiàn)從單一語(yǔ)言模型向全模態(tài)智能體的跨越。

該功能上線后,以“動(dòng)動(dòng)嘴就能P圖”的便利迅速火爆,互聯(lián)網(wǎng)平臺(tái)上涌入大量由個(gè)人照片、知名梗圖轉(zhuǎn)變而來(lái)的“吉卜力”卡通風(fēng)格圖片。連Altman也感嘆起該功能帶來(lái)的潑天流量:“自己過(guò)去十年埋頭苦干做AI,試圖幫助實(shí)現(xiàn)超級(jí)智能來(lái)治愈癌癥之類的事情。前7.5年幾乎無(wú)人問(wèn)津,接下來(lái)的兩年半,做什么都會(huì)引來(lái)所有人的厭惡。然后某天醒來(lái)收到幾百條消息,人們告訴你被畫成了吉卜力風(fēng)格的美少年。”

image

Sam Altman在社交平臺(tái)上的新頭像,生成自Images in ChatGPT

image

生成自Images in ChatGPT

image

生成自Images in ChatGPT

與此同時(shí),由于圖像生成功能的受歡迎程度遠(yuǎn)超預(yù)期,OpenAI原本計(jì)劃本周向所有用戶推送這項(xiàng)功能,但現(xiàn)在“被迫”推遲了向免費(fèi)用戶開放新功能的時(shí)間。

與作為擴(kuò)散模型運(yùn)行的DALL?E根本區(qū)別是,GPT-4o圖像生成是原生嵌入在ChatGPT中的自回歸模型。OpenAI根據(jù)在線圖像和文本的聯(lián)合分發(fā)來(lái)訓(xùn)練模型,使得模型可以學(xué)習(xí)圖像與語(yǔ)言的關(guān)系,使其生成有用、一致且具備上下文感知的圖像。

GPU就像一群超級(jí)快的“畫師”,能同時(shí)處理大量計(jì)算任務(wù),生成圖片(如DALL?E、Stable Diffusion)需要AI逐像素計(jì)算,每一步都要處理海量數(shù)據(jù)。而讓AI生成更精確、更高清的圖像依賴于GPU的大規(guī)模并行計(jì)算。OpenAI提到,因?yàn)檫@個(gè)模型會(huì)創(chuàng)建更詳細(xì)的圖片,所以圖像需要更長(zhǎng)的渲染時(shí)間,通常會(huì)達(dá)到一分鐘。

如此一來(lái),文生圖功能的用戶越多,需要的GPU算力成倍增長(zhǎng)。

解決方式主要有兩種,更強(qiáng)的GPU或更高效的AI模型,前者走“力大磚飛”路線,后者寄希望于算法的優(yōu)化,即通過(guò)改進(jìn)AI算法讓同樣的GPU能處理更多任務(wù)(比如用更小的模型或壓縮技術(shù))。

作為AI領(lǐng)域的頭部玩家,OpenAI背后的GPU儲(chǔ)備自然是業(yè)內(nèi)頂尖水準(zhǔn)。根據(jù)技術(shù)咨詢公司Omdia的分析,微軟作為OpenAI的主要投資者,在2024年購(gòu)買了約48.5萬(wàn)塊英偉達(dá)的Hopper芯片,是其主要競(jìng)爭(zhēng)對(duì)手Meta的兩倍,這使其成為英偉達(dá)GPU的最大買家。OpenAI的大模型正是用微軟的Azure云基礎(chǔ)設(shè)施進(jìn)行訓(xùn)練。

可以說(shuō),OpenAI因新功能面臨的問(wèn)題,折射了AI多模態(tài)技術(shù)發(fā)展中的資源與需求平衡難題,一方面,AI應(yīng)用對(duì)GPU等算力資源的需求依然龐大,另一方面,行業(yè)繼續(xù)呼喚技術(shù)迭代,以求高效利用現(xiàn)有資源。

收藏
68.15W
我要評(píng)論
歡迎您發(fā)表有價(jià)值的評(píng)論,發(fā)布廣告和不和諧的評(píng)論都將會(huì)被刪除,您的賬號(hào)將禁止評(píng)論。
發(fā)表評(píng)論
要聞
股市
關(guān)聯(lián)話題
5.05W 人關(guān)注
6.11W 人關(guān)注
7297 人關(guān)注