巖芯數(shù)智RockAI:讓大模型更像“人”|新質(zhì)生產(chǎn)力看張江
原創(chuàng)
2024-12-02 17:51 星期一
科創(chuàng)板日報記者 張洋洋
①在這一輪更為看中落地應用實現(xiàn)造血的這一輪AI大模型創(chuàng)業(yè)浪潮里,巖芯數(shù)智的市場策略是,快速推進Yan模型在更廣泛的終端落地應用,設(shè)備才是真正毛細血管,能觸達到千千萬萬的用戶;
②Yan模型目前已經(jīng)實現(xiàn)了在機器人、PC、手機、無人機等各類終端設(shè)備上的落地。

發(fā)展“新質(zhì)生產(chǎn)力”正成為我國推動高質(zhì)量發(fā)展的內(nèi)在要求和重要著力點。2月29日,中共中央政治局會議指出,今年經(jīng)濟工作要堅持穩(wěn)中求進、以進促穩(wěn)、先立后破。要大力推進現(xiàn)代化產(chǎn)業(yè)體系建設(shè),加快發(fā)展新質(zhì)生產(chǎn)力。

上海張江,作為中國科技創(chuàng)新的重要引擎,以其獨特的創(chuàng)新生態(tài)和前沿技術(shù),不斷孕育出具有劃時代意義的新質(zhì)生產(chǎn)力。

為調(diào)研新質(zhì)生產(chǎn)力的發(fā)展成果,張江科學城、財聯(lián)社、《科創(chuàng)板日報》聯(lián)合推出“新質(zhì)生產(chǎn)力看張江”。我們深入一線采訪:張江的企業(yè)如何創(chuàng)業(yè)創(chuàng)新,活力四射;張江的產(chǎn)業(yè)如何向“新”而行,提“質(zhì)”而上。

本期專訪企業(yè):上海巖芯數(shù)智人工智能科技有限公司(下稱:“RockAI”)

image

RockAI CEO劉凡平

《科創(chuàng)板日報》12月2日訊(記者 張洋洋)在張江人工智能島上,RockAI是島內(nèi)為數(shù)不多的從底層架構(gòu)做起,直接切入大模型賽道的創(chuàng)業(yè)公司。但與絕大多數(shù)大模型公司們相比,這家初創(chuàng)企業(yè)又稍顯另類——在技術(shù)路徑上,其選擇了非Transformer架構(gòu)。

今年1月,RockAI推出了國內(nèi)首個非Transformer架構(gòu)、非Attention機制的大模型Yan1.0。9月,這家公司將其大模型迭代至具有多模態(tài)能力的Yan1.3模型,還實現(xiàn)了在手機、電腦、機器人、無人機,甚至樹莓派等廣泛設(shè)備端上的無損部署。

image

談及走一條非主流的技術(shù)路徑,RockAI CEO劉凡平坦言在早期外部并不理解為何我們選擇了這樣一條路。

相較于Transformer架構(gòu),非Transformer的Yan模型好處在于,能耗低、成本小、落地周期快。

有過連續(xù)創(chuàng)業(yè)經(jīng)歷的劉凡平,深刻理解商業(yè)的成本投入和價值產(chǎn)出,在現(xiàn)實的商業(yè)經(jīng)營面前,他選擇頂住壓力,專注走非主流道路。一年多之后,當Yan模型的技術(shù)能力,以領(lǐng)先同行的進度,快速落地在如手機、AI PC的產(chǎn)品上的時候,劉凡平才確認,自己扛過來了。

“這趟去深圳,客戶和合作伙伴塞了一堆東西給我們,都是在問,可不可以給他們的安卓手機、筆記本電腦都裝上大模型。”劉凡平向《科創(chuàng)板日報》記者坦言,“現(xiàn)在的最大壓力,反而是快速交付。”

RockAI是上海巖山科技股份有限公司旗下,致力于讓世界上每一臺設(shè)備都擁有自己智能的大模型企業(yè)。在這家公司坐落的張江人工智能島3號樓,周邊分布著百度、阿里、IBM、微軟等科技巨頭。大廠環(huán)繞,在劉凡平看來,對于RockAI而言是好事,因為這意味著產(chǎn)業(yè)鏈的集聚。

以百度、阿里和巖芯數(shù)智等為代表的大大小小的AI企業(yè)集聚于此,這周邊已經(jīng)形成了一個AI生態(tài)圈。AI浪潮加速推進,張江人工智能島,也正成為上海發(fā)展人工智能產(chǎn)業(yè)高地的重要承載區(qū)。

▍讓大模型更像“人”

在最近一次的開放日活動中,RockAI正式推出全新升級的Yan1.3大模型,并展示了其在無人機、機器人、PC、手機等各類終端設(shè)備上落地能力。

image

相較于1月份首發(fā)的Yan1.0只能處理自然語言,Yan1.3具備了多模態(tài)能力,可處理圖文及語音等多模態(tài)信息,并實現(xiàn)了模型在更廣泛設(shè)備端上的離線無損部署,普通電腦CPU上也能夠流暢運行。

區(qū)別于當下多采用的云、邊、端協(xié)同部署模式,Yan架構(gòu)大模型能直接部署在設(shè)備端,且能夠在較小的算力情況下實現(xiàn)較高的性能。

在接受《科創(chuàng)板日報》采訪時,巖芯數(shù)智CEO劉凡平坦言,從行業(yè)敘事看,大部分人工智能從業(yè)者所置身的是一場“由OpenAI提出概念,Meta負責開源,國內(nèi)市場專注應用”的技術(shù)接力賽。RockAI不想跟隨。

算經(jīng)濟賬,Transformer架構(gòu)的Attention機制,算力耗費高、數(shù)據(jù)需求大,交付成本也高,成本難以覆蓋客戶的付費,不少中小型企業(yè)望而卻步。他們因此在早期就放棄了基于Attention機制的Transformer架構(gòu)大模型。

最近的面試,劉凡平說自己會經(jīng)常問候選人一個問題:如果有一天你要離開這個世界,你希望在自己的墓志銘上寫什么?

他稱,對多數(shù)人而言,這是一個需要思考超過30秒甚至更長時間的問題,但是在Transformer機制下,大模型會馬上輸出答案。

“這是Transformer大模型與人類大腦工作機制的不同,人類回答輸出的時間會根據(jù)問題的復雜程度變化,復雜問題求解時參與的神經(jīng)元變多了,所以輸出時間會變長。但現(xiàn)在的大模型在面對這個問題時,即使是很復雜的問題,它的輸出速度是一樣的?!?/p>

本質(zhì)來說,劉凡平認為大模型應當模擬人腦的方式來工作,而不應該是Transformer架構(gòu)大模型中那樣無時間差別的輸出。也是劉凡平和他的團隊放棄Transformer架構(gòu),選擇自研架構(gòu)的一大原因。

劉凡平說RockAI的愿景,是讓世界上每一臺設(shè)備都擁有自己的智能,同時通過群體智能實現(xiàn)通用人工智能。他期望大模型更像人,自研的Yan模型,是群體智能單元大模型,它會則更注重模擬人腦的工作機制,通過多個智能單元的協(xié)作和交互,形成的集體智慧和決策能力,能夠具備超越單元個體的能力。

在RockAI的規(guī)劃中,群體智能的實現(xiàn)包括四個階段:創(chuàng)新性基礎(chǔ)架構(gòu)、多元化硬件生態(tài)、自適應智能進化、協(xié)同化群體智能。目前,Yan1.3已經(jīng)可以在廣泛的設(shè)備上部署和應用,進入到了多元化硬件生態(tài),下一階段是自主學習。據(jù)劉凡平透露,Yan2.0計劃在明年發(fā)布。

▍讓AI落地端側(cè)

劉凡平是中國科學技術(shù)大學計算機專業(yè),科班出身,研究生生涯一半時間在微軟度過,畢業(yè)后進入百度。從大廠出走后的第一次創(chuàng)業(yè),就是搜索引擎,放在當下的生成式AI語境下,這就是ChatGPT的雛形版。

早期的求學和后來的工作經(jīng)歷,劉凡平一直與人工智能打交道。作為這個行業(yè)的連續(xù)創(chuàng)業(yè)者,他對完善的、能快速奏效的商業(yè)閉環(huán),有著異乎常人的關(guān)注。這一方面是連續(xù)創(chuàng)業(yè)經(jīng)驗帶來的條件反射,同時也是在燒錢的AI行業(yè)里避坑。

商業(yè)閉環(huán)對應的是應用落地。過去兩年,大模型,尤其是基礎(chǔ)模型的技術(shù)進步,日新月異,但其中也有不少質(zhì)疑的聲音,技術(shù)發(fā)展這么快,真正的落地應用在哪里?今年,行業(yè)的討論集中在了大模型的應用上。

劉凡平告訴《科創(chuàng)板日報》記者,RockAI的策略是,快速推進Yan模型在更廣泛的終端落地應用。

從行業(yè)發(fā)展方向來看,大模型落地設(shè)備端是一個明顯的趨勢。在設(shè)備端的場景,國內(nèi)多個廠商已在搶占生態(tài)位,手機端目前最受市場關(guān)注,尤其是蘋果AI的發(fā)布,帶動了AI手機的資本熱潮。

類似于手機的大范圍應用,一個技術(shù)產(chǎn)品要觸達最廣泛的用戶,需要靠設(shè)備,它可以是監(jiān)控的設(shè)備,也可以是家里的設(shè)備,也可以是辦公場景的設(shè)備,設(shè)備才是真正毛細血管,觸達到千千萬萬的用戶。

對于目前的市場競爭形勢,劉凡平表示,硬件更新周期長,比如手機的更新是一年一次,這里就留下了足夠長的時間窗口去和設(shè)備廠商做適配。且某個大模型的一旦占據(jù)了某個設(shè)備型號,其他廠商并不容易替換,要么就等下一次的新機型。硬件廠商選擇供應商也十分謹慎,從實際落地上來說,設(shè)備更容易形成壁壘。

在近期的開放日現(xiàn)場,RockAI重點展出了Yan1.3在機器人、PC、手機、無人機等各類終端設(shè)備上的落地。例如,飛龍無人機能在設(shè)備端實時處理聲音、圖像及文字等模態(tài)信息,無需經(jīng)由云端處理判定再發(fā)回設(shè)備端執(zhí)行;胖虎機器人可在離線的情況下理解模糊指令,展現(xiàn)“七步成詩”、“詠春拳法”等;在PC上的迅兔智能助手可以在離線模式下聽懂語音指令、看懂圖片并快速搜圖。

據(jù)劉凡平透露,目前RockAI已在機器人和AI PC、手機等產(chǎn)品上具備交付能力。

image

劉凡平認為,在AGI這個終極命題下,無論是云端還是端側(cè),都只是實現(xiàn)智能普惠及躍遷的一個載體。他始終堅信,只有真正提升每一臺設(shè)備的自我學習能力,才能激發(fā)更高級別智能形態(tài)即群體智能的涌現(xiàn)。

▍離開又回到張江

劉凡平是后來帶著獨立創(chuàng)業(yè)的RockAI回到張江的。在此之前,他在當?shù)氐纳鲜泄編r山科技履職。目前,RockAI已經(jīng)是巖山科技獨立的人工智能業(yè)務(wù)板塊。

之所以繼續(xù)回到張江發(fā)展,既有前東家的邀約,也有當?shù)禺a(chǎn)業(yè)鏈的集聚效應吸引。

RockAI現(xiàn)在坐落于張江人工智能島3號樓,周邊分布著百度、阿里、IBM、微軟等科技巨頭。這附近,也是上海發(fā)展人工智能產(chǎn)業(yè)高地的重要承載區(qū)。

劉凡平表示,產(chǎn)業(yè)上的大廠環(huán)繞,一定程度上可以鏈接更多合作伙伴。RockAI目前被視為張江重點人工智能企業(yè),當?shù)卣步o予了諸多支持。今年元旦前后,RockAI就將搬入張江的大模型產(chǎn)業(yè)生態(tài)集聚區(qū)“模力社區(qū)”,這些場地,當?shù)匾步o予了場地租金的優(yōu)惠支持。

AI行業(yè)未來面臨的星辰大海和公司當下快速的發(fā)展線軸,為劉凡平的創(chuàng)業(yè)增添不少信心。RockAI巖芯數(shù)智目前的團隊規(guī)模約為50人,但交付跟不上,也困擾著他。

“其實現(xiàn)在我們也需要去擴大團隊規(guī)模,尤其是市場團隊、交付團隊,這塊的建設(shè)可能會投入更多,此外還會再在技術(shù)研發(fā)上繼續(xù)做投入?!彼f。

收藏
90.16W
我要評論
歡迎您發(fā)表有價值的評論,發(fā)布廣告和不和諧的評論都將會被刪除,您的賬號將禁止評論。
發(fā)表評論
要聞
股市
關(guān)聯(lián)話題
0 人關(guān)注