①記者在實(shí)測(cè)中發(fā)現(xiàn),“沉思”在思考過(guò)程中不僅速度較快,生成的旅游方案可媲美專業(yè)的旅行規(guī)劃師; ②智譜CEO張鵬表示,AutoGLM更早是應(yīng)用在手機(jī)端,本次“沉思”只不過(guò)是把它移到了PC上。
《科創(chuàng)板日?qǐng)?bào)》4月3日訊(記者 李明明)繼與多地國(guó)資合作之后,大模型獨(dú)角獸智譜又在產(chǎn)品方面迎來(lái)新進(jìn)展。
近日,智譜推出具有深度思考和操作執(zhí)行能力的Agent 產(chǎn)品“AutoGLM 沉思”(以下簡(jiǎn)稱“沉思”),并已經(jīng)免費(fèi)上線。據(jù)介紹,“沉思”能查看如知網(wǎng)、小紅書(shū)、公眾號(hào)、巨潮資訊等不對(duì)外開(kāi)放API的信源,同時(shí)具有多模態(tài)理解能力,能夠理解網(wǎng)頁(yè)上的圖文信息。
在介紹“沉思”時(shí),智譜CEO張鵬略帶調(diào)侃地表示,“這個(gè)Agent不用39美元,免費(fèi)而且不用邀請(qǐng)碼?!贝饲?,國(guó)產(chǎn)智能體Manus曾掀起一股關(guān)于AI Agent的討論熱潮,但因?yàn)樾枰?qǐng)碼發(fā)放有限,絕大部分用戶只能觀望,無(wú)法真正體驗(yàn)。
《科創(chuàng)板日?qǐng)?bào)》記者在實(shí)測(cè)中發(fā)現(xiàn),“沉思”在思考過(guò)程中展現(xiàn)出從理解并拆解問(wèn)題入手,結(jié)合信息檢索快速構(gòu)建解決方案框架的能力。
記者實(shí)測(cè)“ 沉思”
《科創(chuàng)板日?qǐng)?bào)》記者使用“ 沉思”實(shí)測(cè)了七個(gè)任務(wù),它均能較好地完成,舉其中三個(gè)例子來(lái)展示其推理過(guò)程。
任務(wù)一:我需要一份 4 月 20-27日從北京出發(fā)的 7 天歐洲行程,預(yù)算為 3 -8萬(wàn)元,適合我和閨蜜。我們喜歡名勝古跡、隱藏的寶藏和歐洲文化,并需要一個(gè)特別的歷史地點(diǎn)推薦。請(qǐng)?zhí)峁┮环菰敿?xì)的旅行手冊(cè),其中包含地圖、景點(diǎn)介紹、必要的外語(yǔ)短語(yǔ)和旅行小貼士,供我們?cè)诼猛局袇⒖肌?
任務(wù)二:月壇附近肯德基外賣(mài)推薦。
任務(wù)三:我之前總是被提醒著裝打扮有點(diǎn)學(xué)生氣,現(xiàn)在我準(zhǔn)備進(jìn)入職場(chǎng),也開(kāi)始研究穿搭改變自己,順便開(kāi)個(gè)抖音賬號(hào)記錄自己改變的過(guò)程,做一個(gè)養(yǎng)成系博主,第一期標(biāo)題我打算叫《聽(tīng)勸第1天》,請(qǐng)你幫我寫(xiě)個(gè)視頻腳本。
任務(wù)一讓 Agent 完成高度定制化的旅行方案規(guī)劃,以往都需要專業(yè)的旅行規(guī)劃師才能完成??梢钥吹?,“沉思”迅速打開(kāi)了相關(guān)購(gòu)票、預(yù)定酒店的網(wǎng)站并進(jìn)行一系列解析后,給出了一份數(shù)千字的詳細(xì)報(bào)告。
任務(wù)二中,“沉思”對(duì)月壇附近主要門(mén)店位置、門(mén)店特色、不同平臺(tái)外賣(mài)服務(wù)的配送、價(jià)格等多維度對(duì)比,并生成詳細(xì)表格和報(bào)告。
任務(wù)三中,“沉思”不停搜索知乎、新浪、搜狐等眾多網(wǎng)站,并迅速生成抖音視頻腳本,其文采水平和完成度均較高。
總體感受是,“沉思”的執(zhí)行非常迅速,甚至可以打開(kāi)很多用戶自己的盲區(qū)網(wǎng)站,可以大幅度節(jié)省時(shí)間和決策成本。
但亦有一些用戶告訴《科創(chuàng)板日?qǐng)?bào)》記者,比起邊想邊搜,深度思考類模型產(chǎn)品更應(yīng)該實(shí)現(xiàn)的功能是邊聊邊想,在思考的每一個(gè)節(jié)點(diǎn),用戶都能參與進(jìn)來(lái)進(jìn)行交互,并及時(shí)糾正模型動(dòng)作,以防模型進(jìn)行一些不必要甚至是錯(cuò)誤的思考行為和操作。
智能體的應(yīng)用形態(tài),還將回歸到模型上
而隨著Agent爆發(fā)的持續(xù)迫近,有關(guān)Agent的實(shí)現(xiàn)方式和最終形態(tài),也成為當(dāng)前AI從業(yè)者的爭(zhēng)論焦點(diǎn)。此前,Pleias的聯(lián)合創(chuàng)始人Alexander Doria曾提到,未來(lái)AI智能體的發(fā)展方向是模型本身,而不是工作流,并列舉了Manus的例子,認(rèn)為其提示驅(qū)動(dòng)無(wú)法完成復(fù)雜的任務(wù)。
張鵬對(duì)《科創(chuàng)板日?qǐng)?bào)》記者表示,其觀點(diǎn)與Alexander Doria基本一致?!拔磥?lái)的新應(yīng)用形態(tài),尤其是智能體的應(yīng)用形態(tài),還是會(huì)回歸到模型上。這也是我們一直所倡導(dǎo)的模型即場(chǎng)景的概念,未來(lái)很多的應(yīng)用會(huì)以模型為核心,包上一個(gè)很淺的或者很薄的產(chǎn)品化、應(yīng)用性的殼就會(huì)變成一個(gè)產(chǎn)品。模型能力一旦提升,產(chǎn)品能力就會(huì)得到提升,這是很典型的新應(yīng)用范式的變化?!?/p>
“但是,當(dāng)下AGI之路剛剛開(kāi)始,模型的能力還無(wú)法達(dá)到完全類比人的水平,模型能力有限,需工程化解決實(shí)際應(yīng)用問(wèn)題。永遠(yuǎn)是模型進(jìn),工程退。其技術(shù)越先進(jìn),需要工程化的事情越簡(jiǎn)單。所以,終極的目標(biāo)是當(dāng)造出一個(gè)像人一樣聰明的腦子之后,工程上的事情就比較少,只需要給它裝上手和眼睛就可以像人一樣完成很多工作,這也是AGI的終極目標(biāo)?!?張鵬說(shuō)。
另有大模型企業(yè)人士告訴《科創(chuàng)板日?qǐng)?bào)》記者,Manus更傾向于以AI技術(shù)優(yōu)化具體場(chǎng)景中的流程與體驗(yàn),而非聚焦于底層技術(shù)突破。“然而,Manus本身未能形成有效的產(chǎn)品壁壘,后續(xù)大量開(kāi)源版本Manus的出現(xiàn),讓其稀有性被打破,‘沉思’的出現(xiàn)就是一個(gè)例子?!?/p>
目前來(lái)說(shuō),Agent要達(dá)到可用,需要打通一些公域和私域之間的數(shù)據(jù)壁壘,以及打通不同平臺(tái)之間的壁壘。
比如,Manus此前短暫爆火,但隨后在復(fù)雜任務(wù)中的表現(xiàn)屢出狀況。有實(shí)測(cè)案例顯示,解析文件時(shí),Manus對(duì)非標(biāo)準(zhǔn)格式的兼容性較差,部分?jǐn)?shù)據(jù)直接丟失;網(wǎng)頁(yè)爬取環(huán)節(jié)頻繁遭遇驗(yàn)證碼攔截,任務(wù)中斷。
提到解決辦法,張鵬告訴《科創(chuàng)板日?qǐng)?bào)》記者,公司在公開(kāi)演示 “沉思”時(shí)選擇了大眾易理解的通用場(chǎng)景。但針對(duì)專業(yè)領(lǐng)域、企業(yè)用戶或存在特定限制條件的用戶,智譜已構(gòu)建了一套功能化的解決方案。這套方案將通過(guò)公司未來(lái)的 MaaS 平臺(tái)(模型即服務(wù))及智能體開(kāi)發(fā)平臺(tái)進(jìn)行沉淀,開(kāi)發(fā)者和企業(yè)用戶可基于這兩大基礎(chǔ)平臺(tái)便捷調(diào)用資源,實(shí)現(xiàn)快速適配與功能擴(kuò)展。張鵬特別強(qiáng)調(diào),這些均屬于產(chǎn)品層面的優(yōu)化,而非模型層面的問(wèn)題。
“比如說(shuō)登錄網(wǎng)盤(pán)等這些額外的操作,本質(zhì)上還是智能體聰明程度不如人類,如果其可以通過(guò)圖靈測(cè)試,能力與人類非常接近了,那現(xiàn)在的封禁和攔截策略也很難做的到?!?/strong>
他進(jìn)一步解釋,通用Agent不能有短板,包括文本、思考、操作、環(huán)境感知和理解的能力、調(diào)用工具、反復(fù)嘗試的能力等,都不能有明顯的短板。一旦有明顯短板存在,就會(huì)導(dǎo)致應(yīng)用成功率急劇下降。
“我們始終堅(jiān)持為所有模型注入語(yǔ)言多模態(tài)能力,源于對(duì)人類認(rèn)知本質(zhì)的理解。"”張鵬指出,人類作為具備綜合認(rèn)知能力的生命體,其智能評(píng)判體系具有整體性特征。當(dāng)公眾審視 AI 系統(tǒng)時(shí),往往不會(huì)局限于單一維度的能力對(duì)比,而是通過(guò)多模態(tài)交互體驗(yàn)形成整體認(rèn)知。即使某模型在邏輯推理、自然語(yǔ)言生成等單項(xiàng)指標(biāo)上超越人類,但若多模態(tài)交互能力存在短板,仍會(huì)被感知為 "智能缺陷"。這一現(xiàn)象揭示出,技術(shù)研發(fā)者不應(yīng)簡(jiǎn)單歸咎于外部環(huán)境,而需從模型架構(gòu)層面重新審視技術(shù)演進(jìn)路徑。
隨著Agent能力的不斷演進(jìn),未來(lái)其在硬件端的入口也會(huì)更加豐富,包括機(jī)器人、眼鏡等設(shè)備都將成為新的接入點(diǎn)。而這又帶來(lái)了新的問(wèn)題:調(diào)用這些入口還面臨哪些挑戰(zhàn)?
張鵬對(duì)此表示,AutoGLM更早是應(yīng)用在手機(jī)端,本次“沉思”只不過(guò)是把它移到了PC上。而其他智能硬件,比如眼鏡、車(chē)載以及平板等端側(cè)亦類似,都可以接入?!暗抢锩娲_實(shí)有一些問(wèn)題,比如,不同類型的設(shè)備,最終的交互方式不一樣,比如說(shuō)眼鏡不可能有鍵盤(pán),就要用語(yǔ)音交互,語(yǔ)音就引入了全新的模態(tài)。”
“所以,當(dāng)前階段,接入Agent遠(yuǎn)非簡(jiǎn)單地‘插入芯片、接入現(xiàn)成的SDK’那么容易,這種'即插即用'的便捷性仍是未來(lái)愿景,當(dāng)下還無(wú)法實(shí)現(xiàn)。”
