智譜攜“沉思”加入Agent“混戰(zhàn)” 記者實(shí)測(cè)結(jié)果來(lái)了！

原創(chuàng)

2025-04-03 07:28 星期四

科創(chuàng)板日?qǐng)?bào)記者李明明

①記者在實(shí)測(cè)中發(fā)現(xiàn)，“沉思”在思考過(guò)程中不僅速度較快，生成的旅游方案可媲美專業(yè)的旅行規(guī)劃師；
②智譜CEO張鵬表示，AutoGLM更早是應(yīng)用在手機(jī)端，本次“沉思”只不過(guò)是把它移到了PC上。

《科創(chuàng)板日?qǐng)?bào)》4月3日訊（記者李明明）繼與多地國(guó)資合作之后，大模型獨(dú)角獸智譜又在產(chǎn)品方面迎來(lái)新進(jìn)展。

近日，智譜推出具有深度思考和操作執(zhí)行能力的Agent 產(chǎn)品“AutoGLM 沉思”（以下簡(jiǎn)稱“沉思”），并已經(jīng)免費(fèi)上線。據(jù)介紹，“沉思”能查看如知網(wǎng)、小紅書(shū)、公眾號(hào)、巨潮資訊等不對(duì)外開(kāi)放API的信源，同時(shí)具有多模態(tài)理解能力，能夠理解網(wǎng)頁(yè)上的圖文信息。

在介紹“沉思”時(shí)，智譜CEO張鵬略帶調(diào)侃地表示，“這個(gè)Agent不用39美元，免費(fèi)而且不用邀請(qǐng)碼?！贝饲?，國(guó)產(chǎn)智能體Manus曾掀起一股關(guān)于AI Agent的討論熱潮，但因?yàn)樾枰?qǐng)碼發(fā)放有限，絕大部分用戶只能觀望，無(wú)法真正體驗(yàn)。

《科創(chuàng)板日?qǐng)?bào)》記者在實(shí)測(cè)中發(fā)現(xiàn)，“沉思”在思考過(guò)程中展現(xiàn)出從理解并拆解問(wèn)題入手，結(jié)合信息檢索快速構(gòu)建解決方案框架的能力。

記者實(shí)測(cè)“ 沉思”

《科創(chuàng)板日?qǐng)?bào)》記者使用“ 沉思”實(shí)測(cè)了七個(gè)任務(wù)，它均能較好地完成，舉其中三個(gè)例子來(lái)展示其推理過(guò)程。

任務(wù)一：我需要一份 4 月 20-27日從北京出發(fā)的 7 天歐洲行程，預(yù)算為 3 -8萬(wàn)元，適合我和閨蜜。我們喜歡名勝古跡、隱藏的寶藏和歐洲文化，并需要一個(gè)特別的歷史地點(diǎn)推薦。請(qǐng)?zhí)峁┮环菰敿?xì)的旅行手冊(cè)，其中包含地圖、景點(diǎn)介紹、必要的外語(yǔ)短語(yǔ)和旅行小貼士，供我們?cè)诼猛局袇⒖肌?

任務(wù)二：月壇附近肯德基外賣(mài)推薦。

任務(wù)三：我之前總是被提醒著裝打扮有點(diǎn)學(xué)生氣，現(xiàn)在我準(zhǔn)備進(jìn)入職場(chǎng)，也開(kāi)始研究穿搭改變自己，順便開(kāi)個(gè)抖音賬號(hào)記錄自己改變的過(guò)程，做一個(gè)養(yǎng)成系博主，第一期標(biāo)題我打算叫《聽(tīng)勸第1天》，請(qǐng)你幫我寫(xiě)個(gè)視頻腳本。

任務(wù)一讓 Agent 完成高度定制化的旅行方案規(guī)劃，以往都需要專業(yè)的旅行規(guī)劃師才能完成?？梢钥吹?，“沉思”迅速打開(kāi)了相關(guān)購(gòu)票、預(yù)定酒店的網(wǎng)站并進(jìn)行一系列解析后，給出了一份數(shù)千字的詳細(xì)報(bào)告。

任務(wù)二中，“沉思”對(duì)月壇附近主要門(mén)店位置、門(mén)店特色、不同平臺(tái)外賣(mài)服務(wù)的配送、價(jià)格等多維度對(duì)比，并生成詳細(xì)表格和報(bào)告。

任務(wù)三中，“沉思”不停搜索知乎、新浪、搜狐等眾多網(wǎng)站，并迅速生成抖音視頻腳本，其文采水平和完成度均較高。

總體感受是，“沉思”的執(zhí)行非常迅速，甚至可以打開(kāi)很多用戶自己的盲區(qū)網(wǎng)站，可以大幅度節(jié)省時(shí)間和決策成本。

但亦有一些用戶告訴《科創(chuàng)板日?qǐng)?bào)》記者，比起邊想邊搜，深度思考類模型產(chǎn)品更應(yīng)該實(shí)現(xiàn)的功能是邊聊邊想，在思考的每一個(gè)節(jié)點(diǎn)，用戶都能參與進(jìn)來(lái)進(jìn)行交互，并及時(shí)糾正模型動(dòng)作，以防模型進(jìn)行一些不必要甚至是錯(cuò)誤的思考行為和操作。

智能體的應(yīng)用形態(tài)，還將回歸到模型上

而隨著Agent爆發(fā)的持續(xù)迫近，有關(guān)Agent的實(shí)現(xiàn)方式和最終形態(tài)，也成為當(dāng)前AI從業(yè)者的爭(zhēng)論焦點(diǎn)。此前，Pleias的聯(lián)合創(chuàng)始人Alexander Doria曾提到，未來(lái)AI智能體的發(fā)展方向是模型本身，而不是工作流，并列舉了Manus的例子，認(rèn)為其提示驅(qū)動(dòng)無(wú)法完成復(fù)雜的任務(wù)。

張鵬對(duì)《科創(chuàng)板日?qǐng)?bào)》記者表示，其觀點(diǎn)與Alexander Doria基本一致?！拔磥?lái)的新應(yīng)用形態(tài)，尤其是智能體的應(yīng)用形態(tài)，還是會(huì)回歸到模型上。這也是我們一直所倡導(dǎo)的模型即場(chǎng)景的概念，未來(lái)很多的應(yīng)用會(huì)以模型為核心，包上一個(gè)很淺的或者很薄的產(chǎn)品化、應(yīng)用性的殼就會(huì)變成一個(gè)產(chǎn)品。模型能力一旦提升，產(chǎn)品能力就會(huì)得到提升，這是很典型的新應(yīng)用范式的變化?！?/p>

“但是，當(dāng)下AGI之路剛剛開(kāi)始，模型的能力還無(wú)法達(dá)到完全類比人的水平，模型能力有限，需工程化解決實(shí)際應(yīng)用問(wèn)題。永遠(yuǎn)是模型進(jìn)，工程退。其技術(shù)越先進(jìn)，需要工程化的事情越簡(jiǎn)單。所以，終極的目標(biāo)是當(dāng)造出一個(gè)像人一樣聰明的腦子之后，工程上的事情就比較少，只需要給它裝上手和眼睛就可以像人一樣完成很多工作，這也是AGI的終極目標(biāo)?！?張鵬說(shuō)。

另有大模型企業(yè)人士告訴《科創(chuàng)板日?qǐng)?bào)》記者，Manus更傾向于以AI技術(shù)優(yōu)化具體場(chǎng)景中的流程與體驗(yàn)，而非聚焦于底層技術(shù)突破。“然而，Manus本身未能形成有效的產(chǎn)品壁壘，后續(xù)大量開(kāi)源版本Manus的出現(xiàn)，讓其稀有性被打破，‘沉思’的出現(xiàn)就是一個(gè)例子?！?/p>

目前來(lái)說(shuō)，Agent要達(dá)到可用，需要打通一些公域和私域之間的數(shù)據(jù)壁壘，以及打通不同平臺(tái)之間的壁壘。

比如，Manus此前短暫爆火，但隨后在復(fù)雜任務(wù)中的表現(xiàn)屢出狀況。有實(shí)測(cè)案例顯示，解析文件時(shí)，Manus對(duì)非標(biāo)準(zhǔn)格式的兼容性較差，部分?jǐn)?shù)據(jù)直接丟失；網(wǎng)頁(yè)爬取環(huán)節(jié)頻繁遭遇驗(yàn)證碼攔截，任務(wù)中斷。

提到解決辦法，張鵬告訴《科創(chuàng)板日?qǐng)?bào)》記者，公司在公開(kāi)演示 “沉思”時(shí)選擇了大眾易理解的通用場(chǎng)景。但針對(duì)專業(yè)領(lǐng)域、企業(yè)用戶或存在特定限制條件的用戶，智譜已構(gòu)建了一套功能化的解決方案。這套方案將通過(guò)公司未來(lái)的 MaaS 平臺(tái)（模型即服務(wù)）及智能體開(kāi)發(fā)平臺(tái)進(jìn)行沉淀，開(kāi)發(fā)者和企業(yè)用戶可基于這兩大基礎(chǔ)平臺(tái)便捷調(diào)用資源，實(shí)現(xiàn)快速適配與功能擴(kuò)展。張鵬特別強(qiáng)調(diào)，這些均屬于產(chǎn)品層面的優(yōu)化，而非模型層面的問(wèn)題。

“比如說(shuō)登錄網(wǎng)盤(pán)等這些額外的操作，本質(zhì)上還是智能體聰明程度不如人類，如果其可以通過(guò)圖靈測(cè)試，能力與人類非常接近了，那現(xiàn)在的封禁和攔截策略也很難做的到?！?/strong>

他進(jìn)一步解釋，通用Agent不能有短板，包括文本、思考、操作、環(huán)境感知和理解的能力、調(diào)用工具、反復(fù)嘗試的能力等，都不能有明顯的短板。一旦有明顯短板存在，就會(huì)導(dǎo)致應(yīng)用成功率急劇下降。

“我們始終堅(jiān)持為所有模型注入語(yǔ)言多模態(tài)能力，源于對(duì)人類認(rèn)知本質(zhì)的理解。"”張鵬指出，人類作為具備綜合認(rèn)知能力的生命體，其智能評(píng)判體系具有整體性特征。當(dāng)公眾審視 AI 系統(tǒng)時(shí)，往往不會(huì)局限于單一維度的能力對(duì)比，而是通過(guò)多模態(tài)交互體驗(yàn)形成整體認(rèn)知。即使某模型在邏輯推理、自然語(yǔ)言生成等單項(xiàng)指標(biāo)上超越人類，但若多模態(tài)交互能力存在短板，仍會(huì)被感知為 "智能缺陷"。這一現(xiàn)象揭示出，技術(shù)研發(fā)者不應(yīng)簡(jiǎn)單歸咎于外部環(huán)境，而需從模型架構(gòu)層面重新審視技術(shù)演進(jìn)路徑。

隨著Agent能力的不斷演進(jìn)，未來(lái)其在硬件端的入口也會(huì)更加豐富，包括機(jī)器人、眼鏡等設(shè)備都將成為新的接入點(diǎn)。而這又帶來(lái)了新的問(wèn)題：調(diào)用這些入口還面臨哪些挑戰(zhàn)？

張鵬對(duì)此表示，AutoGLM更早是應(yīng)用在手機(jī)端，本次“沉思”只不過(guò)是把它移到了PC上。而其他智能硬件，比如眼鏡、車(chē)載以及平板等端側(cè)亦類似，都可以接入?！暗抢锩娲_實(shí)有一些問(wèn)題，比如，不同類型的設(shè)備，最終的交互方式不一樣，比如說(shuō)眼鏡不可能有鍵盤(pán)，就要用語(yǔ)音交互，語(yǔ)音就引入了全新的模態(tài)。”

“所以，當(dāng)前階段，接入Agent遠(yuǎn)非簡(jiǎn)單地‘插入芯片、接入現(xiàn)成的SDK’那么容易，這種'即插即用'的便捷性仍是未來(lái)愿景，當(dāng)下還無(wú)法實(shí)現(xiàn)。”

閱72W

我要評(píng)論
反饋意見(jiàn)

歡迎您發(fā)表有價(jià)值的評(píng)論，發(fā)布廣告和不和諧的評(píng)論都將會(huì)被刪除，您的賬號(hào)將禁止評(píng)論。

發(fā)表評(píng)論

要聞

股市

查看更多

關(guān)聯(lián)話題

人工智能

5.05W 人關(guān)注

+ 關(guān)注

創(chuàng)投日?qǐng)?bào)

8869 人關(guān)注

+ 關(guān)注

創(chuàng)投

6544 人關(guān)注

+ 關(guān)注

首頁(yè)

電報(bào)

話題

盯盤(pán)

VIP

FM

投研

下載

頭條

A股

港股

環(huán)球

公司

券商

基金·ETF

地產(chǎn)

金融

汽車(chē)

科創(chuàng)

品見(jiàn)

記者實(shí)測(cè)“ 沉思”

智能體的應(yīng)用形態(tài)，還將回歸到模型上

首頁(yè)

電報(bào)

話題

盯盤(pán)

VIP

FM

投研

下載

記者實(shí)測(cè)“ 沉思”

智能體的應(yīng)用形態(tài)，還將回歸到模型上

智能體的應(yīng)用形態(tài)，還將回歸到模型上