①關(guān)于G1售價(jià)僅9.9萬元起的定價(jià), 宇樹科技創(chuàng)始人王興興表示,產(chǎn)品有市場(chǎng)的前提是價(jià)格比較友好,但價(jià)格定太低對(duì)整個(gè)行業(yè)都不是好事; ②他還表示,ChatGPT的出現(xiàn)讓大家意識(shí)到大語言模型在機(jī)器人的AI領(lǐng)域也非常重要。
《科創(chuàng)板日?qǐng)?bào)》8月22日訊(記者 李明明)人形機(jī)器人被認(rèn)為是最容易適應(yīng)現(xiàn)實(shí)世界的機(jī)器人,其應(yīng)用場(chǎng)景還在不斷拓展。因此,人形機(jī)器人也逐漸成為創(chuàng)投領(lǐng)域的熱門賽道。
作為業(yè)內(nèi)頭部獨(dú)角獸,宇樹科技越來越多地受到市場(chǎng)關(guān)注。近日,宇樹科技人形機(jī)器人G1量產(chǎn)版發(fā)布。據(jù)介紹,G1量產(chǎn)版具備了大規(guī)模生產(chǎn)能力,性能和外觀都得到升級(jí),而它的售價(jià)僅9.9萬元起。
在2024世界機(jī)器人大會(huì)期間,《科創(chuàng)板日?qǐng)?bào)》記者專訪了宇樹科技創(chuàng)始人王興興,關(guān)于G1售價(jià)問題,他表示,“我們一直希望用更合理的價(jià)格提供產(chǎn)品給客戶,產(chǎn)品有市場(chǎng)的前提是價(jià)格比較友好?!?但他也坦言,目前人形機(jī)器人的體量還沒有完全起來,如果價(jià)格定得太低,可能對(duì)整個(gè)行業(yè)都不是好事,“一直不希望帶頭把行業(yè)做爛。”
(宇樹科技創(chuàng)始人王興興)
王興興還表示,目前的大語言模型還是不能充分支持人形機(jī)器人大模型的發(fā)展,后者的技術(shù)路線各家也并不統(tǒng)一,現(xiàn)狀很像ChatGPT出來的前一兩年。
從人形機(jī)器人的“反對(duì)者”到“進(jìn)場(chǎng)者”
《科創(chuàng)板日?qǐng)?bào)》:在本屆世界機(jī)器人大會(huì)上,宇樹帶來了哪些新品,有哪些想要重點(diǎn)展示的?
王興興:本次公司的展示場(chǎng)地比較大,我們帶來了消費(fèi)級(jí)四足機(jī)器人Go2和它的新型號(hào)Go2-W輪足版本,工業(yè)級(jí)四足機(jī)器人B2、B2-W,還有不斷升級(jí)版的通用人形機(jī)器人H1,以及今年5月發(fā)布的G1人形智能體,僅僅3個(gè)月后又迎來了其量產(chǎn)版本,并在本次大會(huì)上首度亮相。
還有一些小的產(chǎn)品比如機(jī)械臂Z1也有展示。另外我們還帶來了3D激光雷達(dá)升級(jí)版本,這款雷達(dá)此前還沒有發(fā)布,可以讓機(jī)器狗有更靈敏的感知、導(dǎo)航?jīng)Q策。
《科創(chuàng)板日?qǐng)?bào)》:早期業(yè)界不那么看好人形機(jī)器人,請(qǐng)問宇樹怎么看待外界的聲音,公司在人形機(jī)器人上的發(fā)展戰(zhàn)略是怎樣的?
王興興:發(fā)展人形機(jī)器人基本上還是要追尋整個(gè)社會(huì)的共識(shí)節(jié)奏,因?yàn)槔总娬f過順勢(shì)而為,要追隨社會(huì)潮流去做,如果做得太早或太晚,其實(shí)都是不好的。
像在2020年前,有很多投資人問我做不做人形機(jī)器人,當(dāng)時(shí)我斬釘截鐵地回答不做,主要由于當(dāng)時(shí)全球范圍內(nèi),在人形機(jī)器人的控制技術(shù)等方面,普遍發(fā)展的不理想,也看不到實(shí)用價(jià)值。
而近年,在馬斯克的帶領(lǐng)下,全球?qū)θ诵螜C(jī)器人非常關(guān)注;同時(shí),2022年底大語言模型的出現(xiàn),使得AI技術(shù)產(chǎn)生了質(zhì)變,讓人們看到了AI在賦能機(jī)器人上的潛力。同年底,雖然宇樹還沒做人形機(jī)器人,但已經(jīng)有一些客戶找過來要購(gòu)買。所以我們認(rèn)為社會(huì)的共識(shí)、熱度、客戶的期待程度方面已經(jīng)足夠了,于是在2023年正式開始做人形機(jī)器人。(小K注:宇樹科技成立于2016年8月,最早專注四足機(jī)器人的研發(fā)和銷售。)
目前人形機(jī)器人體量尚未成規(guī)模,定價(jià)太低傷害行業(yè)
《科創(chuàng)板日?qǐng)?bào)》:目前,宇樹在機(jī)械和動(dòng)力等方面的重要突破有哪些?外界評(píng)價(jià)宇樹的硬件很厲害,對(duì)此你怎么看?
王興興:很多人對(duì)我們公司的印象是硬件公司,我個(gè)人還挺喜歡這個(gè)標(biāo)簽的,因?yàn)檫@也代表了大家認(rèn)可公司的硬件。機(jī)器狗目前在全球范圍內(nèi)出貨量一直較好,我們也在硬件上做了一部分軟件升級(jí)。
比如去年的Go2機(jī)器狗,就集成了Open AI的大語言模型接口,人們可以跟它對(duì)話,它把識(shí)別的對(duì)話發(fā)送到Open AI的服務(wù)器上,然后把結(jié)果反饋給機(jī)器狗,讓其去執(zhí)行一些底層預(yù)設(shè)的功能,即把整個(gè)任務(wù)的編排和執(zhí)行的操作權(quán)放在了Open AI的接口上。目前已經(jīng)留了一些接口,授權(quán)給大語言模型接口,讓它調(diào)用底層的一些功能,比如走路跳躍、拍照等。
此外,我們也做了機(jī)器人運(yùn)動(dòng)控制相關(guān)的強(qiáng)化學(xué)習(xí)。而對(duì)于讓機(jī)器人“干活”這個(gè)重點(diǎn),則需要用到一部分大語言模型的技術(shù)。比如采集圖片的數(shù)據(jù)、機(jī)器人關(guān)節(jié)指令數(shù)據(jù)等,然后去做訓(xùn)練。
《科創(chuàng)板日?qǐng)?bào)》:宇樹和電動(dòng)Atlas采用的都是三指方案,為何你們?cè)O(shè)計(jì)的是三指,而不是四指或者五指?
王興興:目前從全球來看,人形機(jī)器人技術(shù)方案尚未統(tǒng)一,最典型一個(gè)代表就是機(jī)器人到底有幾個(gè)手指,到現(xiàn)在各家都沒有統(tǒng)一的意見。
我們的G1人形機(jī)器人身高1.3米左右,如果給其裝個(gè)五指,會(huì)導(dǎo)致手部較大,所以希望盡量減少手指。后來發(fā)現(xiàn)大部分產(chǎn)品上三指都能用,比如,抓取物品方面,三個(gè)手指可以抓得很牢,適用于超過90%的操作,在工廠的波士頓動(dòng)力Atlas也是采用三指的方案。另外從實(shí)用性的角度,也希望其硬件越來越簡(jiǎn)單。
再分享一個(gè)觀點(diǎn):隨著AI技術(shù)的成熟和進(jìn)步,人形機(jī)器人對(duì)硬件的需求如自由度、數(shù)量、外觀靈活度等將越來越低,甚至沒有手指也能干活。
《科創(chuàng)板日?qǐng)?bào)》: G1人形機(jī)器人的價(jià)格非常親民,為何能夠做到大幅度的降本?
王興興:我們一直希望用更合理的價(jià)格提供產(chǎn)品給客戶,產(chǎn)品有市場(chǎng)的前提也是價(jià)格比較友好。G1價(jià)格目前比較有競(jìng)爭(zhēng)力,是因?yàn)槲覀冏鏊淖銠C(jī)器人已經(jīng)有不少年頭,所以對(duì)機(jī)械方面,比如關(guān)節(jié)電機(jī)的生產(chǎn)、整體機(jī)械結(jié)構(gòu)、傳感器、整體電控系統(tǒng)芯片等,積累了較多的經(jīng)驗(yàn)心得。
但是,哪怕公司目前已經(jīng)有好幾款產(chǎn)品的量產(chǎn)經(jīng)驗(yàn),在當(dāng)下而言,我們量產(chǎn)一款產(chǎn)品還是較有壓力,需要涉及和考慮的方面很多,在產(chǎn)品的設(shè)計(jì)階段就要做好降成本的準(zhǔn)備,每個(gè)零部件都要做的更加簡(jiǎn)化,比如每一個(gè)零部件細(xì)節(jié)的設(shè)置和精度要求、零部件之間的配合以及工藝要求、零部件的量產(chǎn)規(guī)劃以及對(duì)生產(chǎn)工人的流程配合等都要考慮,所以對(duì)整體管理和成本管控的要求比較高。
目前人形機(jī)器人的體量還沒有完全起來,如果我們把價(jià)格定得太低,可能對(duì)整個(gè)行業(yè)包括我們自身都不是好事,宇樹一直不希望帶頭把行業(yè)做爛,如果把人形機(jī)器人定價(jià)為每臺(tái)1萬元,那會(huì)傷害整個(gè)行業(yè)。我們還是希望價(jià)格相對(duì)合理,如果后續(xù)整體產(chǎn)品體量和出貨量提升的話,價(jià)格可以有一些更好的調(diào)整。
不超過5年 人形機(jī)器人領(lǐng)域?qū)?huì)出現(xiàn)“iPhone時(shí)刻”
《科創(chuàng)板日?qǐng)?bào)》:目前大模型可重點(diǎn)解決哪些人形機(jī)器人研發(fā)的技術(shù)問題?可以滿足后者的發(fā)展嗎?
王興興:實(shí)際上,真正的人形機(jī)器人大模型再往下發(fā)展,目前的大語言模型還是不能充分支持的,個(gè)人認(rèn)為,人形機(jī)器人大模型本質(zhì)上和大語言模型有很大的區(qū)別。
舉個(gè)最直觀的例子,在工廠里工作的機(jī)器人,其完全可以不用講話,給一張照片,或者敲一個(gè)指令過去,它就可以完成指派的任務(wù),即“干活”。如果單純需要人機(jī)對(duì)話的情景,那么可能一個(gè)手機(jī)就可以做好,所以我認(rèn)為“干活”是最主要的點(diǎn)。
另外,在目前的人形機(jī)器人大模型領(lǐng)域,每家的想法、技術(shù)路線、包括共性都不太一樣,比如機(jī)器人的相機(jī)應(yīng)該裝什么配置、裝在什么部位、應(yīng)該裝幾個(gè)相機(jī)、傳感器數(shù)據(jù)應(yīng)該怎么采、是否需要觸覺傳感器等。目前國(guó)外有些流派,連靈巧手都不想開發(fā),就想開發(fā)機(jī)器人的爪子,而有些流派則希望手部更加靈活,即手指要更多,每個(gè)手指上有豐富的傳感器。
所以,目前整體上,人形機(jī)器人大模型的技術(shù)路線尚未統(tǒng)一,因此很難評(píng)價(jià)每家路線是否正確,以及哪條路線推進(jìn)到了什么節(jié)奏。現(xiàn)在人形機(jī)器人大模型的發(fā)展比較像ChatGPT出來的前一兩年,大家已經(jīng)發(fā)現(xiàn)了要往這個(gè)方向做,但實(shí)際上沒有哪家敢打保票,保證自己的方向是絕對(duì)正確的。
《科創(chuàng)板日?qǐng)?bào)》:近期,國(guó)內(nèi)很多人形機(jī)器人廠商宣布其產(chǎn)品“進(jìn)廠打工”,你如何看待這個(gè)現(xiàn)象?對(duì)此,宇樹人形機(jī)器人未來規(guī)劃是怎樣的?
王興興:我認(rèn)為“進(jìn)廠打工”是一個(gè)趨勢(shì),但目前還處于試點(diǎn)階段,過去幾個(gè)月,我們與蔚來的汽車工廠有合作,部署了人形機(jī)器人去做現(xiàn)場(chǎng)搬運(yùn)等服務(wù),國(guó)內(nèi)一些人形機(jī)器人廠商也和汽車工廠有類似合作。
我們目前更多還是售賣本體,但工業(yè)領(lǐng)域的應(yīng)用場(chǎng)景也在推進(jìn)中,比如部署人形機(jī)器人去工廠做一些簡(jiǎn)單的生產(chǎn)裝配和搬運(yùn)等工作,以及其他類型的支持,但并沒有對(duì)此快速推進(jìn)。原因是對(duì)行業(yè)比較有耐心,不打算近期在工廠里部署目標(biāo)“XX臺(tái)”的機(jī)器人,也沒有給自己定很緊張的目標(biāo),還是尊重市場(chǎng)的反應(yīng),等到技術(shù)和產(chǎn)品、商業(yè)推廣發(fā)展更好后,我們?cè)偃ゴ笠?guī)模的推進(jìn)。
《科創(chuàng)板日?qǐng)?bào)》: 人形機(jī)器人領(lǐng)域什么時(shí)候會(huì)出現(xiàn)一個(gè)iPhone時(shí)刻?AI大模型為機(jī)器人領(lǐng)域帶來了哪些明顯的能力的提升,目前還存在哪些挑戰(zhàn)?
王興興:“iPhone時(shí)刻”也是市場(chǎng)非常關(guān)注的熱點(diǎn),而且是非常重要的一個(gè)時(shí)間節(jié)點(diǎn)。但是目前離“iPhone時(shí)刻”還有距離,因?yàn)槠涑霈F(xiàn)并不只是有一個(gè)特別的技術(shù)突破,實(shí)際上更多是一個(gè)綜合性的突破。
只有在工業(yè)或服務(wù)業(yè)能真正出現(xiàn)終端產(chǎn)品,而且到達(dá)出貨量暴增這個(gè)節(jié)點(diǎn),才會(huì)產(chǎn)生“iPhone時(shí)刻”,所以它將會(huì)再遠(yuǎn)一點(diǎn)出現(xiàn),可能要在未來3年或4年左右,但是不會(huì)超過5年
AI的技術(shù)進(jìn)步很多情況下是階梯性的進(jìn)步,比如,在ChatGPT沒有出現(xiàn)之前,大家一直認(rèn)為大語言模型收效甚微,但出現(xiàn)ChatGPT之后,大家發(fā)現(xiàn)其很智能,在機(jī)器人的AI領(lǐng)域也非常重要。