AIGC邁入3D時(shí)代 “AI教母”李飛飛創(chuàng)業(yè)項(xiàng)目首個(gè)成果 “虛擬世界生成器”來(lái)了
原創(chuàng)
2024-12-03 16:58 星期二
科創(chuàng)板日?qǐng)?bào) 宋子喬
①空間智能技術(shù),旨在讓機(jī)器理解并應(yīng)對(duì)三維的真實(shí)物理環(huán)境;
②World Labs的投資者包括a16z、Adobe、AMD、Databricks、英偉達(dá)等;
③空間智能技術(shù)的應(yīng)用領(lǐng)域包括電影、游戲等內(nèi)容創(chuàng)作,以及AR/VR應(yīng)用場(chǎng)景。

《科創(chuàng)板日?qǐng)?bào)》12月3日訊(編輯 宋子喬) 當(dāng)?shù)貢r(shí)間12月3日,“AI教母”李飛飛聯(lián)合創(chuàng)辦的空間智能初創(chuàng)企業(yè)World Labs(世界實(shí)驗(yàn)室)展示首個(gè)成果——一張圖、一句話就能生成3D世界的AI系統(tǒng),堪稱“虛擬世界生成器”。World labs將其稱為邁向空間智能的第一步。

image

image

其亮點(diǎn)在于:直接生成3D場(chǎng)景,且場(chǎng)景具有交互性、可編輯、可擴(kuò)圖。

交互性:用戶可以通過(guò)W/A/S/D鍵來(lái)控制上下左右視角,或者用鼠標(biāo)拖動(dòng)畫面探索所生成的世界,不過(guò)目前的可移動(dòng)范圍仍然受限于較小的區(qū)域。

image

image

image

可編輯:該工具配備了可控的攝像機(jī)效果和可調(diào)節(jié)的模擬景深,用戶可改變其中物體顏色、動(dòng)態(tài)調(diào)整背景光影、手動(dòng)變焦、調(diào)節(jié)景深、在場(chǎng)景中插入其他對(duì)象、添加動(dòng)畫效果。

image

image

image

image

image

可擴(kuò)圖:這指該AI工具的可預(yù)測(cè)3D場(chǎng)景能力,可預(yù)測(cè)3D場(chǎng)景是利用AI技術(shù)對(duì)3D空間中的物體、環(huán)境結(jié)構(gòu)及其動(dòng)態(tài)變化進(jìn)行預(yù)測(cè)和理解的能力,即讓AI工具僅憑部分圖片就能“擴(kuò)圖”,想象出整個(gè)3D場(chǎng)景。

image

image

將梵高、霍珀、修拉和康定斯基等作家的知名畫作中的場(chǎng)景擴(kuò)展

其中,可預(yù)測(cè)3D場(chǎng)景,是將World Labs與其他致力于3D內(nèi)容生成的AI公司區(qū)別開(kāi)的主要能力,World Labs表示,大多數(shù)生成模型都會(huì)預(yù)測(cè)像素,而預(yù)測(cè) 3D 場(chǎng)景有許多好處:

持久現(xiàn)實(shí):3D場(chǎng)景一旦生成,它就會(huì)一直存在。即使你把視線移開(kāi)然后又回來(lái),場(chǎng)景也不會(huì)改變。

實(shí)時(shí)控制:3D場(chǎng)景生成后,用戶可以在其中實(shí)時(shí)移動(dòng)。你可以仔細(xì)觀察花朵的細(xì)節(jié),也可以窺視藏在角落里的物體。

正確的幾何形狀:生成的世界遵循 3D 幾何的基本物理規(guī)則。它們兼具真實(shí)感和深度感,與某些AI生成視頻的夢(mèng)幻感形成了鮮明對(duì)比。

空間智能 AI領(lǐng)域的下一個(gè)“北極星”

李飛飛對(duì)空間智能的定義是:空間智能是機(jī)器在3D空間和時(shí)間中感知、推理和行動(dòng)的能力。在她看來(lái),空間智能是AI領(lǐng)域的下一個(gè)前沿技術(shù)方向。

今年9月份,在成功融資2.3億美元后,由著名計(jì)算機(jī)科學(xué)家、斯坦福大學(xué)人工智能實(shí)驗(yàn)室聯(lián)合主任、斯坦福大學(xué)教授李飛飛聯(lián)合創(chuàng)辦的World Labs正式啟動(dòng)。據(jù)介紹,World Labs的目標(biāo)是開(kāi)發(fā)一種能夠理解實(shí)體世界的模型。今年7月,有消息稱在完成兩輪融資后,World Labs的估值已超過(guò)10億美元,該公司的投資機(jī)構(gòu)可以說(shuō)是耳熟能詳,包括安德森?霍羅威茨(Andreessen Horowitz,又名a16z)、Adobe、AMD、Databricks、英偉達(dá)、AI基金Radical Ventures等。

同月,在接受a16z的訪談時(shí),李飛飛表示,空間智能是她的下一個(gè)北極星,該技術(shù)將改變AI的發(fā)展進(jìn)程。她認(rèn)為,空間智能與語(yǔ)言智能一樣重要,甚至在某些方面可能更古老、更基礎(chǔ),AI的發(fā)展不會(huì)局限于處理平面圖像或文本,而是會(huì)邁向?qū)θS世界的理解,這是智能發(fā)展的自然延伸。

電影、游戲等內(nèi)容創(chuàng)作將是空間智能技術(shù)的重要應(yīng)用領(lǐng)域,該技術(shù)有望降低3D內(nèi)容制作的成本、激發(fā)更多的沉浸式體驗(yàn)。World Labs的目標(biāo)客戶便包括視頻游戲開(kāi)發(fā)商和電影制片廠。除了互動(dòng)場(chǎng)景之外,World Labs還計(jì)劃開(kāi)發(fā)一些對(duì)藝術(shù)家、設(shè)計(jì)師、開(kāi)發(fā)人員、電影制作人和工程師等專業(yè)人士有用的工具。

李飛飛還補(bǔ)充了增強(qiáng)現(xiàn)實(shí)(AR)和虛擬現(xiàn)實(shí)(VR)的應(yīng)用場(chǎng)景。她曾提到:“這種技術(shù)將成為AR/VR的‘操作系統(tǒng)’,幫助人類增強(qiáng)能力?!彼e例說(shuō),未來(lái),佩戴AR眼鏡的人可能不需要任何專業(yè)技能,就能修理汽車或完成復(fù)雜的操作。通過(guò)空間智能,虛擬世界與現(xiàn)實(shí)世界的融合將大大增強(qiáng)人類與機(jī)器的互動(dòng)能力。

李飛飛的博士生、World Labs聯(lián)合創(chuàng)始人賈斯汀?約翰遜則指出,隨著這項(xiàng)技術(shù)的成熟,未來(lái)我們可能不再需要使用手機(jī)、平板等不同尺寸的屏幕。他表示:“如果你能夠?qū)⑻摂M內(nèi)容與物理世界無(wú)縫融合,那么對(duì)所有這些屏幕的需求就會(huì)減少。”

收藏
64.47W
我要評(píng)論
歡迎您發(fā)表有價(jià)值的評(píng)論,發(fā)布廣告和不和諧的評(píng)論都將會(huì)被刪除,您的賬號(hào)將禁止評(píng)論。
發(fā)表評(píng)論
要聞
股市
關(guān)聯(lián)話題
0 人關(guān)注
0 人關(guān)注
0 人關(guān)注