英特爾大數(shù)據(jù)技術(shù)全球CTO戴金權(quán):人工智能和大數(shù)據(jù)是數(shù)字經(jīng)濟(jì)的基石
原創(chuàng)
2022-03-30 16:17 星期三
科創(chuàng)板日?qǐng)?bào)記者 黃心怡
當(dāng)下,各類(lèi)科技企業(yè)、互聯(lián)網(wǎng)巨頭、初創(chuàng)公司等都紛紛投入人工智能產(chǎn)業(yè)之中,但在人工智能的熱潮之下,同樣需要冷思考。

《科創(chuàng)板日?qǐng)?bào)》(上海,記者 黃心怡)訊,人工智能已經(jīng)走過(guò)了60多年的歷程,當(dāng)前正處于第三次發(fā)展浪潮之中。各類(lèi)科技企業(yè)、互聯(lián)網(wǎng)巨頭、初創(chuàng)公司等都紛紛投入人工智能產(chǎn)業(yè)之中,也吸引了大量資本的涌入。但在人工智能的熱潮之下,同樣需要冷思考。

近日,英特爾院士、大數(shù)據(jù)技術(shù)全球CTO戴金權(quán)接受了《科創(chuàng)板日?qǐng)?bào)》記者的專(zhuān)訪,探討人工智能和大數(shù)據(jù)的應(yīng)用瓶頸、拓展方向以及數(shù)字經(jīng)濟(jì)所帶來(lái)的機(jī)遇。

他表示,人工智能當(dāng)前還處于一個(gè)比較早期的階段,從開(kāi)發(fā)者和實(shí)驗(yàn)室走到現(xiàn)實(shí)的生產(chǎn)環(huán)境,在這個(gè)過(guò)程中存在一定的脫節(jié)。如何針對(duì)不同的場(chǎng)景做適配,以及如何實(shí)現(xiàn)整個(gè)端到端的流水線打通,都有比較大的挑戰(zhàn)。

但戴金權(quán)依然對(duì)人工智能未來(lái)表示看好。他認(rèn)為,除了安防外, AI在制造業(yè)、數(shù)據(jù)中心智能運(yùn)維、互聯(lián)網(wǎng)業(yè)務(wù)等領(lǐng)域都有很大的應(yīng)用空間。

在談到數(shù)字經(jīng)濟(jì)的機(jī)遇時(shí),戴金權(quán)認(rèn)為,人工智能和大數(shù)據(jù)是數(shù)字經(jīng)濟(jì)的基石。在數(shù)字化之后,必然會(huì)產(chǎn)生大量的數(shù)據(jù)。首當(dāng)其沖的是需要對(duì)這些數(shù)據(jù)進(jìn)行管理。其次,在擁有大量的數(shù)據(jù)資產(chǎn)后,便可以利用大數(shù)據(jù)、AI技術(shù)對(duì)其進(jìn)行分析,并以此來(lái)進(jìn)行一些預(yù)測(cè),甚至幫助人們做出決策。

image

▍以下是《科創(chuàng)板日?qǐng)?bào)》整理的專(zhuān)訪實(shí)錄:

人工智能尚處于早期階段

《科創(chuàng)板日?qǐng)?bào)》:當(dāng)前,AI賦能各行各業(yè)的時(shí)候遇到了很多難點(diǎn),例如,AI在中長(zhǎng)尾場(chǎng)景的應(yīng)用非常碎片化,這意味著需求大量的定制化,較難實(shí)現(xiàn)大規(guī)模應(yīng)用,不知道您如何看待這個(gè)問(wèn)題?

戴金權(quán):我同意你的說(shuō)法,今天AI還處于比較早期的階段,雖然我們看到在實(shí)驗(yàn)室里、研究環(huán)境里有很多的創(chuàng)新成果出來(lái)。但這些技術(shù)要落到現(xiàn)實(shí)的應(yīng)用里,仍舊存在許多挑戰(zhàn)。

比如,從數(shù)據(jù)到處理再到AI模型,怎么實(shí)現(xiàn)整個(gè)端到端的流水線打通;AI模型能否更好地針對(duì)各種場(chǎng)景進(jìn)行優(yōu)化,以及AI依賴(lài)于定制化的軟硬件平臺(tái)難以擴(kuò)展,如何做到普適化,讓更多人方便地應(yīng)用AI。這些都是目前我們所遇到的難點(diǎn)。

雖說(shuō)挑戰(zhàn)很多,但是我們依然很有信心。AI是一種技術(shù),也是一個(gè)產(chǎn)業(yè)發(fā)展的方向,在未來(lái)必定大有可為。

《科創(chuàng)板日?qǐng)?bào)》:國(guó)內(nèi)企業(yè)正在研發(fā)預(yù)訓(xùn)練大模型,試圖解決上述問(wèn)題,您多年在英特爾從事全球性技術(shù)研發(fā)工作,從全球角度來(lái)看,大家會(huì)有哪些應(yīng)對(duì)舉措?

戴金權(quán):這取決于不同的技術(shù)路線。比如您剛剛提到的預(yù)訓(xùn)練大模型,這是最近兩三年大家非常關(guān)注的一個(gè)方向——首先利用像Transformer這樣的新模型架構(gòu),在大量的模型上進(jìn)行預(yù)訓(xùn)練,之后再在下游的任務(wù)上進(jìn)行適配和調(diào)優(yōu)。目前無(wú)論是國(guó)內(nèi)還是國(guó)外,大家都在做很多這方面的探索,其范圍涵蓋了自然語(yǔ)言處理領(lǐng)域、計(jì)算機(jī)視覺(jué)領(lǐng)域等。

去年,我們和漢堡王有一個(gè)合作,利用Transformer架構(gòu)做了推薦系統(tǒng)上的一些嘗試,也達(dá)到了很好的效果。當(dāng)然,這其中存在技術(shù)難點(diǎn)。當(dāng)模型越來(lái)越大,所需要的數(shù)據(jù)量和對(duì)計(jì)算的需求也越來(lái)越大。除此之外,在進(jìn)行部署的時(shí)候,對(duì)資源和計(jì)算速度的高要求都造成很大挑戰(zhàn)。

為此,英特爾對(duì)模型進(jìn)行了各種各樣的優(yōu)化。例如把浮點(diǎn)數(shù)運(yùn)算轉(zhuǎn)換為整型運(yùn)算,并且利用諸如VNNI、DL Boost等加速指令來(lái)幫助模型進(jìn)行量化,以提高它的速度;對(duì)模型進(jìn)行稀疏化等,使其在各種不同的硬件平臺(tái)上,從筆記本到嵌入系統(tǒng),到邊緣服務(wù)器,再到云端的大算力,都能夠很好地進(jìn)行部署,真正拓寬其應(yīng)用。我們希望,通過(guò)硬件的加速,訓(xùn)練模型架構(gòu)上的創(chuàng)新,以及軟件的優(yōu)化,綜合起來(lái)達(dá)到更好的效果。

從實(shí)驗(yàn)室走向產(chǎn)業(yè)應(yīng)用存在脫節(jié)

《科創(chuàng)板日?qǐng)?bào)》:在碎片化的AI應(yīng)用場(chǎng)景,數(shù)據(jù)量比較少,是導(dǎo)致模型訓(xùn)練存在困難的原因,您對(duì)此怎么看?

戴金權(quán):這其實(shí)存在兩個(gè)問(wèn)題,一是數(shù)據(jù)量不多,我們可以通過(guò)預(yù)訓(xùn)練,或者通過(guò)遷移學(xué)習(xí)、多任務(wù)學(xué)習(xí)、元學(xué)習(xí)等各種方法來(lái)解決。

二是,有數(shù)據(jù)但沒(méi)有標(biāo)簽,這是經(jīng)常會(huì)遇到的情況。我們和合作伙伴工作的過(guò)程中會(huì)發(fā)現(xiàn)有數(shù)據(jù),但給數(shù)據(jù)打標(biāo)簽本身的代價(jià)非常高。迄今為止,我們本質(zhì)上還處于“監(jiān)督學(xué)習(xí)”,仍舊需要在標(biāo)簽上做更多努力。

目前有很多探索方向,比如大家都在積極探索的“無(wú)監(jiān)督學(xué)習(xí)”、“自監(jiān)督學(xué)習(xí)”等技術(shù)。至于是否到了非常成熟的階段呢?可能還沒(méi)有,但是我們?nèi)耘f認(rèn)為這個(gè)方向是大有可為的。

《科創(chuàng)板日?qǐng)?bào)》:除了碎片化需求, AI在落地和實(shí)施方面還存在哪些痛點(diǎn)?

戴金權(quán):從開(kāi)發(fā)人員的角度來(lái)看,在開(kāi)發(fā)機(jī)上完成開(kāi)發(fā)后,要在大規(guī)模的數(shù)據(jù)集群上試驗(yàn),進(jìn)行生產(chǎn)化部署,整個(gè)過(guò)程在今天來(lái)說(shuō)還是有非常大的瓶頸。

特別是很多的開(kāi)發(fā)人員,就是一個(gè)數(shù)據(jù)科學(xué)家,并非專(zhuān)門(mén)做高性能計(jì)算、分布式計(jì)算的開(kāi)發(fā)人員。為了把AI成功應(yīng)用到生產(chǎn)環(huán)境當(dāng)中,這些數(shù)據(jù)科學(xué)家就需要在分布式大規(guī)模的場(chǎng)景上進(jìn)行實(shí)際的部署,在整個(gè)過(guò)程中是有一些脫節(jié)的

在這方面我們做了一些初步的工作,包括推出開(kāi)源大數(shù)據(jù)項(xiàng)目BigDL 2.0。通過(guò)構(gòu)建“數(shù)據(jù)+AI”的可擴(kuò)展平臺(tái),把AI應(yīng)用或者流水線,能從筆記本無(wú)縫地?cái)U(kuò)展到分布式大規(guī)模的云集群當(dāng)中去,做到在筆記本開(kāi)發(fā)和在云上開(kāi)發(fā)是一樣的體驗(yàn)。

這樣,數(shù)據(jù)科學(xué)家可以更加集中在自己想做的模型、算法的創(chuàng)新上,而不用管底層大規(guī)模分布式如何進(jìn)行,也不用管怎么從筆記本遷移到云里。

數(shù)據(jù)是數(shù)字經(jīng)濟(jì)發(fā)展的關(guān)鍵要素

《科創(chuàng)板日?qǐng)?bào)》:中國(guó)正在大力發(fā)展數(shù)字經(jīng)濟(jì),今年兩會(huì)的政府工作報(bào)告上也提出要培育人工智能等數(shù)字產(chǎn)業(yè)。近年來(lái),AI主要在安防、公共安全等領(lǐng)域有一定應(yīng)用,大量的公司也都集中在這個(gè)領(lǐng)域競(jìng)爭(zhēng)。您是否看到,AI在其他行業(yè)有新的機(jī)會(huì)?

戴金權(quán):安防當(dāng)然是非常重要的一塊。英特爾也有物聯(lián)網(wǎng)事業(yè)部,在智能攝像頭、智能攝像機(jī)方面做了非常多的工作。

同時(shí),中國(guó)是一個(gè)制造業(yè)強(qiáng)國(guó),如何將這些AI計(jì)算機(jī)視覺(jué)技術(shù)應(yīng)用到制造業(yè)之中,比如在缺陷檢測(cè)等方面,存在較大的發(fā)展空間。

此外,在電信運(yùn)營(yíng)商和數(shù)據(jù)中心領(lǐng)域,無(wú)論是基站還是數(shù)據(jù)中心的時(shí)序數(shù)據(jù),都可以利用時(shí)序分析對(duì)其進(jìn)行智能運(yùn)維;在通訊網(wǎng)絡(luò)或者數(shù)據(jù)中心里,通過(guò)AI預(yù)測(cè)負(fù)載變化來(lái)省電,進(jìn)行更合理的資源調(diào)度和任務(wù)分配等;在互聯(lián)網(wǎng)業(yè)務(wù)或者是在線服務(wù)當(dāng)中,則可以利用AI進(jìn)行各種各樣的推薦以及內(nèi)容挖掘。這些都是非常重要的應(yīng)用舞臺(tái)。

在我看來(lái), AI開(kāi)始把大量的數(shù)據(jù)處理分析和深度學(xué)習(xí)、機(jī)器學(xué)習(xí)技術(shù)結(jié)合在一起,對(duì)場(chǎng)景進(jìn)行適配或應(yīng)用,的確帶來(lái)很多不同的新應(yīng)用機(jī)會(huì)。不管是針對(duì)更精準(zhǔn)的匹配,還是更好的質(zhì)量檢測(cè),或是想要更加綠色、環(huán)保、節(jié)能的發(fā)展,AI都有著很多的可能性。

大數(shù)據(jù)分析也是應(yīng)用非常廣泛的技術(shù),無(wú)論在國(guó)內(nèi)還是國(guó)外,各行各業(yè)都有非常廣泛的應(yīng)用。從某種意義來(lái)說(shuō),大數(shù)據(jù)分析也是今天數(shù)字經(jīng)濟(jì)的一個(gè)基石。

《科創(chuàng)板日?qǐng)?bào)》:您剛剛講到,大數(shù)據(jù)和AI技術(shù)都是數(shù)字經(jīng)濟(jì)的基石?,F(xiàn)在大家都很關(guān)注數(shù)字經(jīng)濟(jì)領(lǐng)域的機(jī)會(huì)。不知道您如何看待數(shù)字經(jīng)濟(jì)所涵蓋的上下游產(chǎn)業(yè)鏈,以及哪些技術(shù)應(yīng)用更為核心關(guān)鍵?

戴金權(quán):首先,無(wú)論是資產(chǎn)、運(yùn)作、還是生產(chǎn)活動(dòng),都在越來(lái)越多地進(jìn)行數(shù)字化。而數(shù)字化之后必然會(huì)產(chǎn)生大量的數(shù)據(jù)。比如一個(gè)大城市,會(huì)擁有幾十萬(wàn)、上百萬(wàn)的基站,這些基站中的設(shè)備每隔幾秒鐘就會(huì)產(chǎn)生大量的數(shù)據(jù)。首當(dāng)其沖的便是如何對(duì)這些數(shù)據(jù)進(jìn)行管理,包括存儲(chǔ)、處理等。

第二,在擁有數(shù)據(jù)資產(chǎn)之后,利用大數(shù)據(jù)技術(shù),結(jié)合機(jī)器學(xué)習(xí)、深度學(xué)習(xí)的技術(shù)進(jìn)行挖掘,得到所謂的“洞見(jiàn)”,即我們說(shuō)的“有什么趨勢(shì)、模型是什么樣的”。在此基礎(chǔ)上我們便可以做預(yù)測(cè),甚至幫助人們做一些決策。

像在電信行業(yè),隨著5G網(wǎng)絡(luò)的發(fā)展,對(duì)網(wǎng)絡(luò)運(yùn)維的要求越來(lái)越高,如何更好地分配帶寬和頻譜?對(duì)于5G網(wǎng)絡(luò)的功耗問(wèn)題,如何通過(guò)智能調(diào)整來(lái)進(jìn)行節(jié)能省電?這些都是在網(wǎng)絡(luò)數(shù)字化的基礎(chǔ)上可以做的事。

《科創(chuàng)板日?qǐng)?bào)》:當(dāng)下,人工智能算力需求的增長(zhǎng)速度大大超過(guò)了芯片算力的進(jìn)步,算力不足成為普遍現(xiàn)象,驅(qū)動(dòng)計(jì)算架構(gòu)從單一通用架構(gòu)(CPU+GPU)到混合異構(gòu)架構(gòu)(CPU+GPU+FPGA+XPU),您對(duì)此的看法是?

戴金權(quán):英特爾的策略是XPU。這是一個(gè)超異構(gòu)的架構(gòu),包括像CPU的標(biāo)量計(jì)算、GPU的矢量計(jì)算、FPGA這樣的空間計(jì)算以及各種各樣的加速器。英特爾已經(jīng)做了相應(yīng)的技術(shù)規(guī)劃,在XPU超異構(gòu)的架構(gòu)上提供不同的計(jì)算架構(gòu)來(lái)支撐不同的計(jì)算應(yīng)用。

但是,當(dāng)存在很多不同的異構(gòu)架構(gòu)時(shí),對(duì)軟件開(kāi)發(fā)人員來(lái)說(shuō)是一個(gè)非常大的挑戰(zhàn)。所以,我們提出了oneAPI策略,希望從軟件層幫助用戶(hù)在跨不同架構(gòu)時(shí),都能進(jìn)行同樣的編程。通過(guò)oneAPI這樣的工具加上底層的計(jì)算庫(kù)等,提供一個(gè)非常無(wú)縫的編程體驗(yàn)。然后在上層,能夠在XPU硬件架構(gòu)以及oneAPI的軟件支持下,構(gòu)建一個(gè)可擴(kuò)展的“數(shù)據(jù)+AI”的平臺(tái),給用戶(hù)帶來(lái)計(jì)算效率、開(kāi)發(fā)體驗(yàn)、開(kāi)發(fā)效率的多維度提升。

收藏
95.16W
我要評(píng)論
歡迎您發(fā)表有價(jià)值的評(píng)論,發(fā)布廣告和不和諧的評(píng)論都將會(huì)被刪除,您的賬號(hào)將禁止評(píng)論。
發(fā)表評(píng)論
要聞
股市
關(guān)聯(lián)話(huà)題
0 人關(guān)注
0 人關(guān)注