?
投資 干貨 消費(fèi) 評論 學(xué)院 滾動
風(fēng)投 科技 創(chuàng)業(yè) 業(yè)內(nèi) 要聞
科大訊飛副總裁談人工智能五大趨勢 解決“虛擬人交互”是迫切問題
發(fā)布日期: 2021-11-20 20:19:22 來源: 財(cái)訊網(wǎng)

近日 “元宇宙”概念引人關(guān)注,而一切火熱的概念背后,都需要有技術(shù)的支撐。其中,“人工智能技術(shù)”能為元宇宙的大量場景提供技術(shù)支撐,未來“人工智能技術(shù)”將有怎樣的發(fā)展趨勢,封面新聞記者對話了科大訊飛副總裁、西南片區(qū)總裁婁超先生。

科大訊飛副總裁婁超

封面新聞:

在您看來,人工智能未來發(fā)展的重點(diǎn)方向是什么?哪些領(lǐng)域可能會迎來爆發(fā)?

婁超

:未來十年人工智能發(fā)展將出現(xiàn)五大趨勢:

一是實(shí)現(xiàn)機(jī)器的無監(jiān)督和半監(jiān)督學(xué)習(xí)。

我們大量數(shù)據(jù)到后臺不要人做標(biāo)記,機(jī)器自己去學(xué),既保護(hù)用戶隱私,又讓機(jī)器自我迭代,也是就是,既要用更少的數(shù)據(jù)實(shí)現(xiàn)更好的效果,也要讓機(jī)器自主動態(tài)自學(xué),可以適應(yīng)每個人的要求,讓他可以聽每個人的個性化聲音。

二是深度學(xué)習(xí)的“黑盒”變“白盒”。

深度學(xué)習(xí)使用數(shù)百萬個數(shù)據(jù)點(diǎn)作為輸入,并將相關(guān)數(shù)據(jù)作為輸出,通常無法使用純語言解釋其內(nèi)部邏輯,而這種不可解釋性,限制了人工智能在現(xiàn)實(shí)世界中的應(yīng)用。需要讓機(jī)器學(xué)習(xí)的結(jié)果可以越來越可以解釋,以更好地建立與人的聯(lián)系。

三是人工智能與多學(xué)科交叉研究加速,可以在更多的領(lǐng)域引發(fā)顛覆式創(chuàng)新。

比如說材料科學(xué),原來材料科學(xué)是靠拆,即便是我們“十三五”一些重大項(xiàng)目的科學(xué)家,也是用經(jīng)驗(yàn)、用材料做各種實(shí)驗(yàn),就像愛迪生當(dāng)年做電視、電燈的鎢絲一樣的,今天人工智能后臺算法可以做大量的模擬訓(xùn)練以后使它效率成萬倍的提升。

四是“人機(jī)耦合”的持續(xù)探索。

當(dāng)前的人工智能應(yīng)用程序主要在電子設(shè)備上運(yùn)行,但人們最終會看到電子和生物系統(tǒng)之間更加緊密的集成,讓機(jī)器跟人共同協(xié)作。就像剛才講的給獨(dú)居老人的活動,機(jī)器聽不懂,人來兜底,人服務(wù)一次,機(jī)器馬上學(xué),下一次機(jī)器就會了。

五是腦科學(xué)研究。

重點(diǎn)研究類腦的多模態(tài)感知與信息處理智能技術(shù),類腦芯片與系統(tǒng),類腦計(jì)算系統(tǒng)以及腦機(jī)接口等技術(shù),為提高多模態(tài)智能感知與信息智能處理的性能與效率開展基礎(chǔ)性、創(chuàng)新性的研究,以促進(jìn)通用人工智能的發(fā)展。

元宇宙六大支撐技術(shù)

封面新聞

:有專家認(rèn)為,元宇宙將成為各國數(shù)字經(jīng)濟(jì)的競爭高地,您怎么看待數(shù)字經(jīng)濟(jì)發(fā)展和人工智能等技術(shù)的關(guān)系?

婁超

:對于數(shù)字經(jīng)濟(jì)的發(fā)展,我感觸最深的是,從數(shù)字產(chǎn)業(yè)化到產(chǎn)業(yè)數(shù)字化,今天的數(shù)字經(jīng)濟(jì)已經(jīng)進(jìn)入到深水區(qū):

首先

,產(chǎn)業(yè)數(shù)字化是我們國家從高速增長階段邁向高質(zhì)量發(fā)展階段的必經(jīng)之路,產(chǎn)業(yè)數(shù)字化的成敗決定傳統(tǒng)企業(yè)的生死,而決定產(chǎn)業(yè)數(shù)字化成敗的,就是能否堅(jiān)持核心源頭技術(shù)的創(chuàng)新。

同時

,我們認(rèn)為,驅(qū)動產(chǎn)業(yè)數(shù)字化的核心動力就是人工智能,從去年人工智能企業(yè)大幅增長的業(yè)績來看,人工智能正在幫助人們解決生活和生產(chǎn)的剛需問題。

現(xiàn)在

,我們的“因材施教”智慧教育解決方案、我們的智醫(yī)助理已經(jīng)開始走進(jìn)千家萬戶了,人工智能正在像水和電一樣無處不在,和教育、醫(yī)療、城市、司法、工業(yè)等各行各業(yè)深度融合,正在深刻的改變歷史進(jìn)程。

最后

,我想說的是,產(chǎn)業(yè)數(shù)字化是數(shù)字經(jīng)濟(jì)和實(shí)體經(jīng)濟(jì)的“一體兩面”,高科技和傳統(tǒng)行業(yè)相融合,唯有堅(jiān)持“共建、共享、共生”,才能“共榮”和“共贏”。訊飛從2010年就開始開放A.I.能力給廣大的開發(fā)者,到現(xiàn)在訊飛開放平臺已經(jīng)開放了442項(xiàng)技術(shù)能力了,有271萬的開發(fā)者開發(fā)出了130萬個應(yīng)用,幫助超過400萬的生態(tài)伙伴實(shí)現(xiàn)產(chǎn)品智能化,所以我們一直堅(jiān)信:唯有一起建設(shè)產(chǎn)業(yè)數(shù)字化生態(tài),我們國家的數(shù)字經(jīng)濟(jì)發(fā)展才可以生生不息。

科大訊飛虛擬人交互1.0

封面新聞

:在元宇宙中,人們都有一個“虛擬人”的身份,能不能介紹下目前“虛擬人”技術(shù)的發(fā)展情況?

婁超

:其實(shí)除了語音應(yīng)用,我們還有多維信息、多模信息的相互融合和識別技術(shù)。例如,我們把語音識別、人臉識別和動畫設(shè)計(jì)結(jié)合在一起,用戶可以挑選自己喜歡的眉眼、鼻子、嘴型和聲音特點(diǎn),在1分鐘之內(nèi)就能定制出屬于自己的虛擬主播。

將來我們還能通過系統(tǒng)定制的虛擬主播來滿足我們對于家庭生活的感情需要,比如在家里聽女朋友的聲音讀書讀報(bào),或者聽子女后代的聲音給自己每天講故事、聊天等等。

科大訊飛個性化真人捏臉系統(tǒng)

不久前的10月20日廣電總局發(fā)布了《廣播電視和網(wǎng)絡(luò)視聽“十四五”科技發(fā)展規(guī)劃》,其中提到需要大力發(fā)展虛擬主持人。在未來,無論是數(shù)字經(jīng)濟(jì)還是元宇宙,虛擬人的交互已經(jīng)成為迫切要解決的問題。不再是原來單獨(dú)的語音交互,它需要以情感貫穿的音色、語氣、表情、嘴型、眼神、動作、衣品、環(huán)境等交互要素,核心是多模感知。從語音到視頻、人臉、動作甚至心跳、脈搏、血壓等同步感知、多維表達(dá),不再是單一的視頻、人臉或者語音信號,而是需要以情感貫穿的一體化、立體化、擬人化真實(shí)表達(dá),讓每個人都可以自主定義。

剛剛閉幕的第四屆世界聲博會暨2021科大訊飛全球1024開發(fā)者節(jié)上,我們發(fā)布了 “虛擬人交互平臺1.0”,全行業(yè)首次定義“什么是真正未來的虛擬人的交互平臺”。在這中間,我們今年有一個尋聲計(jì)劃,在平臺發(fā)布時已經(jīng)有將近5000人提供了他們認(rèn)為最好的聲音參與平臺的共享和共創(chuàng)。目前,虛擬人家族形象也已增至54位,我們相信它還會進(jìn)一步豐富,后臺的理解和認(rèn)知也會不斷的進(jìn)步。

免責(zé)聲明:市場有風(fēng)險(xiǎn),選擇需謹(jǐn)慎!此文僅供參考,不作買賣依據(jù)。

關(guān)鍵詞: 虛擬人交互 交互 擬人
24小時熱點(diǎn) 精彩推薦
資訊新聞
?