?
投資 干貨 消費(fèi) 評(píng)論 學(xué)院 滾動(dòng)
風(fēng)投 科技 創(chuàng)業(yè) 業(yè)內(nèi) 要聞
為機(jī)器人生成非語(yǔ)言社交行為的深度學(xué)習(xí)模型 每日動(dòng)態(tài)
發(fā)布日期: 2022-11-25 10:13:23 來(lái)源: 萬(wàn)能網(wǎng)


(資料圖片)

韓國(guó)電子和電信研究所(ETRI)的研究人員最近開發(fā)了一種基于深度學(xué)習(xí)的模型,可以幫助機(jī)器人產(chǎn)生引人入勝的非語(yǔ)言社交行為,例如擁抱或握手。他們的模型在arXiv上預(yù)發(fā)表的一篇論文中提出,可以通過觀察人類之間的互動(dòng),積極學(xué)習(xí)新的適合情境的社會(huì)行為。

“深度學(xué)習(xí)技術(shù)在計(jì)算機(jī)視覺和自然語(yǔ)言理解等領(lǐng)域產(chǎn)生了有趣的結(jié)果,”進(jìn)行這項(xiàng)研究的研究人員之一Woo-RiKo告訴TechXplore?!拔覀冎謱⑸疃葘W(xué)習(xí)應(yīng)用于社交機(jī)器人,特別是通過讓機(jī)器人自己從人與人的互動(dòng)中學(xué)習(xí)社交行為。我們的方法不需要人類行為模型的先驗(yàn)知識(shí),而人類行為模型的實(shí)施通常既昂貴又耗時(shí)”

Ko及其同事開發(fā)的基于人工神經(jīng)網(wǎng)絡(luò)(ANN)的架構(gòu)將谷歌研究人員在2014年推出的Seq2Seq(序列到序列)模型與生成對(duì)抗網(wǎng)絡(luò)(GAN)相結(jié)合。新架構(gòu)在AIR-Act2Act數(shù)據(jù)集上進(jìn)行了訓(xùn)練,該數(shù)據(jù)集包含10種不同場(chǎng)景中發(fā)生的5,000次人機(jī)交互。

“擬議的神經(jīng)網(wǎng)絡(luò)架構(gòu)由編碼器、解碼器和鑒別器組成,”Ko解釋道。“編碼器對(duì)當(dāng)前用戶行為進(jìn)行編碼,解碼器根據(jù)當(dāng)前用戶和機(jī)器人行為生成下一個(gè)機(jī)器人行為,鑒別器防止解碼器在生成長(zhǎng)期行為時(shí)輸出無(wú)效的姿勢(shì)序列?!?/p>

AIR-Act2Act數(shù)據(jù)集中包含的5,000次交互用于提取超過110,000個(gè)訓(xùn)練樣本(即短視頻),其中人類在與他人互動(dòng)時(shí)執(zhí)行特定的非語(yǔ)言社交行為。研究人員專門訓(xùn)練他們的模型,為機(jī)器人生成五種非語(yǔ)言行為,即鞠躬、凝視、握手、擁抱和擋住自己的臉。

Ko和他的同事在一系列模擬中評(píng)估了他們的非語(yǔ)言社交行為生成模型,特別是將其應(yīng)用于Pepper的模擬版本,Pepper是一種在研究環(huán)境中廣泛使用的人形機(jī)器人。他們的初步發(fā)現(xiàn)很有希望,因?yàn)樗麄兊哪P驮谂c人類的模擬交互過程中,在適當(dāng)?shù)臅r(shí)間成功地生成了五種行為。

“我們證明了可以使用深度學(xué)習(xí)方法教機(jī)器人不同類型的社交行為,”Ko說?!拔覀兊哪P瓦€可以產(chǎn)生更自然的行為,而不是在現(xiàn)有的基于規(guī)則的方法中重復(fù)預(yù)定義的行為。隨著機(jī)器人產(chǎn)生這些社交行為,用戶會(huì)覺得他們的行為得到了理解和情感上的照顧。”

由這組研究人員創(chuàng)建的新模型可以幫助社交機(jī)器人更具適應(yīng)性和社會(huì)響應(yīng)能力,進(jìn)而可以提高它們與人類用戶互動(dòng)的整體質(zhì)量和流程。未來(lái),它可以在廣泛的機(jī)器人系統(tǒng)上實(shí)施和測(cè)試,包括家庭服務(wù)機(jī)器人、引導(dǎo)機(jī)器人、送貨機(jī)器人、教育機(jī)器人和遠(yuǎn)程呈現(xiàn)機(jī)器人。

“我們現(xiàn)在打算進(jìn)行進(jìn)一步的實(shí)驗(yàn),以測(cè)試機(jī)器人在部署在現(xiàn)實(shí)世界中并面對(duì)人類時(shí)表現(xiàn)出適當(dāng)社交行為的能力;將測(cè)試所提議的行為生成器對(duì)機(jī)器人可能獲得的嘈雜輸入數(shù)據(jù)的穩(wěn)健性”柯補(bǔ)充道。“此外,通過收集和學(xué)習(xí)更多交互數(shù)據(jù),我們計(jì)劃擴(kuò)展機(jī)器人可以展示的社交行為和復(fù)雜動(dòng)作的數(shù)量。”

更多信息:Woo-RiKo等人,使用端到端

關(guān)鍵詞: 研究人員 當(dāng)前用戶
24小時(shí)熱點(diǎn) 精彩推薦
資訊新聞
?