?
投資 干貨 消費 評論 學院 滾動
風投 科技 創(chuàng)業(yè) 業(yè)內 要聞
觀點:研究人員開發(fā)人工智能工具以提高依賴手語的人對技術的可及性
發(fā)布日期: 2023-05-25 09:54:51 來源: 萬能網(wǎng)


(資料圖片)

巴塞羅那超級計算中心-國家超級計算中心(BSC-CNS)和加泰羅尼亞理工大學(UPC)的研究人員開發(fā)了一種工具,用于研究自動手語翻譯,該工具使用人工智能來打破一些常見的溝通障礙由聾人和聽障人士使用。

盡管Alexa和Siri等語音識別技術取得了進步,但手語仍未包含在這些越來越多地出現(xiàn)在許多家庭日常生活中的應用程序中。這給依賴手語作為首選交流方式的人們與技術交互和訪問專為口語設計的數(shù)字服務設置了障礙。

這種新的開源軟件的開發(fā)是朝著使所有人都能無障礙地進行通信邁出的重要一步。為此,BSC和UPC的研究人員結合了計算機視覺、自然語言處理和機器學習技術來推進自動手語翻譯的研究,這是一個復雜的問題,部分原因是世界上手語的多樣性和數(shù)量眾多。

該系統(tǒng)仍處于試驗階段,使用名為Transformers的機器學習模型,該模型是ChatGPT等其他人工智能工具的基礎,可將視頻格式的整個手語句子轉換為文本格式的口語。它目前專注于美國手語(ASL),但只要所有必要的數(shù)據(jù)都可用,它就可以適應任何其他語言,即,有一個包含平行數(shù)據(jù)的語料庫,其中每個手語句子(視頻格式)都有一個相應的口語翻譯(文本格式)。

“開發(fā)的新工具是BSC和UPC之前發(fā)布的名為How2Sign的出版物的擴展,其中需要訓練模型的數(shù)據(jù)(超過80小時的視頻,美國手語翻譯員翻譯視頻教程,如烹飪食譜或DIYtricks)已發(fā)布。有了這些數(shù)據(jù),該團隊開發(fā)了一種新的開源軟件,能夠學習視頻和文本之間的映射,”BSC和UPC的研究員LaiaTarrés說,他將新模型的發(fā)布介紹給恰逢全球無障礙意識日的慶祝活動。

邁向真正的應用

研究人員表示,這項新工作是朝著正確方向邁出的一步,但他們也強調,仍有很大的改進空間。這些是第一批結果,目前還不允許創(chuàng)建具體的應用程序來為用戶提供服務。目的是繼續(xù)努力改進該工具并獲得真正的應用,以促進為聾人和重聽人創(chuàng)造無障礙技術。

該項目已經(jīng)在馬德里的FundaciónTelefónica空間展出,作為“代碼和算法。計算世界中的感知”展覽的一部分,BSC的顯著存在匯集了與人工智能相關的不同項目。它也將很快在巴塞羅那當代文化中心(CCCB)展出,作為將于10月開幕的人工智能大型展覽的一部分。

“這種用于自動手語翻譯的開放工具是對專注于可訪問性的科學界的寶貴貢獻,它的發(fā)布代表著朝著為所有人創(chuàng)造更具包容性和可訪問性的技術邁出的重要一步,”Tarrés總結道。

關鍵詞:
24小時熱點 精彩推薦
資訊新聞
?