DeWave模型通過從大量的腦電圖數(shù)據(jù)中學(xué)習(xí),將腦電圖信號翻譯成單詞和句子。圖為研究人員正在測試DeWave模型。圖片來源:悉尼科技大學(xué)
科技日報北京12月12日電 (記者劉霞)據(jù)物理學(xué)家組織網(wǎng)11日報道,澳大利亞悉尼科技大學(xué)科學(xué)家開發(fā)出了首款便攜式、非侵入性的人工智能系統(tǒng),可解碼無聲的想法并將其轉(zhuǎn)化為有形的文本。這項技術(shù)可幫助那些因疾病或受傷(包括中風(fēng)或癱瘓)而無法說話的人進行溝通,也有望實現(xiàn)人與仿生手臂或機器人等設(shè)備之間的無縫通信。最新研究代表了將原始腦電圖(EEG)直接翻譯成語言的開創(chuàng)性努力,標志著該領(lǐng)域的一次重大突破。
在最新研究中,參與者佩戴一頂帽子,通過EEG記錄頭皮的腦電活動,同時默讀文本段落。EEG波被分割成不同單元,從人腦中捕捉特定的特征和模式,這一任務(wù)由研究人員開發(fā)的DeWave模型完成。DeWave模型通過從大量的腦電圖數(shù)據(jù)中學(xué)習(xí),將腦電圖信號翻譯成單詞和句子。
研究人員指出,這是科學(xué)家首次將離散編碼技術(shù)納入大腦思想轉(zhuǎn)化為文本的翻譯過程。為此,他們引入了一種創(chuàng)新性的神經(jīng)解碼方法。最新技術(shù)與大型語言模型的集成,也為神經(jīng)科學(xué)和人工智能開辟了新的前沿。
以前將大腦信號轉(zhuǎn)換為語言的技術(shù)要么需要在大腦中植入電極,比如埃隆·馬斯克的Neuralink,要么需要借助磁共振成像(MRI)設(shè)備掃描大腦,而MRI機器體積大、價格貴,難以在日常生活中使用。此外,這些方法也很難在沒有眼動追蹤輔助的情況下將大腦信號轉(zhuǎn)換為單詞級片段,因此限制了這些系統(tǒng)的實際應(yīng)用。而最新技術(shù)既可使用眼動追蹤,也可不使用眼動追蹤。
最新研究共有29名參與者,這意味著它或許能比以前只在一兩個人身上測試過的解碼技術(shù)更強大、更具適應(yīng)性,因為不同人之間的腦電波不同。
借助佩戴的帽子而非從植入大腦的電極接收EEG信號,意味著信號的噪音更多。但研究結(jié)果顯示,新系統(tǒng)在腦電圖翻譯方面的表現(xiàn)超過了之前的基準。這項研究已被選為12月12日在美國新奧爾良舉行的NeurIPS會議的重點論文,該會議旨在展示領(lǐng)先的人工智能和機器學(xué)習(xí)研究成果。