SONY公布最新黑科技「AI 聲音分離技術」

尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️

加入LINE好友

IT之家 7 月 26 日消息 SONY公司今日發布文章,介紹了SONY的一項「黑科技」創新成果 ——AI 聲音分離技術。這項技術可以從混合的音源中提取出單個的聲音。由於聲音信號僅有兩個維度,傳統技術對聲音進行分離十分困難,但是在 2013 年,SONY引入 AI 人工智慧技術,在這個領域更進一步。

目前,這項技術在復原經典電影、清除智能手機的噪音、實現音樂流媒體服務的實時卡拉 OK 功能等方面已經取得了成果,未來還將應用到更多領域。

SONY公布最新黑科技「AI 聲音分離技術」 科技 第1張

SONY研發人員光藤祐基在接受採訪時表示:AI 聲音分離技術可以從音頻數據中去除不必要的噪音,隻提取人聲或其他特定樂器的聲音。當人類在聆聽一場多種聲音混合在一起的表演時,可以分辨出各個樂器,或者在進行對話時,即使被一大群人包圍,我們也能自然而然地專註於一個聲音。這些都是人類獨有的能力,而直到近來,計算機要做到這一點都還是極其困難的。有人將這項任務描述為混合兩種果汁,之後提取其中一種。但是在過去的幾年裡,由於 AI 新方法的引入,這項技術有了極大的提升。

光藤祐基表示,聲音分離是由 AI 進行的,而人們可以教計算機來完成這個任務。一把吉他有一個特定的聲音或頻率,這一點可被神經網路學習到。無論混合了多少種聲音,我們的 AI 系統都能夠識別這些特征。

另一名SONY的研發人員尤裡奇表示,神經網路在所謂的訓練中能夠學習識別音頻特征。在這個訓練中,神經網路會看到很多音樂–比我們一生中聽到的音樂還要多–以及我們應該提取的目標聲音。這些資訊足以讓神經網路學習聲音分離。

IT之家了解到,很多經典電影的對白和音效在同一個音軌上,要想進行優化,需要從中提取人聲。SONY的 AI 系統能夠成功地從母版中提取單個音效,《阿拉伯的勞倫斯》和《甘地》兩步電影的 4K 重制超清版本中,SONY影視娛樂公司的調音師用這項技術提取出聲音,用杜比全景聲進行重制,創造了一個沉浸式的聲場。

SONY公布最新黑科技「AI 聲音分離技術」 科技 第2張

據IT之家了解,SONY AI 聲音分離技術還能夠應用於電影之外的場景,比如清理通過麥克風記錄的人類聲音。SONY的自主型娛樂機器人「小狗」aibo 可以利用該技術,更好地識別人聲,去除背景噪聲,以提高語音識別能力。對用戶而言最實際的應用,是利用聲音分離技術,將歌曲中的原唱分離出去,制作成卡拉 OK 伴奏。

光藤祐基還表示,希望技術能夠像一臺時光機一樣,讓過去和現在的藝術家能夠跨時空合作。SONY PCL 和SONY音樂解決方案剛剛開始使用我們的技術對外提供服務,所以肯定會有更多的應用,非常期待未來的前景。

About 尋夢園
尋夢園是台灣最大的聊天室及交友社群網站。 致力於發展能夠讓會員們彼此互動、盡情分享自我的平台。 擁有數百間不同的聊天室 ,讓您隨時隨地都能找到志同道合的好友!