百度發布國內首款AI輸入法 語音技術做到世界級突破

尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️

加入LINE好友

【環球網科技 記者 林迪】1月16日,國內首款真正意義上的AI輸入法——百度輸入法AI探索版正式亮相百度輸入法「AI·新輸入 全感官輸入2.0」發布會。據悉,這是一款默認輸入方式為全語音輸入,並調動表情、肢體等進行全感官輸入的全新輸入產品。

同時,百度宣布,其語音技術取得一項對全球學術界和工業界都具備重大意義的技術突破,流式截斷的多層注意力建模(SMLTA)將在線語音識別精度提升了15%,並在世界範圍內首次做到了基於Attention技術的在線語音識別服務大規模上線應用。

百度中文輸入法負責人蔡玉婷表示,相較2016年,百度輸入法日均語音請求量增長了8倍,語音輸入法的場景也從聊天和搜尋拓展到遊戲、娛樂、購物等眾多場景。

現場,百度語音技術部負責人高亮宣布了百度語音輸入的四項重大突破和給輸入法用戶帶來的體驗提升——在線語音、離線語音、中英自由說和方言自由說。

在線語音領域,百度發布流式截斷多層注意力建模(SMLTA),這是中文在線語音識別歷史上的兩個重大突破:世界上首次做到了局部注意力建模識別精度超過全局注意力模型;世界上第一次大規模部署在線語音交互注意力模型。這一技術能夠解決傳統Attention模型在識別中的時延性,以及因此導致的無法進行大規模在線語音實時交互的問題,並將在線語音識別精度提升了15%,超越行業最高水平15%。

離線語音識別領域,為解決用戶多元輸入場景的需求,百度持續優化DeepPeak2系統,讓離線語音輸入相對準確率再次提升,高於行業平均水平35%。即使用戶處於地鐵、電梯、隧道或人流密集等離線場景中,依然可以借助百度輸入法進行精準的語音輸入。

中英文混合語音輸入技術,以及方言與方言、方言與普通話的混合語音輸入技術突破,讓用戶真正做到「自由說」,無論是中英文夾雜,還是普通話家鄉話來回切換,百度輸入法都能準確識別。據介紹,百度輸入法是目前唯一做到了高精度「中英自由說」和「方言自由說」的輸入法產品。

數據顯示,截至2018年底,百度輸入法月活躍人數已達5億,語音日請求量峰值突破5.5億,AR表情使用次數超過1億。同時,百度海外輸入法全球安裝量超過1億,支持120種語言,覆蓋全球190個國家地區,並已與超過100個全球知名IP達成合作。

發布會上,百度海外輸入法展示了日語識別、印地語識別和印英混輸功能,據第三方評測顯示,百度日文輸入法的語音識別精度位列行業第一,識別結果用戶可接受度占比高達 90%,已成為日本最大的第三方輸入法產品;印度用戶語音功能的使用率已達21%,百度輸入法幫助印度用戶做到了自由溝通。

伴隨著百度語音、視覺、自然語言處理、知識圖譜等百度AI技術落地輸入法,「全感官」的輸入變成現實。除了語音輸入,百度輸入法AI探索版還推出了拍立活、秀場、凌空手寫等新功能玩法。無論是心愛的偶像,還是日夜陪伴的寵物,「拍立活」功能都可以讓用戶通過自己的動作「驅動」對方做出相同表情;「秀場」功能運用圖像分割技術,讓用戶「穿越」到不同的虛擬場景之中,科技、清新、賽博朋克多種風格隨意挑選,表情創作更具場景感、更加生活化;凌空手寫如同隔空打怪,在空中書寫也能被流暢識別,目前整體識別率已達到大規模應用的要求。

百度輸入法全感官交互潮流也已進入海外並獲得認可。據悉,借助AI技術的加持,百度海外輸入法已經在全球建立起活躍的表情社區。超級IP《變形金剛》系列首部獨立電影《大黃蜂》已與百度海外輸入法聯手推出「大黃蜂」系列主題貼圖和AR表情。截止目前,百度海外輸入法已經和Hello Kitty、小黃鴨、小王子、格林奇等全球100餘個知名IP達成合作,推出了一系列深受用戶喜愛的IP皮膚和表情,同時深耕本地化經營,針對海外用戶還設計了本地網紅合作推廣等定制化傳播。

百度高級副總裁王海峰表示「雖然目前的輸入法產品主要應用於手機端,但未來的各種智能設備都將需要輸入,都需要跟用戶交互,輸入法都將發揮巨大作用。而且不僅限於中文、不僅限於中國,輸入法正在走向世界,為全球用戶提供更有多元的輸入方式。」

About 尋夢園
尋夢園是台灣最大的聊天室及交友社群網站。 致力於發展能夠讓會員們彼此互動、盡情分享自我的平台。 擁有數百間不同的聊天室 ,讓您隨時隨地都能找到志同道合的好友!