獵戶語音OS亮相2018錘子新品發布會 老羅直言:市面上最好用

尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️

加入LINE好友

11月6日,錘子科技在成都舉行了新品發布會,發布了首款智能音箱——「大衛和希瑞高級智能音箱 D1」。

據了解,錘子的這款音箱搭載了獵豹移動旗下人工智能公司獵戶星空的全套語音OS解決方案,包括語音合成(TTS)、自然語言處理(NLP)、語音識別(ASR)等一系列的技術。

同時,獵戶星空還針對錘子打造了業界首個「一人分飾兩角」的聲音人設引擎。基於大數據情感的語音合成、漢語語音合成引入重音,打造了智能語音助手在生活和工作中的不同性格特徵。

老羅在現場表示,今後還將聯合獵戶星空,推出更多有個性的人物設定。他同時感謝合作方獵戶星空,「我們提了最多、最‘變態’和最讓他們意外的需求,他們仍然給了我們最好的支持。」

在獵豹移動的「321機器人之夜」上,老羅就曾為好友——獵豹移動董事長兼CEO傅盛站台,並表示「獵戶語音OS是市面上最好用的語音OS」。今天回到錘子的主場,老羅也用行動證明了自己當時打的Call。

發布會現場,老羅還和機器人「傅盛」進行了一場對話。據了解,機器人「傅盛」是獵戶星空研發的語音合成技術,傅盛本人只錄制了十段話,就達到了「以假亂真」的效果。

老羅:「市面上最好用的語音OS」

語音交互能力被看作是智能音箱的「靈魂」。據不完全統計,目前國內有數十家「語音開發平台」,競爭十分激烈。作為老羅口中「最好用的語音OS」,獵戶星空為什麼能從眾多競爭對手中脫穎而出,為手機界里最具「工匠精神」的錘子科技保駕護航?

雙人設-TTS

雙人設引擎功能是本次發布會上的最大亮點之一。這是獵戶針對錘子打造的業界首個「一人分飾兩角」的聲音人設引擎。

不同於以往的語音交互體驗中,只有一個聲音一個人設,或最多支持聲音的切換。

雙人設引擎功能採用獵戶的語音合成技術,基於大數據情感的語音合成、漢語語音合成引入重音,打造了男生「耿大衛」、女生「何希瑞」在生活和工作中的不同性格特徵。

在語音合成的聲音風格和文本語料的設計上,呈現出男友風、男職業風、女友風、女職業風的性格特徵,滿足不同的用戶需求。

↑↑↑女生「何希瑞」

↑↑↑男生「耿大衛」

在雙人設的TTS合成上,獵戶星空也花了很大的心血。從最初的發音人挑選到最後的語音合成,嚴格把控每一個環節,只為把合成的聲音做到最好。

在確定好人設風格後,從200個發音人中投票選出男、女發音人,經過3個月的時間,打造出人設相關的情感語音庫。

因為是同一個發音人「分飾兩角」,為了保證聲音效果的完美呈現,獵戶TTS團隊在參數的調優和效果的打磨上下了很大的功夫,最終呈現出同一個人生活和工作中,聲音溫柔甜美和乾淨利索的雙人設風格。

中英文混合識別能力

多語種混合Query的識別是語音技術中攻克的難點,例如,「我想聽Taylor Swift的One More Night」這樣一句普通的需求,正常人都可以理解。

但是對於智能音箱來說,就是一個不小的挑戰。這是因為,語種切換對語言模型帶來了更大的複雜度。

為了解決這一難題,獵戶語音OS團隊投入了大量的精力,特別是針對性優化了中英文點播體驗,達到了行業領先效果。

其中一項重要工作就是,提升訓練數據的數量和豐富性:獵戶語音OS擁有上千小時的遠場中英文語料,可用於語言模型的訓練;建模一千多個中文音節,並用中文音節建模英文發音。

此外,獵戶語音OS還支持8萬首新熱的英文資源歌曲與8千名英文歌手的點播。這些數據成為了獵戶語音OS的「基礎設施」。

除了豐富的數據積累,獵戶星空還擁有獨特的技術壁壘:基於遠場的語音語義一體化技術,可以提高遠場交互中高頻Query的識別率,讓機器更好地聽懂世界;其次,圍繞音頻內容進行深度定制,動態地更新模型;最後,做好口語化指令泛化,讓點播粒度更細。

在團隊的共同努力下,獵戶語音OS的通用內容點播準確率超過90%,在行業內遙遙領先,同時還支持中英文、兒童、翻譯、車載等場景識別。

獵戶語音OS成為行業標配

作為應用最廣的中文語音合成技術,獵戶語音OS技術占有中國智能語音市場份額超過30%,累計激活設備超過3000萬。截至目前,獵戶語音OS每天線上語音指令超過2000萬次,擁有上百萬小時的遠場語音數據積累。

獵戶星空過去一年在AI硬件賽道奔跑的歷程,一直擁有兩個核心的邏輯:自主研發完整技術鏈條,以及整體戰略上的開放心態。

獵戶星空的整套AI技術都是自主研發,包括語音識別、圖像識別、視覺導航等,所以獵戶星空能根據場景來定制算法,打造更好的用戶體驗。

具體到獵戶語音OS上,全鏈路自研會讓不同技術環節的銜接更為融合,讓語音交互更為迅速準確:垂直領域深度語義理解96%的正確率、遠場語音識別率達到行業領先的97%、全鏈路流暢網路下1.5s的平均響應速度。這些都是「下苦功夫」之後帶來的回報。

智能語音的發展不斷成熟,為各行各業帶來新的發展機遇。獵戶星空在打磨自己技術的同時,也在將技術優勢賦能行業。

據了解,獵戶語音OS已經應用到了華為、小米、美的、喜馬拉雅、獵豹移動等多家合作夥伴的產品中,成為「應用最廣泛」的AI語音系統。

10月15日,中國人工智能產業發展聯盟(AIIA)在人工智能開發者大會公布了國內智能音箱智能化評級結果,包括獵豹移動、小米、喜馬拉雅、百度、京東在內的五家主流廠商攜其智能音箱產品參與了首批測試評估。

獵戶語音OS占據了獲評產品前五強中的三席,支撐起了智能音箱市場的大半壁江山。

結合自身人機交互的產品基因和獵戶星空擁有的行業唯一的全鏈條AI技術,獵豹移動也在不同行業推動人工智能產品的場景化落地。

未來,獵豹移動與旗下獵戶星空還會將自主研發的視覺、導航、語音、機械臂技術等核心能力逐步對外開放,與合作夥伴一起,讓機器人產品走進大眾生活。

糾錯