轉寫準確率95%,搜狗開放AI技術實現錄音筆行業進化

尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️

加入LINE好友

轉寫準確率95%,搜狗開放AI技術實現錄音筆行業進化 科技 第1張

8月28日,搜狗在京舉行了「全新「聲」態 AI未來」搜狗聽寫服務開放暨AI創新聯盟成立發布會。會上,搜狗宣布將面向錄音筆行業開放自身聽寫服務,並與愛國者、紐曼、SONY錄音筆、萬城集團四家數位科技頭部企業成立AI創新聯盟。

搜狗聽寫服務基於搜狗AI語音技術的領先成果,可向用戶提供音頻文件雲存儲、音頻轉寫、多端同步編輯等一站式服務。用戶可通過PC端、App端、Web端任一管道接入該服務,做到錄音文件實時文本轉寫。同時,已完成的錄音可以進行非實時錄音轉寫,支持1小時音頻最快5分鐘出稿。值得注意的是,音頻直接轉寫準確率高達95%以上。

開放聽寫服務 成立AI創新聯盟

此前,搜狗推出的智能錄音筆C1兼具高清晰度和輕便攜性,滿足了相關用戶的使用需求,在市場上獲得了一致好評。一直以來,傳統錄音行業的研發重點都在於人聲保真和場景降噪,錄音音頻的後續生產力轉化一直被行業所忽略。搜狗智能錄音筆備受市場偏愛,除了其出色的收音效果,還在於搜狗聽寫服務的支持。基於搜狗聽寫服務,搜狗創新性地開拓出一個專業化的錄音文件後期智能處理平台,幫助用戶輕鬆做到錄音音頻向文字的轉化,有效節省人力和時間成本。

發布會現場,搜狗還聯合愛國者、紐曼、SONY錄音筆、萬城集團成立了AI創新聯盟,這四大錄音筆生產廠商的加盟,將在AI智能錄音筆產業帶起一場軟件與硬件的碰撞。產品AI化,是5G互聯網時代的大趨勢,電子設備通過人工智能的加持,不再死板僵硬缺少變通性,而會越發智慧化、便捷化。本次發布會後,搜狗面向全行業開放聽寫服務,不僅為傳統錄音筆行業提供了AI技術後盾,使音頻不僅「可聽」而且「可看」,也推動著多年來進度滯緩的錄音筆行業做到創新躍遷式發展。

自主研發AI技術關注細節體驗

對於技術行業來說,一些關鍵技術的突破點往往在於產品細節問題的處理上。搜狗通過對AI語音技術的自主研發,對錄音實時轉寫進行技術優化,做到轉寫結果超過95%的精準度,搜狗公司AI交互技術中心總經理在發布會現場對搜狗聽寫服務進行了詳細的技術解析。

目前搜狗輸入法語音請求峰值已超7億次,穩居全球最大的中文語音應用,依托於此,搜狗聽寫服務背後的轉寫技術已處於行業領先地位,其實時語音轉寫運用了搜狗自研的延遲可控的Adaptive Attention-based端到端建模技術,非實時語音轉寫功能使用業界領先的深層Transformer-based端到端語音識別技術,語音轉寫準確率可達95%以上。在語音增強方面,搜狗自研的Smart Voice麥克風陣列算法能夠對噪聲和混響進行多重深度優化,確保人聲的高保真還原。在智能輔助編輯方面,搜狗語音轉寫可以通過雲端智能糾錯編輯技術,基於詞圖搜尋和輸入糾錯模型,針對置信度低的轉寫結果提供多個候選詞,幫助用戶對轉寫結果進行糾正,同時還具備了良好的自動區分說話人、智能文本順滑和標點預測等能力,可以為用戶提供更多便捷功能。

AI推進技術變革 專業設備專業化

智慧型手機的出現,對具有重合功能的電子設備行業帶來巨大衝擊力。以傳統錄音筆行業為例,錄音筆可做到的音頻記錄功能,移動智慧型手機也可做到,且在使用體驗方面,兩者並無顯著差異。互聯網時代,一個產品失去了差異化優勢幾乎等於走向消失。而搜狗開放聽寫服務,恰能以AI技術助力錄音筆產品便捷做到智能化升級。基於前沿AI語音技術,搜狗聽寫服務率先在業內做到了錄音文件後期的一鍵加工處理,補足了「音頻轉文字」方面用戶使用場景鏈條的完整結構,真正提升錄音筆的便捷性,拉開其與手機產品的專業化差距。

愛國者、紐曼、SONY錄音筆、萬城集團這四家數位科技品牌在互聯網界擁有舉足輕重的地位,旗下錄音筆相關產品銷量占據業界半壁江山,此次與搜狗聯合成立AI創新聯盟也發出了傳統錄音行業尋求突破轉型的信號。三大巨頭對搜狗開放聽寫服務給予高度評價和大力支持,預示著錄音行業將迎來一場變革,智能錄音筆及後期處理平台勢將形成新的AI智能產業鏈,對有錄音需求的相關行業也會帶來顛覆性變革,引領錄音行業做到智能升級。

>轉寫準確率95%,搜狗開放AI技術做到錄音筆行業進化

About 尋夢園
尋夢園是台灣最大的聊天室及交友社群網站。 致力於發展能夠讓會員們彼此互動、盡情分享自我的平台。 擁有數百間不同的聊天室 ,讓您隨時隨地都能找到志同道合的好友!