百度輸入法開啟AI時代,突破方言、中英文混合識別難題

尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️

加入LINE好友

電腦在大陸普及,第一個急需要解決的問題就是,如何將漢字輸入到電腦中,於是產生了漢字輸入法。漢字輸入法發展至今主流的方式大致可以分為,筆畫、拼音、五筆、手寫、語音、雲輸入法。

百度輸入法開啟AI時代,突破方言、中英文混合識別難題 科技 第1張

當前國內輸入法存在很多問題

雖然漢字輸入法經歷了從無到有,從難到易,從簡單到智能的發展過程,但是就目前來看,各大輸入法依舊不夠完善,還存在很多的問題。

首先,在線語音領域的Attention模型(注意力模型)沒有突破。眾所周知,Attention模型(注意力模型)在語音領域有著非常重要的作用,它關係到在線語音的效率和準確率。近年來各大輸入法用的都是傳統的Attention模型(注意力模型),而傳統的Attention模型大都是基於整句的建模,語音都上傳到服務器後,才能開始聲學打分計算和解碼,這樣勢必引入較長的用戶等待時間,影響用戶體驗,同時也沒辦法完成實時語音交互的任務。各大輸入法也意識到了傳統Attention模型(注意力模型)的缺陷,在不斷的進行改善,但都目前為止並沒有太大的突破。

其次,很多輸入法在離線語音上也存在很大的問題。市面上現有的很多輸入法都號稱自己的語音輸入法在離線狀態的時候也能使用。但是,實際操作使用之後會發現離線語音的效率和質量遠遠不及在線語音。根據眾多網友反應的情況來看,離線語音時常會出現翻譯不準確、沒有斷句等問題。也就是說離線語音非常容易產生歧義,從而導致溝通不暢。

最後,國內眾多輸入法在混合語音輸入技術上也還比較落後,用戶不能做到真正的「自由說」。京比特試驗了一下,目前國內的輸入法的語音輸入多半只支持普通話,地方性語言則不能準確的識別出來。而中英夾雜、普通話夾雜方言、英語夾雜方言等這些混合性的語言更是不能夠識別出來。

當前,國內的主要輸入法有百度、搜狗、科大訊飛、QQ等幾大輸入法。當然這些輸入法也意識到了自身存在的這些問題,並且一直在努力的改進,但到目前取得的成效並不大,甚至整個輸入法行業語音領域都陷入了困境之中。

百度輸入法開啟AI時代,突破方言、中英文混合識別難題 科技 第2張

百度輸入法突破了輸入法行業里的困境

最近,在百度輸入法舉行了「AI·新輸入 全感官輸入2.0」發布會,百度在發布會上公布了百輸入法在輸入法語音領域取得的多項重大突破。不少行業人士認為,百度此次發布的幾項突破性的項目對整個語音領域來說有著非常重要的意義,打破了輸入法行業語音領域當前的困境。

首先,就上文中提到的在線語音領域來說,百度輸入法在傳統的Attention模型(注意力模型)進行了升級,打造出了流式多級的截斷注意力模型(SMLTA),它極大的減少了用戶的等待時間,很好的解決了傳統的Attention模型(注意力模型)在識別過程中時延性問題。不僅如此,流式多級的截斷注意力模型(SMLTA)還在線語音識別精度提升了15%,超越行業最高水平15%。

其次,百度輸入法在離線語音上也有很大的突破。百度輸入法一直就非常重視離線語音領域的發展,去年百度語音就發布Deep Peak 2模型,該模型的主要作用之一就是提升百度輸法離線語音的準確率。在此次發布會上百度輸入法再一次深化了Deep Peak 2模型,讓離線語音的準確率再次有了大幅度的提升。據悉,目前百度輸入法離線語音輸入相對準確率已高於行業平均水平35%,在沒有網路的情況之下百度語音輸入法也能夠流暢的使用。

最後,百度輸入法混合語音輸入方面也領先於行業。目前百度語音已經能夠識別 6種方言了,也就是說百度輸入法的語音技術能夠識別出方言也能夠支持普通話與方言之間的切換。同時,百度輸入法的語音技術也支持普通話和英語之間的切換。據悉,百度輸入法已經成為了成為在完全不影響中文語音輸入準確率的情況下,唯一做到高精準的中英文混合語音識輸入。

在京比特看來,百度輸入法在突破的輸入法行業的困境的同時,也突破了我們對於輸入法的認知。我們對於輸入法的概念就是鍵盤、手機,而百度輸入法此次發布的「AI·新輸入 全感官輸入2.0」輸入法卻不在完全依賴鍵盤和手機,語言、表情、動作都成為了百度輸入法的一種輸入方式。

百度輸入法開啟AI時代,突破方言、中英文混合識別難題 科技 第3張

百度AI技術正在驅動百度輸入法的發展

百度輸入法在突破行業困境的同時也獲得了大量用戶的認可。根據京比特查詢的資料來看,截至2018年底,百度輸入法月活躍人數已達5億,語音日請求量峰值突破5.5億,AR表情使用次數超過1億。百度輸入法不僅在國內發展迅速發展,在國外的輸入法市場上也非常具有競爭力。相關資料顯示,「百度海外輸入法全球安裝量超過1億,支持120種語言,覆蓋全球190個國家地區,並已與超過100個全球知名IP達成合作」。可見不管是在技術上還是市場上,百度輸入法都取得了不菲的成績。

如今的百度輸入法儼然已經成為了業界的佼佼者。京比特認為,百度輸入法取得技術與市場的雙豐收,在很大程度上都得益於百度的AI技術。百度高級副總裁王海峰也表示:「輸入法是離用戶最近的產品之一,也是AI落地的「橋頭堡」,百度全方位的AI能力正在不斷賦能輸入法,讓輸入法更「聰明」。」

百度輸入法是在2010年推出的,推出後不久就得到了百度AI的大力賦能,可以說百度輸入法是百度將AI應用於自動駕駛汽車領域之後又一個重要的領域。在2018年1月百度發布度輸入法8.0版本的時候,百度輸法方面就宣布AI能力將大力賦能感官輸入。而從此次發布會上的消息來看,百度輸入法在感官輸入方面已經取得了不小的成就,凌空手寫就是其取得的成就之一。可見AI技術已經成為了驅動百度輸入法發展的主要動力之一了。

百度是國內較早致力於發展AI科技的企業之一,在AI領域的投入也非常大,過去幾年百度投入了數千億美金進行了人工智能的研發,AI 能力也得到了國際上知名機構和媒體的認可,相信在百度強大AI能力的賦能之下,百度輸入法將更具競爭力。

About 尋夢園
尋夢園是台灣最大的聊天室及交友社群網站。 致力於發展能夠讓會員們彼此互動、盡情分享自我的平台。 擁有數百間不同的聊天室 ,讓您隨時隨地都能找到志同道合的好友!