「聲」勢驚人 AI語音交互晶片 啟動新一輪垂直領域戰場

尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️

加入LINE好友

作者:DIGITIMES韓丁

“聲”勢驚人 AI語音交互芯片 啟動新一輪垂直領域戰場

2018年人工智能(AI)行業成為了最受關注的熱點之一,不同場景的AI晶片層出不窮,成為了智能時代的「入場券」,大多數業者稱「得芯者得天下」,將2018年定義為「晶片元年」。

語音垂直應用領域,「造芯」似已成為雲知聲、出門問問、Rokid 、思必馳、科大訊飛從算法出發「軟硬兼施」一條必走之途,但也顯得語音AI市場變得異常競爭激烈。

在此背景下,2018年5月,雲知聲推出首款物聯網AI晶片——雨燕(Swift),通過「唯快不破」的發展思路,很快在語音識別風口中和科大訊飛比肩,並完成C輪1億美元的融資躋身國內眾多AI獨角獸榜單中的一員。

而在2019年開年之際,雲知聲繼續搶跑,於1月2日召開了「2019雲知聲多模態AI晶片戰略發布會」,會上正式公布了其多模態AI技術,以及正在研發中的多款定位不同場景的AI晶片,包括實用性更廣的超輕量級物聯網語音晶片雨燕(Lite)、可面向智慧城市場景提供對語音和圖像等多模態計算支持的海豚(Dolphin),以及面向智慧出行場景的車規級晶片雪豹(Leopard)。以上三款晶片計劃於2019年啟動量產。

AIoT下的多模態演變之路

雲知聲創始人兼CEO黃偉認為,5G與人工智能的結合將真正促使萬物智聯(AIoT)的落地與做到。可以預見的是,未來巨量的多維數據(如語音、圖像、視頻等)集中處理與邊緣式分布計算的需求,勢必將進一步挑戰AI底層支持硬件——晶片的計算能力。

與此同時,AI應用對於端雲互動有著強需求。強大的雲會讓端能力更強,而強大的端則可提升數據處理的實時性和有效性,進而增強雲的能力。二者需要緊密結合,這要求對晶片設計和雲端架構進行統一考量。傳統的通用方案架構由於在高實時性、高智能化場景中的算力有限,且無法平衡好成本、功耗、安全性等諸多現實需求,因此具備多維度AI數據集中處理能力的多模態AI晶片將成必由之路。

為做到多模態AI晶片的戰略落地,目前雲知聲已在加速技術布局,並在機器視覺方面取得飛速進展。其中,面向機器視覺的輕量級圖像信號處理器已可做到在不依賴外部內存的情況下,在30 fps的速率下實時對傳感器的圖片進行預處理,以進一步提高後續機器視覺處理模塊的處理速度和效果。借助基於人臉信息分析的多模態技術,已可做到人臉/物體識別、表情分析、標籤化、唇動狀態跟蹤等功能,可為產品交互和用戶體驗提供更多的可玩性和靈活性。

此外,雲知聲發布多模態人工智能核心IP——DeepNet2.0,可兼容LSTM/CNN/RNN/TDNN等多種推理網路,支持可重構計算與Winograd處理,最高可配置算力達4T。目前雲知聲DeepNet2.0已在FPGA上得到驗證,將在2019年落地的全新多模態AI晶片海豚(Dolphin)上落地。

直面思必馳、科大訊飛垂直領域競爭

語音識別與語義分析,這是人們比較能理解的人工智能應用領域。雖然在這條起跑線上,雲知聲後來追上,但不難發現,與其業務重合度較高的莫過於思必馳和科大訊飛兩家公司。

梳理之下可以看出,在產品線競爭上,雲知聲圍繞智能家居、智能車載、機器人、智慧醫療和智慧教育等的五大領域四面受敵。

“聲”勢驚人 AI語音交互芯片 啟動新一輪垂直領域戰場

雲知聲產品線中的智能家居方案、智能車載方案和機器人方案,直面與思必馳構成業務重疊,競爭態勢強烈。據思必馳CMO龍夢竹曾介紹,思必馳車載語音在智能車載後裝市場占據約60%的份額,在智能後視鏡領域約為70%,HUD領域已高達80%。

在智慧醫療與智慧教育領域里,科大訊飛仍是擺在眼前的不小阻力。除了雙方均大力布局將語音轉成結構化電子病歷系統與智能口語評測外,科大訊飛還在醫學影像輔助診斷和基於認知計算的輔助診療系統方面有所布局,並且根據科大訊飛2017年財報表示,其智慧教育產品已經覆蓋全國15000餘所學校,深度用戶超過1500萬,占總主營業務收入的25.54%。

因此,對於雲知聲而言,面對行業里既有科大訊飛這樣的「老大」,又有不斷加碼人工智能投入的BAT等巨頭,由應用場景來定義AI晶片的研發與產品形態無疑是其獨立發展的最佳路徑。

以語音病歷系統為例。醫生在說話時,能輕鬆地與電腦、iPad、移動查房設備等建立聯繫;說話的內容會被轉錄成文字並顯示在醫院專門的HIS、PACS、CIS等系統中。但是在醫療這個專業性非常強的領域,常規語音識別系統並不能完美勝任。

為此,雲知聲針對醫院不同科室的業務進行了梳理,整理了超過30GB的醫療文本資料,並對這些資料進行分類、檢索等處理,使得定制語音模型覆蓋各個科室常用病症、藥品名稱、操作步驟等關鍵信息,使語音識別準確率超過95%。同時,針對醫生的口音問題,雲知聲提出了無監督自適應技術,提高對醫生口語的識別率。

所以,在這一輪人工智能風潮的到來,最重要的是晶片定位。雲知聲的做法是,針對細分客戶的需求做極致化服務,從算法公司的角度出發做晶片,軟硬結合打造出一個好用的晶片,欲成為語音交互佼佼者,同時希望推出語音AI晶片打造生態,從而做到價值的提升。

About 尋夢園
尋夢園是台灣最大的聊天室及交友社群網站。 致力於發展能夠讓會員們彼此互動、盡情分享自我的平台。 擁有數百間不同的聊天室 ,讓您隨時隨地都能找到志同道合的好友!