尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️
進入 2019 年, AI 技術的場景落地和商用化會成為一個更迫切的議題,但語音識別已是所有 AI 技術中最成功的領域,眼前有四大AI語音公司思必馳、雲知聲、Rokid 、出門問問不約而同投入「造芯」運動,開始押寶自制 AI 語音晶片,開啟第二戰場!
(來源:思必馳)
「融資」與「造芯」成為 AI 創業公司兩大主軸議題,思必馳在 2018 年完成 D 輪融資後,即透露與某晶片巨頭進行 AI 晶片的研發,如今答案揭曉,思必馳旗下的晶片設計公司「深聰」獲得「國家隊」中芯國際旗下的股權管理公司中芯聚源投資,同時中芯國際也為深聰打造第一顆 AI 語音晶片。
「百箱大戰」時代開啟 ,AI 語音晶片熱度火到「互撕」?
基於深度學習( Deep Learning )的語音辨識技術很快成為 AI 創業界的流量擔當,尤其 2017 年 Amazon 一口氣推出多款Echo系列產品,開始了國內「百箱大戰」的年代,更讓相關 AI 語音企業迎來一陣小高潮,不少同性質公司更是明爭暗鬥陷入「互撕」局面,反應該市場的火熱程度。
根據 Canalys 可能, 2017 年全球智能音箱出貨量突破 3000 萬台, 2018 年出貨量預計是超過 5600 萬台,全球前四大品牌廠為Google、Amazon、天貓、小米。再者, 2017 年全球智能音箱用戶量排名前五名是美國、英國、德國、中國、加拿大,但2018年中國可望躍居第二名。
除了音箱之外,智能家居、汽車市場很多應用場景的硬件也會陸續加入語音智能化的功能,都讓 AI 語音技術的應用場景增添無限想像空間。
(來源:思必馳)
光是 2018 年就有三家 AI 語音創業公司發表相關晶片,包括雲知聲發表面向 AIoT 市場的 UniOne 晶片、出門問問的 AI 語音晶片模組「問芯」Mobvoi A1、 Rokid 的 AI 語音晶片 KAMINO 18 ,思必馳透露要進入自制晶片領域已有一段時間,4日才正式對外揭露具體戰略細節。
中芯國際助陣,思必馳「造芯」如虎添翼
不同於雲知聲、Rokid進入晶片自制領域,都是在公司內部成立獨立部門進行研發,思必馳2018年初成立子公司「深聰」,2019年初推出的第一顆產品是AI語音晶片深聰TAIHANG晶片。
思必馳扶植的深聰之所以引起業界注意,是因為思必馳的「造芯」之路,找來國內半導體巨頭中芯國際助力,旗下的投資公司中芯聚源加入成為創始股東之一。再者,思必馳對深聰的持股比重超過50%。
思必馳自制的首顆AI語音晶片,就是由中芯國際操刀,以40奈米工藝打造,約莫是2017年中啟動該晶片項目後,在2018年8月進行流片,11月晶片出來後,現在處於采集樣本階段,預計2019年中將進入風險試產,該顆晶片拔劍出鞘的速度十分快,幾乎把需要6 個季度的工作,縮短為3個季度完成。
深聰TAIHANG晶片面向智能家居、智能終端、車載、手機、可穿戴設備等各類終端設備,基於雙DSP架構,內部集成codec編解碼器,以及大容量的內置存儲單元,再者,該晶片也採用了指令集擴展和算法硬件加速的手段,相較於傳統通用晶片具有10X以上的效率提升。
深聰聯合創始人吳耿源表示,在晶片戰略上是兩步走,因為背後強大的需求力道驅動,第一顆晶片不單是求快,講求time-to-market,也專注低功耗、單向反饋、做到算法加硬件融合優化的想法。
圖 | 深聰聯合創始人吳耿源(來源:思必馳)
同時,深聰內部已經開始第二顆晶片的規劃,是專用晶片加特定架購,雙向溝通更能達到軟硬件融合、深度優化的功效提升,以軟件需求來定義晶片架構,再用架構去反饋算法,同時,算法也會優化硬體架構,等於是彼此做到雙向溝通,預計該顆晶片將在2019年下半年流片,2020年量產。
從「通用」到「專用」,這是一條怎麼樣的心路歷程?
從通用晶片到量身打造專用晶片的過程,想必有一番思考、摸索與探尋,吳耿源接受DT君專訪時娓娓道來。
吳耿源分析,思必馳是一家滿十歲的企業,這幾年趕上AI崛起的浪潮,過去多年的技術積累獲得發力的機會,目標戰場是物聯網,第一個應用場景是智能音箱,一切有了很美好的揭幕,但坦白說,智能音箱終究「 me too 」產品,Amazon 已經在前開路。
思必馳的智能音箱初期用過很多家晶片大廠的通用晶片,但隨著產品線逐漸成長茁壯後,許多問題逐一浮現。因為,通用晶片功能再怎麼強大,落地到AI場景上會有削足適履之感,加上很多目標市場越來越明確、消費者群聚效應展現後,特制化晶片的需求因此誕生。
AI 晶片在市場上有兩路的提供者,早幾年都是通用晶片的天下,像是高通、聯發科等,這些巨頭在晶片戰略上,較為著眼於商業利益價值,但是,很多AI應用場景都屬於細分賽道,要通用晶片巨頭「削足適履」,會比較不切實際。
這些晶片巨頭當然也會想要「染指」AI市場,但這個市場和他們過去擅長的遊戲規則有落差,以前是巨頭們設計出什麼樣的晶片,客戶就要乖乖接受,但AI市場是反其道而行,要透過使用者來定義產品,再由把需求反饋給算法,靠算法做到。
但是,傳統晶片巨頭無法緊密地直接觸碰市場需求,或是內部沒有強大的算法團隊或數據(Data)做後援,在AI領域要成功,算法、數據、正確地定義市場都是關鍵。
因此,近幾年起算法公司開始切入「造芯」運動,也提供給算法公司做到垂直整合布局的機會,更重要的是,藉由「造芯」來確保產品的差異化和核心價值凸顯出來。
吳耿源表示,思必馳從算法公司跨入產品,再垂直整合成一個平台,上下串連系統,在雲端(Cloud)、邊緣(Edge)兩端都有布局,關鍵就是欠缺一個硬件晶片去擔任執行的角色,而AI領域是軟件定義晶片,初期用市面上通用晶片時,也發現算法與晶片對接的過程,有很多文化融合的問題。
舉個例子,當算法遇到晶片,發生的第一個衝突是算法的改朝換代速度遠快於晶片的工藝技術。
一般而言,從定義產品到晶片誕生於世,大概要「懷胎」兩年(24個月),中間經歷設計、流片、試產、改版、升級、量產,每一個階段慢慢磨練,中間經歷的循環以「季度」為單位來計算。
反觀在算法的世界里,每一個禮拜都在改,循環可能是以「禮拜」作為單位,若將算法與晶片擺在同一家企業中,彼此步伐不一致的問題,會產生明顯的內部矛盾與衝突。
思必馳從算法、產品、平台、系統整合布局到整個生態系統,現在加入深聰自制AI語音晶片,布局齊全後,將跨出智能音箱這個「me too」市場,進入AIoT領域,包括TV盒子、白色家電、智慧家庭、故事機等,當物聯網遇上AI,商機是無可限量。
多模式人機交互是理想桃花源
吳耿源進一步指出,光是語音AI技術就還有很大的精進空間,現在的智能音箱的溝通仍需經過「喚醒」的程序,其實是「人工弱智」,要做到自然人機交互,當中的技術突破就需要算法的大幅增進,其中一個關鍵的元素是聲紋。
市面上的智能音箱只能辨識出說話的內容,再針對問題給出反饋信息,這樣的交互方式是智能化的,但交流方式卻不夠聰明,因為必須要在明確對象的情況下進行,唯有做到「聞聲即可識人」,不需要「喚醒」這個多餘的動作,這才是真正的「SMART」。
吳耿源進一步解釋,AI語音晶片在應用場景的廣度上,絕對不單是音箱領域,還包括物聯網、智慧家庭、車載市場等,更進一步場景是多模生態,當下AI是最好的時代,天時、地利、人和,AI時代正在騰飛、國家關注造芯、加上軟件、硬件、人和的融合。
現在的AI技術場景分別在語音、視覺兩大領域有不錯的起步和成功的場景落地,但卻都是各自表現,所謂的多模生態是指聲覺、視覺、五官、手勢、觸摸等獨立的功能融合在一起,做到自然的多模式人機交互。
AI技術領域的前方是無人區,只能摸著石頭過河,每一步都是挑戰,但也處處是驚喜。
更重要的是,這是一個國內最有機會與美國科技先驅並行的領域,AI技術的「造芯」運動是日正當中,想想海思追趕高通也花了超過十年,才造就今日的江湖地位,國內發展AI技術有應用場景做後盾,要打造出一家巨星級的企業,這一劍肯定不用磨到十年!