百度大腦首次發布AI硬件:蓄謀已久向終端發力

尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️

加入LINE好友

機器之心報導

作者:李澤南

在不斷開發新技術、推動人工智能服務的同時,百度大腦也推出了自己的硬件。本周三,百度在深圳一口氣發布了12個計算板卡、硬件平台等產品。如此硬核的發布會開了整整兩個小時。

百度在發布會上推出了視覺計算卡、多款視覺分析模組、語音開發套件等硬件,甚至還有一套硬件評測與認證服務。其中,百度和賽靈思、英特爾等廠商合作推出的板卡引人註目。這些硬件面向端側設備,可幫助開發者快速設計出自己的產品。

此前,百度大腦的技術很多是以 SDK 的方式推出的,百度 AI 技術生態部總經理喻友平表示,但還有更多的場景,如安防和物聯網設備非常依賴新型硬件才能做到 AI 的真正落地。這是自2016年百度大腦啟動開放以來,首次集中發布硬件平台與產品。

目前人工智能的應用主要集中於計算機視覺和自然語言識別領域,這也是此次百度發布硬件產品的兩大方向。

視覺計算模塊 EasyEdge

AI 的應用過程很長,對於開發者來說,要設計高性能、低功耗的深度學習模型,搭配高效率的硬件,再結合實際場景才能最終成功。喻友平介紹道。百度希望通過自己的產品來解決大部分環節中的難點。

百度大腦首先推出的是基於 Paddle Mobile 打造的零代碼端計算模型生成平台 EasyEdge。與之相配的是兩款 AI 加速計算卡。

第一款是主打小型化、低功耗的 X-eye 計算卡,其只有一元硬幣大小,支持人臉識別、手勢、商品識別等多種高性能視覺算法,搭載 Intel Movdius AI 加速晶片,算力超過1Tops。同時,這塊計算卡還帶有百度獨創的 Xos 加速技術,可使神經網路算法平均提速15%,核心模型如人臉識別算法則可以提升200%。這款計算卡可靈活搭配多種視覺模組,形成完整的解決方案。

針對需求較高的任務,百度推出了適用於大計算量、可自定制模型的 EdgeBoard 計算卡。EdgeBoard 的解決方案中包含模型嵌入工具包、AI 加速工具包、嵌入式計算卡參考設計,其軟硬一體的完整架構可為端側人工智能負載提供強大算力。在晶片上,百度選擇了賽靈思的 FPGA,可提供2.4Tops 的 AI 算力,性能3 倍於終端 GPU、10倍於終端 CPU。百度稱,EdgeBoard 在運行 Resnet50模型推斷任務時可達到55FPS 的處理速度。

深度學習模型通過集成 EdgeBoard 可大大提升推斷任務時的性能表現,解決終端算力發展相對不足與低延遲需求之間的矛盾。

為了展示計算卡的實力,百度與合作夥伴們共同打造了兩款人臉識別抓拍一體機。據百度介紹,這些設備可以做到98%的人臉識別準確率,適用於營業廳、便利店等場景,可幫助店鋪快速完成智能化改造。

百度表示,EasyEdge 支持4 種深度學習框架、13種神經網路結構,適配5 款晶片與3 種操作系統。。該產品允許用戶在沒有人工智能應用開發能力的情況下通過可視化操作進行深度學習模型的開發。針對不同的場景,EasyEdge 的用戶只需3 步、最快2 分鐘即可生成端計算模型 SDK,可節省90%的開發時間,並兼顧性能與能耗,可大大降低端計算模型的開發成本。

百度遠場語音開發套件

在語音識別方面,百度打算將智能音箱上最為重要的遠場識別麥克風陣列的軟硬件技術開放出來,供所有廠商使用。

我清晰地記得在2017年,百度曾預測大量科技公司都會發力遠場麥克風陣列。百度語音技術部產品與架構負責人謝延在發布會上表示,去年智能音箱領域的發展印證了我們的預測。今天 DuerOS 激活數量超過2 億,和百度大腦的語音識別技術進步是分不開的。

百度在發布會上介紹了近期的一些技術突破,包括一次喚醒多次交互技術,以及剛剛推出的 SMLTA 模型。其中,流式截斷多層注意力建模(SMLTA)方法可將在線語音識別精度提升15%,是全球首次做到的基於 Attention 技術的在線語音識別服務,已大規模部署在了百度輸入法中。現在,人們在手機上就可以獲得人工智能帶來的高精度語音識別體驗了。

百度認為,在遠場語音識別時代開發者有四個需要重點注意的地方:信號處理、軟硬結合、端到端(在 AI 建模上)以及喚醒技術(整詞的喚醒詞進行建模)。為了方便更多公司開發屬於自己的產品,百度發布了遠場語音開發套件。

百度遠場語音端到端解決方案從用戶交互端到雲端識別模型全鏈條定制,解決了遠場語音交互識別不穩定、錯誤率高等應用問題。

新髮布的開發套件使用安卓系統,搭載了遠場語音端到端技術,其硬件可以選擇高性能或高性價比的兩種板卡,麥克風陣列則有三種:包括環形6+1麥、線形4 麥和車載3 麥的多形態麥克風陣列套件方案。百度遠場語音開發套件基於端到端方案,按照最佳技術實踐指導生產,可解決語音交互產品研發過程中無可用設備選型、選型調試成本大、調試效果不佳等問題。該方案支持回聲消除、聲源定位、波束形成、噪聲抑制等處理算法。百度稱,目前使用這些套件落地的產品已達150餘款。

百度的遠場語音開發套件自2017年就開始研發了,直到今天才發布了公版。謝延表示。百度也在做自己的 DSP 解決方案,以期進一步降低硬件成本,降低門檻。

認證 AI 硬件

在硬件之外,百度大腦還發布了一些針對 AI 硬件的服務,包括硬件端雲協同技術及評測認證。或許在未來,想知道一種硬件是否適用於人工智能應用,得看它有沒有通過百度的評測了?

百度大腦新推出的硬件評測認證是國內首個 AI 硬件評測認證體系。百度為 AI 技術周邊的硬件產品如傳感器、計算卡等進行標準化的評測和認證。例如,百度會評測錄影頭輸出的圖像質量是否符合場景需求、圖像和算法是否匹配等等。百度認為,通過評測和認證機制可以減輕廠商在集成產品過程中選型、評測的成本及工作量,幫助 AI 硬件產品標準化。

硬件的接入與售賣是百度大腦 AI 硬件生態的最後一環。從端側硬件的數據采集到整個項目的系統集成,在常規情況下需要冗長的對接開發工作。喻友平表示,針對這一痛點,百度大腦推出了硬件接入與端雲協同平台 EdgeCloud,該平台連接 AI 端硬件與 AI 雲服務,提供設備管理、數據管理等功能。百度稱,使用該平台的用戶無需任何代碼就可以完成端到端的項目集成。這種形式有效降低了硬件接入與系統集成開發門檻。

目前,百度大腦已有100多家硬件生態夥伴,百度大腦的 AI 能力已有超過150項能力開放,社區內聚集了超過80萬開發者,而行業應用的方向達到了20個。從模型開發到硬件產品,百度大腦已經形成了完整的人工智能產品鏈。

現在百度大腦硬件已經有100家以上的合作夥伴。

本文為機器之心報導,轉載請聯繫本公眾號獲得授權。

About 尋夢園
尋夢園是台灣最大的聊天室及交友社群網站。 致力於發展能夠讓會員們彼此互動、盡情分享自我的平台。 擁有數百間不同的聊天室 ,讓您隨時隨地都能找到志同道合的好友!