探尋文檔智能未來式,文心重磅升級文檔處理功能

尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️

加入LINE好友

最近,百度語義理解平臺文心(ERNIE)迎來重磅升級。新增文檔實體抽取任務,升級定制文檔分類網路,並在訓練能力、部署方式等方面進行了一系列改進,進一步提升了 NLP 模型開發效率,開發者可在零門檻 AI 開發平臺 EasyDL 體驗文心新功能。

文心(ERNIE)是依托百度深度學習平臺飛槳打造的語義理解技術與平臺,集先進的預訓練模型、全面的 NLP 算法集、端到端開發套件和平臺化服務於一體,為企業和開發者提供一整套 NLP 定制與應用能力。

文心(ERNIE)官網地址:

wenxin.baidu.com

為了讓文心(ERNIE)的世界級技術突破轉化為企業發展動能,在產業應用中發揮更大價值,文心還通過 EasyDL 平臺提供了一整套簡單高效的 NLP 開發能力。

EasyDL 是百度大腦推出的零門檻 AI 開發平臺,基於百度自主研發的深度學習平臺飛槳,結合業界先進的工程服務技術打造,覆蓋視覺與自然語言處理兩大技術方向,支持一站式智能標註、模型訓練、服務部署等全流程功能。開發者無須了解算法細節,最快5分鐘即可上手定制模型。

探尋文檔智能未來式,文心重磅升級文檔處理功能 科技 第1張

EasyDL 文檔處理開發服務全景圖

截至目前,搭載文心的 EasyDL 文檔處理能力調用量峰值超百萬次,服務超千家合作夥伴,應用覆蓋金融、安防、文創等多個領域,已助力眾多企業邁出了智能化轉型的關鍵一步。

此次文心在 EasyDL 文檔處理功能上主要升級的功能如下:

新增文檔實體抽取任務

「文檔實體抽取」作為文檔挖掘和資訊抽取的核心任務,支持從海量資訊源中抽取出特定的事實資訊,是資訊檢索、智能問答、智能對話等人工智慧應用的重要基礎。

文心全新上線的「文檔實體抽取「任務,可以滿足對文檔中的命名實體進行快速有效的識別,比如抽取金融類文檔中的企業主體、交易資訊等。為提升該項能力的易用性,文心還提供系列配套開發服務,助力開發者更便捷地去完成。

  • 在線智能標註,節約成本

在線智能標註,節約成本

針對數據準備難題,文心發布了「文檔實體抽取」任務的數據標註工具,支持在文檔中直接劃選進行標註,給標註人員帶來極佳的標註體驗和更高的標註效率。

探尋文檔智能未來式,文心重磅升級文檔處理功能 科技 第2張

文檔實體抽取智能標註示意圖

  • 兩種訓練方案,彈性選擇

兩種訓練方案,彈性選擇

開發者根據數據量情況靈活選擇訓練方案。若您準備的數據量較少(少於1000條),使用「高精度」算法會獲得更好的訓練效果;若您準備的數據量較充足,則可以使用「高性能」算法來訓練模型,訓練時長短,預測性能快。

  • 預置模型與網路,開發更易

預置模型與網路,開發更易

平臺專業版在模型配置中,可以選擇效果更優的 ERNIE 預訓練模型和對應的預置網路,並支持網路代碼修改,從源碼級別提升模型定制靈活性,極大釋放專家們的創造力。

升級文檔分類-單標簽任務

「文檔分類」可對文檔內容進行自動分類和打標簽。如在新聞推薦領域,《湖人大勝熱火4-2奪第17座總冠軍》屬於體育類,《國家統計局4月 CPI 同比上漲3.3%》則屬於經濟類。

本次平臺升級了文檔分類(單標簽任務)的模型網路,也提供高精度和高性能兩種訓練方案。基於平臺提供的公開數據集(分類任務),使用「高精度」算法可得到90%以上的準確率;對於 1W 條以上的數據量,使用「高性能「算法可獲得極致速度體驗(通常15分鐘左右可完成訓練)。選擇合理的訓練方案,讓模型訓練達到事半功倍的效果。

提供更多高效開發能力

  • 增加多機訓練能力,加速模型訓練

增加多機訓練能力,加速模型訓練

平臺豐富了文檔處理的多機訓練能力,支持 V100 和 P40 兩種 GPU 機型的訓練方式,多個計算節點,加速模型訓練;此外,平臺還免費為每一位用戶提供了50個小時的訓練時長,0成本體驗平臺。

  • 支持直接申請私有服務器部署,部署更快捷

支持直接申請私有服務器部署,部署更快捷

此前,EasyDL 文檔處理已整合多種部署方式,包括彈性擴容的公有雲 API 部署,通用設備端 SDK 與專項硬件適配 SDK,本次優化還新增了模型本地私有服務器部署方式,可快速申請和獲得所需的部署包,提供企業更多的 AI 落地方式選擇。

探尋文檔智能未來式,文心重磅升級文檔處理功能 科技 第3張

私有服務器部署入口

  • 新增模型售賣與購買功能,節省成本提升效率

新增模型售賣與購買功能,節省成本提升效率

平臺支持用戶將訓練好的「情感傾向分析」高精度算法模型發布到 AI 市場,供其他用戶購買和再訓練,開啟模型交易新范式。您既可以作為模型的發布者,也可以是模型的購買者。對於已購買的模型,可以直接再訓練和部署,大幅降低開發成本,並獲得可預見的高精度模型效果。

探尋文檔智能未來式,文心重磅升級文檔處理功能 科技 第4張

AI 模型市場示意圖

以上是本次升級帶來的新增能力,歡迎點擊「閱讀原文」進入官網查看更多資訊!深度學習背景下,實現 NLP 簡單開發,就來 EasyDL 平臺用文心!

未來,文心(ERNIE)將持續依托百度領先的技術實力,進一步釋放 AI 技術的賦能效率,以更簡單、普惠的方式進入 NLP 開發者世界,助力開發者創造更高商業價值。歡迎有共同志向的開發者/企業加入我們的合作 QQ 群1097307223。

EasyDL 零門檻模型訓練營

想了解強大文心(ERNIE)背後的技術原理?

想更進一步快速掌握 NLP 模型開發方法與技巧?

想線下和百度資深研發與各行業開發者深度溝通?

百度 AI 快車道【EasyDL 零門檻模型訓練營】來了,百度資深研發工程師詳解 NLP 技術能力,從文心(ERNIE)技術解析到 EasyDL 實戰演練,為你解讀如何定制企業高精度 NLP 模型,並帶來現場實操與面對面答疑解惑。

11月7日,發車「成都」,歡迎感興趣的開發者掃描下方QRCode提前報名,報名時選擇「零門檻模型訓練營」-「成都11月7日」,帶你迅速掌握 EasyDL 的 NLP 模型開發秘籍!

About 尋夢園
尋夢園是台灣最大的聊天室及交友社群網站。 致力於發展能夠讓會員們彼此互動、盡情分享自我的平台。 擁有數百間不同的聊天室 ,讓您隨時隨地都能找到志同道合的好友!