尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️
機器之心報導
機器之心編輯部
機器之心又一產品「SOTA模型」今天上線啦!機器學習 SOTA 研究一網打盡。
想像一下,你是一位從事機器學習的研究者,需要持續了解最前沿研究進展;或者你希望將最前沿的機器學習研究應用於自己從事的領域。為此,當你在浩瀚無邊的論文海洋中暢遊時,你最需要的找到的是 SOTA 論文。
SOTA,全稱「state-of-the-art」,用於描述機器學習中取得某個任務上當前最優效果的模型。例如在圖像分類任務上,某個模型在常用的數據集(如 ImageNet)上取得了當前最優的性能表現,我們就可以說這個模型達到了 SOTA。
那麼,怎樣才能高效找到 SOTA 論文呢?遺憾的是,經過多年的發展,現在依然沒有一個平台能夠完整地匯總、整理、歸檔所有 SOTA 論文。在全世界最著名的論文預印發布平台 arXiv 上,搜尋 SOTA 的結果也非常雜亂無章。此外,即使有類似於 GLEU leaderboard 之類的網站可以看到一些 SOTA 模型,但也只是機器學習龐雜體系下的一小部分。
在 arXiv 上搜尋 state-of-the-art 時,返回的結果會很多,但仍然不夠系統。想要知道達到了 SOTA 的論文是關於什麼任務、使用了什麼數據,需要點進去一一查看。
機器之心作為專業的人工智能信息平台,有著多年的學術資源積累。經過對大量數據的分類與匯總,機器之心再次上線新產品:SOTA模型。你可以根據自己的需要尋找機器學習對應領域和任務下的 SOTA 論文,平台會提供論文、模型、數據集和 benchmark 的相關信息。
訪問地址:www.jiqizhixin.com/sota
前沿研究觸手可及
在「SOTA模型」首頁,你可以直接搜尋技術任務,系統會立刻返回任務定義、取得 SOTA 的模型名稱、研究中最常用的模型和最熱門的數據集。
如果你繼續向下瀏覽網頁,就可以看到此技術任務下所有使用過的數據集和模型,並且可以按照數據或模型的類型進行篩選。
想知道歷史 SOTA?完整榜單送給你
當然,這還遠遠不夠。SOTA 是隨著時間變化的,如果我們想要看到歷史上取得過 SOTA 的模型和論文呢?
再往下拉頁面,就可以看到歷史上在該任務上取得過 SOTA 的榜單了。
你也可以點擊「數據集」、「模型」或「Metrics」進行排序。
如果你對某個研究感興趣,可以展開詳情,查看研究的出處論文。
某個 SOTA 研究的詳細信息。可以點擊「查看詳情」閱讀論文
這樣一來,「SOTA模型」如同一個強大的論文搜尋引擎,為你直接尋找機器學習中各種各樣的 SOTA 研究。它不僅僅會告訴你是什麼研究,還會提供研究使用的數據集、模型、取得的 SOTA 指標數值,以及什麼時候取得的 SOTA 結果。
全面系統的知識點歸檔
當然,你可能是一位剛剛入門機器學習的初學者,對於機器學習中的各項任務不太清楚。這時候,「SOTA模型」會是你很好的入門學習夥伴。如下圖所示,「SOTA模型」首頁會提供各個機器學習子領域的入口。
以「計算機視覺」為例,你可以點擊這一子領域,「SOTA模型」會提供這一領域的定義,並提供這一領域所涉及的基礎概念和技術方法。你可以根據需要選擇查看。
而在這一頁的下方,「SOTA模型」提供了這一領域所有涉及到的任務。如邊緣檢測、人臉識別等。
這時候,你就可以知道是否有自己需要了解的機器學習任務了。你可以點開其中的任務查看。對於一些非常火熱或成熟的研究領域,「SOTA模型」還提供了相關的活動、會議和期刊。
「人臉識別」任務下,提供了相關會議和期刊的信息
海量知識庫加持的模型庫
能夠提供如此豐富的 SOTA 論文信息,得益於機器之心背後強大的信息平台支持。在前幾個月,機器之心已上線了機器之心Pro,一個為企業、學者等各方提供專業人工智能信息服務的平台。在 Pro 平台上匯聚了海量機器學習相關信息,為「SOTA模型」提供數據加持,使得「SOTA模型」能夠更進一步,提供最為前沿的研究領域 SOTA 資訊和系統的機器學習知識。
目前「SOTA模型」中已涵蓋 15 個機器學習領域大類,共計 127 個機器學習任務,共收錄 SOTA 論文 1174 篇,歸檔模型 2031 個,有記錄的數據集總數為 561 個。我們也將持續更新數據。
能夠囊括如此之多的信息,離不開機器之心在機器學習領域的投入研究。為了提供 SOTA 論文的數據,「SOTA模型」投入了多數據源的自動化爬蟲和數據清理工具,使用了機器學習和自動化工具,對特定類型的數據進行結構化處理、數據校驗和去重工作。在論文數據方面,使用了論文文本數據分析和信息提取相關技術。
論文爆炸時代,更需要為讀者提供精準服務
每年,機器學習領域都會有大量的投稿論文,例如 2019 年的 CVPR 大會投稿數量就超過了 5000 篇,是 2018 年投稿數的兩倍。泥沙俱下的研究,增加了業內人士篩選優秀論文的成本。「SOTA 模型」產品的上線,標誌著機器之心信息服務進入了新的階段。
接下來,「SOTA 模型」將會進一步完善內容,增加更多、更為清晰和完善的數據。如果在現有的版本中沒能找到自己想要的數據,稍安勿躁,我們近期也將會添加近一倍的數據。假期歸來,想要了解某個技術領域或者做項目需要查找資源時,你就能用到。
同時我們也會提供更多的分析項目,並努力和機器之心現有的知識庫、新聞庫等模塊關聯。產品也會根據用戶的需求提供更為精準完善的數據分類和推薦、數據對比和可視化功能。
如果您在使用「SOTA 模型」過程中,有任何反饋,可以添加微信 lyz147147 溝通交流(請備註「SOTA模型反饋」)。
www.jiqizhixin.com/sota
PC 訪問,體驗更佳