阿裡斬獲AI領域 「奧斯卡」 四項冠軍,新研究可精準預測視訊目標位置

尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️

加入LINE好友

阿裡斬獲AI領域 「奧斯卡」 四項冠軍,新研究可精準預測視訊目標位置 科技 第1張

CVPR 是 AI 領域規模最大的會議,被譽為計算機視覺領域「奧斯卡」,其範圍涵蓋計算機視覺領域的前瞻學術研究和工業應用,會議的研究成果體現著視覺 AI 領域研究的趨勢。由於視訊會議、直播等應用逐漸普及,2020 年頂級科技公司的研究成果逐步從圖像延伸到視訊領域,涉及視訊壓縮、視訊分割、三維視覺等領域。

據介紹,阿裡參加的四項比賽均為視訊技術領域。在 DAVIS 挑戰賽中,阿裡達摩院團隊率先實現突破,力壓雪梨科技大學 ReLER 實驗室,以 84.1 的分數獲得了第一名,比 2019 年第一名的中興和華中科技大學聯合團隊高出 7.4 分。

阿裡斬獲AI領域 「奧斯卡」 四項冠軍,新研究可精準預測視訊目標位置 科技 第2張

圖 | 阿裡 AI 以 84.1 分的成就斬獲 DAVIS 比賽第一名

具體來說,阿裡參與的是 DAVIS 半監督賽道。要求是假設用戶不與算法交互以獲取分割掩膜,輸入值只給出第一幀的正確掩膜,算法需要在後續每一幀中實現對單個或多個目標的分割,也就是要把目標的像素標註出來。

如上圖所示,衡量分割準確率有兩種標準,分別以 J 和 F 為代號,代表區域相似度(Region Similarity)和輪廓準確度(Contour Accuracy)。前者測量正確像素的標註數量,後者測量目標輪廓的分割有多精準。最終成就是 J 和 F 標準的綜合分。

阿裡斬獲AI領域 「奧斯卡」 四項冠軍,新研究可精準預測視訊目標位置 科技 第3張

圖 | 阿裡 AI 可以基於視訊前一幀畫面,精準預測目標物體下一幀的位置

作為對比,今年 DAVIS 挑戰賽第二名 ReLER 實驗室提出的 CFBI + 算法,原本領先基礎 STMVOS 算法近 10 分,但阿裡團隊使用空間約束方法、新型訓練策略和微調等技術,將基礎算法的表現大幅提高了 12 分,摘下桂冠。

除獲得四項比賽冠軍,阿裡還有 17 篇論文入選 CVPR 2020,其中包括一篇自動駕駛領域的研究成果,該論文提出了一個通用、高性能的自動駕駛檢測器,首次實現 3D 物體檢測精度與速度的兼得,可以有效提升自動駕駛系統安全性能。

目前,阿裡視覺 AI 技術已在全球率先實現大規模落地。例如,城市大腦、拍立淘、優酷視訊等阿裡集團內部業務場景均已大規模使用該技術;阿裡 CT 影像 AI 已經服務全球 600 多家醫療機構,疫情期間已完成 50 餘萬例病例臨床診斷。

責編:胡巍巍

About 尋夢園
尋夢園是台灣最大的聊天室及交友社群網站。 致力於發展能夠讓會員們彼此互動、盡情分享自我的平台。 擁有數百間不同的聊天室 ,讓您隨時隨地都能找到志同道合的好友!