對話 IEEE Fellow 俞益洲:進入深睿醫療後,我對醫學影像 AI 的新思考

尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️

加入LINE好友

「經世致用」是大多數中國學者的終極理想。在古代,做到理想的途徑是入仕為官,對應到現代,或許就是進入產業界。

作為一名學者,俞益洲已經攀上了山巔。今年11月,他先後獲得了2018 ACM傑出科學家和2019年度 IEEE Fellow兩大殊榮。為他贏得雙冕加身的主要有兩項研究成果:一是他早期做的基於圖像的建模和渲染方面的研究,其核心是將三維計算機視覺和圖形學相結合;二是近年來做的將機器學習和底層計算機視覺相結合的研究。這些研究工作在當時非常熱門和富有前瞻性,在行業內造成了巨大反響。

談到這些研究成果以及它們帶來的榮譽,俞益洲十分輕描淡寫,「這是對我過去工作的一種肯定,說明我的研究成果對別人有參考價值和借鑒意義。」

他沒有提到的是,這兩項榮譽也給他的職業生涯上半場畫上了一個完美的句號。

職業生涯的「下半場」

作為一個深居象牙塔十八載的學者,今年秋季,俞益洲正式加盟深睿醫療擔任首席科學家,這意味著他的工作重心將從學術界轉向產業界。促使他做出這項決定的,是內心對知識「經世致用」的渴望。

過去十幾年里,俞益洲一直在高校從事教學和研究工作,他的不少研究成果成功做到了產業化。比如他曾經作為主要成員研發的部分計算機視覺和圖形處理技術,被廣泛應用於《黑客帝國》、《碟中諜2》、《加勒比海盜3:世界的盡頭》等美國電影的特效製作。

但俞益洲始終認為,這種轉化並不徹底,也缺乏針對性,他希望自己的研究成果能夠在更關鍵的領域幫助到更多人。思慮再三,他決定走出象牙塔,投身到產業界親自推動學術研究成果的產品轉化。

俞益洲考慮過幾個方向——自動駕駛、安防和醫療。綜合考量後,他認為,自動駕駛雖然看起來和計算機視覺密切相關,但它對後者的依賴程度並沒有外界想像的那麼高,它更多是依靠傳感器等硬件設備,更偏向物聯網的概念。安防行業對計算機視覺技術的需求非常旺盛,不過這個行業已經非常成熟,盤踞著幾大巨頭,留給後來者的發揮空間不大。相比之下,醫學影像分析和計算機視覺有許多相通之處,醫學「懸壺濟世」的精神也更契合他對「經世致用」的想像。

再美好的理念也需要有承接的平台,俞益洲進入醫療行業,很大程度也歸因於深睿醫療團隊的吸引力。「他們的團隊非常強大,也具備很好的互補性」,俞益洲對雷鋒網說道。

早在正式加盟前,俞益洲就和深睿醫療有過很多接觸,過程中他逐漸對後者有了了解。深睿醫療董事長雷鳴是「百度七劍客」之一,他對技術和商業都擁有非常透徹的理解。CEO喬昕具備深厚的醫學背景,曾經先後在國內三甲醫院和西門子醫療位居要職。CTO李一鳴則曾經就職於百度和高德信息技術有限公司,在大數據和機器學習方面有著深厚的造詣。

多元融合的團隊基因使得深睿醫療能夠真正從臨床的角度出發思考問題 ,同時又很好地平衡了商業性,這是它最吸引俞益洲的地方,也是它能夠飛速成長的秘訣。

今年4月份,深睿醫療對外宣布完成B輪1.5億元融資,由君聯資本領投,聯想之星跟投。至此,成立剛剛一年時間,深睿醫療就累計獲得了3億元融資,這樣的融資速度在行業內實屬罕見。

半年後,深睿醫療又用產品實力詮釋了它被資本看好的原因。不久前,深睿醫療在CCR大會上一口氣發布了四大品類七款AI產品,對於一家成立不到兩年的公司來說,這樣的產品布局速度實在令人嘆為觀止。而這些產品身上融入了俞益洲的不少心血。

在現實性與前瞻性間平衡

以首席科學家的身份加盟後,俞益洲把更多精力投入到了深睿醫療的產品研發當中。在深睿醫療,他的主要職責是帶領公司的技術團隊——深睿研究院。和高校時期相比,新工作包含的內容更加複雜:一方面,他需要帶領研究院的算法團隊進行項目攻關;另一方面,公司正處於快速成長階段,他需要對外延攬人才,不斷為公司注入新鮮血液。

從計算機視覺到醫學影像分析,俞益洲的研究重心也發生了很多變化。計算機視覺和醫學影像分析有很多相通的地方,但後者也有其獨特的挑戰,比如訓練數據少,數據分布高度不均勻,數據標註的一致性較差,數據類型豐富(多模態影像,文本+影像)等等。

「這意味著我們需要專門為醫療場景設計一些圖像處理和分析的算法;比如研制可以在小樣本上訓練,但泛化性強、對數據分布不敏感、對標註一致性容忍度高的AI模型」,俞益洲向雷鋒網介紹道。

作為公司技術團隊的負責人,俞益洲不僅要帶領團隊做具體項目的技術攻關,還要和外部高校、科研院所合作,進行前瞻性技術的研發。如何平衡兩方面的工作,十分考驗管理者的主管藝術。俞益洲介紹,平衡的關鍵在於合理分工,「同一組人同時幹兩件事,可能什麼都幹不好」。深睿醫療內部80%的技術人員在從事產品級別的算法研發,剩下20%做前沿技術的探索。此外,深睿醫療還和10多家國內外頂級學術機構建立了長期學術科研合作,「兩邊相加,我們在前瞻性技術上投入的人力和資源並不少」。

事實證明,這種投入是意義重大且富有成效的。不久前,深睿醫療就聯合香港大學、中山大學推出了一項最新研究成果——通過一種新的、非局部的上下文編碼網路提高醫學圖像分割算法的魯棒性。

俞益洲介紹,在醫學圖像分析中,算法的魯棒性非常重要。如果算法對對抗噪聲的魯棒性較差,輸入的圖像稍有擾動,結果就會出現很大差異,這在臨床上是不可用的。遺憾的是,目前所有最新的、基於卷積神經網路的醫學圖像分割算法對對抗噪聲的抵抗性都比較差。主要原因在於,訓練醫學圖像分割算法的訓練集較小,經常導致過擬合,從而降低了模型的泛化能力。在自然圖像領域,這一問題已經得到了解決,但相同的對抗訓練策略放在醫學圖像上效果並不好。

為此,深睿醫療聯合香港大學、中山大學提出了通過非局部上下文編碼網路提高醫學圖像分割算法的魯棒性。從實際效果來看,這種方法在對抗噪聲環境下得到的結果「幾乎和沒有噪聲環境下得到的結果一樣。」這項研究成果將發表於一流的人工智能學術大會AAAI 2019.

那些不曾到過的遠方

雖然醫學影像分析算法的某些方面還有待提高,但總體而言,經過兩三年的發展,醫學影像AI已經步入了相對成熟的階段。典型表現之一就是產品形態更加多樣化了:過去行業內主要圍繞肺部CT和眼底彩照兩種影像數據進行產品開發;如今,針對更多病種和影像數據類型的算法已經初露端倪。

接下來,如何基於多模態影像數據進行綜合分析診斷也將成為企業的發力方向。俞益洲介紹,相比單模態數據,多模態數據綜合診斷的精確度更高,但這項技術也面臨不少挑戰。首先,這種方法需要的數據種類更多,給數據采集提出了挑戰;其次,多模態數據間的對準一直是全行業的技術難題;最後,圖像對準後如何將多種模態的數據融合,進行綜合分析,也有待進一步探索。

即便這些問題順利解決,基於醫學影像數據的診斷方法仍然存在局限性,我們還需要結合病史等文本信息進行綜合考量,這正是大部分醫生正在做的。醫療AI從業者們已經意識到了這個問題,也在朝這個方向努力。「可能在不久的將來我們就能看到一些研究成果」。

俞益洲認為,在深度學習等人工智能技術的帶動下,醫學正在從「基於征象的醫學」轉向「數據驅動的醫學」。他堅信,隨著技術發展,人工智能的知識和經驗一定能夠超越單個專家的水平,只是通往未來的路上還有許多障礙需要踏平。

對於俞益洲來說,踏足產業界並非終點,而恰恰是一個新的起點,他的研究和探索才剛剛開始。雷鋒網

About 尋夢園
尋夢園是台灣最大的聊天室及交友社群網站。 致力於發展能夠讓會員們彼此互動、盡情分享自我的平台。 擁有數百間不同的聊天室 ,讓您隨時隨地都能找到志同道合的好友!