尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️
李飛飛、吳恩達(Andrew Ng)、李開復、鄧力……無論是深度學習、視覺識別,還是語音識別,我們看到華人及華裔科學家在人工智能研究領域,占據了相當的分量。
在我的採訪中,很多科學家都覺得中國在人工智能領域有很大的優勢。
首先,中國的理工科教育非常先進,中國有很多聰明的人會主動選擇學理工科,中國人的數學一般也比外國人學得好,這些對機器學習的基礎有很大的幫助。
其次,人工智能需要大量數據,才能做出很棒的成果,中國人口基數大,能夠提供很多的數據,在很多領域可以達到更高的識別率或提出更好的解決方案。加上中國人理工科方面有很大的優勢,所以中國的很多高等科研機構都已經在人工智能領域做出卓越的成果。
近年來,在各大重要的學術期刊上,中國人在人工智能領域發表的文章數量應該是除美國之外最多的。據說歐巴馬曾經問喬布斯能不能把智慧型手機的製造全都搬到美國,喬布斯說:「可以啊,如果你有像中國那麼多的工程師就行。」雖然不知道這個笑話是否屬實,但不可否認的是,中國已經是世界科技發展中舉足輕重、不可或缺的力量。
上述四位大名鼎鼎的科學家,他們或不是中國國籍,或長期旅居海外。在中國本土,有一家從幾個小青年在門面房創業的小公司,如今已經成長為市值超過五百多億元的上市公司,被稱為「中國聲谷」,它就是坐落於中國合肥的科大訊飛。
「讓世界聆聽我們的聲音」,是在科大訊飛大樓里隨處可見的標語,科大訊飛執行總裁、消費者事業群總裁胡鬱先生如數家珍般列舉了他們所取得的成就:
2008年至今,科大訊飛連續在國際說話人、語種識別評測大賽中名列前茅;自90年代中期以來,科大訊飛在歷次的國內外語音合成評測中,各項關鍵指標均名列第一;
2014年,科大訊飛首次參加國際口語機器翻譯評測比賽(International Workshop on Spoken Language Translation),即在中英和英中互譯方向中以顯著優勢勇獲第一;
2016年,國際語音識別大賽(CHiME)上,科大訊飛取得全部指標第一;在認知智能領域,2016年相繼獲得國際認證認知智能測試(Winograd Schema Challenge)全球第一、國際知識圖譜構建大賽(NIST TAC Knowledge Base Population Entity Discovery and Linking Track)核心任務全球第一;
2017年3月,MIT發布十大突破性技術進展,科大訊飛入選強化學習,刷臉支付兩大突破性技術研究者名單,在中國人工智能企業中排名第一;2017年6月,MIT科技評論發布2017全球50大最聰明公司榜單,科大訊飛首次入榜,並名列全球第六、中國第一;口語測評(根據你英語的發音來評價你的發音準確程度、詞匯量和語法句法)技術在世界上獨一無二。
提起今天的累累碩果,胡鬱神采飛揚,卻也沒有忘記曾經的「黑歷史」。2007年,他們策劃利用互聯網的方法來進行語音識別,但是想的是有人把他的錄音傳到網上,然後通過機器轉化成文字傳給他。
在2009年、2010年兩次國際會議上,胡鬱等人發現同行們對智慧型手機端的語音識別和交互技術已經做了很多有價值的嘗試,他們回國後就立馬調轉方向,從PC端轉向移動互聯網端。
但是的一個難點就在於,網路傳輸的速度很慢,怎樣既能夠保證語音的帶寬壓縮以後,帶寬足夠小,同時又能保證後面的音質可以被使用,團隊為此用盡了各種方法。
即使這樣,在2010年中國第二次雲計算大會上,科大訊飛通過語音文本,率先推出了手機語音識別系統,第一次展示了在智能語音手機里面通過語音輸入文本,現場的識別正確率只有50%左右。
多年後,再說起這段往事,胡鬱不禁莞爾,面對當時尷尬的洋相,在現場演示的他們「緊張是肯定的」,但他們也知道這是個客觀規律,因為你邁出這一步,永遠都不會知道自己的潛能在哪里。回去後,這幫「創業汪」鉚足了勁兒,快馬加鞭地進行改進。一年以後,識別率和回頭率超過80%,現在已經達到90%。
在胡鬱的引領下,我參觀了科大訊飛的演示廳,無論是將語音轉化成文字,還是將方言翻譯成普通話,將英文翻譯成中文,或者通過遙控器語音遙控電視,速度都非常快。雖然機器沒有翻譯出我說的上海話,不過我想這幫極客們一定會很快解決。
——摘自楊瀾新作《人工智能真的來了》
後續我們將繼續為您分享人工智能精彩專題,敬請期待!
更好的自己