2019年人工智能領域預測與展望

尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️

加入LINE好友

2019年人工智能領域預測與展望

【網易智能訊 1月2日消息】2019里人工智能領域會出現怎樣的演變呢?相比之前幾年會有什麼樣的變化呢?

人工智能正主導著全球企業的創新——無論是大型企業集團還是年輕的初創企業。據市場研究報告《從技術和垂直行業看人工智能市場——全球機會分析和行業預測》稱,2018年至2025年,全球人工智能市場規模預計將從2016年的40.65億美元增長至1694.11億美元,復合年增長率達到55.6%。該報告按技術、行業垂直和地區來劃分人工智能市場。人工智能技術被細分為機器學習、自然語言處理、圖像處理和語音識別。2016年,在營收方面,機器學習領域主導了人工智能市場,得益於人工智能行業解決方案的需求增加,預計未來幾年這一趨勢將會延續下去。根據Statista的數據,最大的營收部分來自面向企業應用程序市場的人工智能。

以下是對2019年人工智能領域的預測:

IBM、Google、微軟、亞馬遜以及機器學習API提供商將發布更具包容性的數據集,以應對人工智能內嵌的歧視和偏見問題

機器學習是人工智能的主要形式,已被成功應用到多個不同的領域,比如亞馬遜智能助手Alexa上的語音識別,Facebook自動標記照片功能的人臉識別,無人駕駛汽車當中的行人檢測,甚至基於你訪問電子商務網站的記錄決定向你展示鞋子廣告等。在機器學習中,決策是從人類決策和標籤的現有數據記錄中學習的。因此,為了讓計算機區分狗和貓,我們向它展示了許多帶標記的狗的圖像和許多帶標記的貓的圖像,讓它學習了解二者之間的區別。這種看似無害的方法本身帶來了一個嚴重的問題——偏見。如果我們盲目地把人類的標記和決策輸入電腦,電腦可能會完全復制我們的偏見。臭名昭著的微軟Tay機器人便是前車之鑒。

更糟糕但更微妙的是,來自數據本身的偏見並不能代表我們想要了解的廣大群體。例如,今年早些時候,喬伊·布洛沃米(Joy Buolawumi)和蒂尼特·格布魯(Timnit Gebru)的研究表明,在對一個人的性別進行分類的任務中,主流的商用計算機視覺產品在被灌輸淺膚色男性的圖像時表現最佳,在被灌輸深膚色女性的圖像時表現最差。如果我們訓練這些分類器所用的數據集沒有包含足夠多的正確標記的有色人種,也沒有捕捉到更廣泛的文化差異(不管來自哪里),這會是一個巨大的問題。

在這些非包容性數據集上訓練的機器學習模型所做的關於樣本不足的人的決策顯然是有缺陷的。2019年,我們將會看到擁有主流計算機視覺產品的大公司公開發布更具包容性的數據集。這些數據集將在地理、種族、性別、文化概念以及其他維度上變得更加均衡,它們的公開發布也將驅動研究者展開研究將人工智能的偏見最小化。

隨著讓人工智能的決策變得更容易解釋的產品逐漸成為主流,醫療和金融服務領域將會更多地採用人工智能

當人工智能基於算法作出可輕易解釋的決策時,生活要簡單得多。例如,算法首先了解你是否頭痛,然後看看你是否發燒,然後得出你患了流感的結論,這個過程是可以解釋的。只要算法如何作出決定是可以解釋的,無論它的預測是對是錯,它都具有巨大的價值。

在像醫學這樣我們可能會用機器做出生死攸關的決定的領域,能夠追溯理解為什麼機器會給出特定的行動建議顯然非常重要。在金融等領域,這一點也至關重要。如果人工智能算法拒絕向某人提供貸款,我們很有必要理解其中的原因——尤其重要的是要確保它不存在毫無緣由的歧視。隨著人工智能變得越來越成功,它更依賴於一種被稱為「深度學習」的技術,這種技術利用了許多的神經網路層(因此其名稱帶有「深度」一詞)。在這些系統中,沒有明確的方法來解釋發生了什麼,以及機器的決策原因。這個系統就像一個極其精確的黑匣子,可以接收一系列症狀、測量數據、圖像以及病人的狀態和病史數據,並能輸出高度準確的診斷結果。

例如,GoogleAI可以通過檢查你的眼睛來預測你是否有患心臟病的風險!你的眼睛到底有什麼毛病?沒有人會輕易認為自己的眼睛有毛病!2019年,隨著初創企業和大公司尋求推動金融和醫療等行業採用人工智能,將會有專門針對這些行業的商業支持系統,幫助我們反思深層神經網路,並讓我們更好地解釋人工智能的預測。企業將會嘗試將這些預測的解釋流程完全自動化,但成功的做法將會是,使得人類能夠調查探究「黑盒子」,更好地理解它的決策,這樣機器背後的人類可以提出自己的解釋。

算法VS算法。除了「假新聞」,還會有其它領域的人工智能系統受到基於人工智能的攻擊

隨著生成逼真的虛假圖像和視頻的技術不斷進步,以及欺騙機器學習算法的新方法的出現(例如假新聞)——自動駕駛汽車和其他關鍵任務系統將面臨新的安全問題。到目前為止,公眾的關注主要集中在圖像、視頻和音頻上面——泛泛地說,就是「假媒體」和「假新聞」泛濫成災——但在2019年,我們將看到某種攻擊示範:產生令人信服但虛假的結構化和非結構化文本數據,導致機器在一些問題的自動化決策上出錯,比如信用評分和從文件中提取數據。

遷移學習和模擬成為主流,幫助企業克服冷啟動問題和避免高企的培訓數據積累成本

大多數人工智能項目的成功在很大程度上取決於是否擁有高質量的、帶標記的數據。大多數項目都死在這個問題上,因為它們通常都沒有關於手頭問題的現成數據,又或者很難手工標記所有現有的數據。

例如,即使是像預測客戶是否會購買產品這樣簡單的事情,在起初沒有客戶的時候也會遇到冷啟動問題。如果你的生意一直都沒能做大,那麼你就永遠不會得到在利用最強大技術上可能必不可少的「大數據」。更糟糕的是,在需要專業知識的情況中(例如,給腫瘤貼標籤),獲得數千個數據標記的成本極其高昂。

人工智能研究的一個活躍領域是如何應對這種挑戰。在只有少量數據的情況下,我們如何能用上強大的深度學習技術呢?2019年,有兩種方法將在企業內得到更多的採用。第一個有效的方法是遷移學習——從一個有大量數據的領域中學習的模型被用來重新訓練機器在另一個數據少得多的領域中學習。例如,Landing AI?能夠通過僅僅使用少數有缺陷的產品的例子來檢測生產線上目標對象的缺陷。現在任何人都可以先從從像ImageNet這樣的大型數據集學習了大量關於圖像的知識的模型著手,訓練專門的物體分類器(比如區分損壞的汽車或房屋,自動處理保險)。這些領域也不必基於相同的數據類型。研究人員使用從圖像數據庫學習的模型來訓練分類器,獲取傳感器數據。

第二種方法是合成數據生成和模擬。生成式對抗網路可讓我們創造非常逼真的數據。眾所周知,英偉達公司使用生成式對抗網路生成了虛擬但非常引人註目的名人面孔。自動駕駛汽車公司們還創建了虛擬的模擬場景,在這些場景中,它們能夠在比現實生活中更大的距離上訓練自己的駕駛算法。例如,Waymo無人駕駛汽車在模擬中行駛了50億英里,在現實世界的道路上則僅僅行駛了8英里。2019年,企業將利用模擬、虛擬現實和合成數據來在機器學習上取得巨大的進展。而在以前,由於數據方面的局限性,這是不可能做到的。

越來越多的隱私要求將推動更多的人工智能發生在邊緣設備上,大型互聯網巨頭將紛紛投資於邊緣人工智能,以獲得競爭優勢

隨著消費者對於將自己所有的數據都交給大型互聯網公司變得越來越警覺,可提供不需要將數據上傳到雲端的服務的企業將享有競爭優勢。業界普遍認為,產品服務必須要使用雲端才能進行像臉部識別和語音識別這樣的昂貴的機器學習運算,但是硬件的進步和人們隱私保護意識的增強,將會推動更多的機器學習運算直接髮生在手機和更小的邊緣設備上,進而減少將潛在的敏感數據發送到中央服務器的需要。這一趨勢還處於早期階段,蘋果等公司在移動設備上進行智能處理(運行機器學習模型),而不是在雲上(例如,使用CoreML和它專用的神經引擎晶片,Google也已宣布推出TPU邊緣產品)。2019年,這一趨勢將會加速發展,移動化、智能家居和物聯網生態系統將會推動機器學習發生在邊緣設備上。(編譯/樂邦)

About 尋夢園
尋夢園是台灣最大的聊天室及交友社群網站。 致力於發展能夠讓會員們彼此互動、盡情分享自我的平台。 擁有數百間不同的聊天室 ,讓您隨時隨地都能找到志同道合的好友!