尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️
【51CTO.com原創稿件】2018年,人工智能作為人類開創未來最耀眼的技術之一,正在深刻影響著全球產業結構、商業模式、城市形態以及人類生活工作方式。如何讓人工智能技術為行業賦能,讓眾多行業共享科技生產力,是數字化轉型浪潮下的重要課題。作為推動人工智能務實創新的年度重要活動,11月30日-12月1日,WOT2018全球人工智能技術峰會在北京·粵財JW萬豪酒店盛大召開。60+國內外人工智能一線精英大咖與千餘名業界專業人士齊聚現場,分享人工智能的平台工具、算法模型、語音視覺等技術內容,探討人工智能如何賦予行業新的活力。
12月1日上午,A會場推薦搜尋分論壇召開,三位資深專家受邀出席發表精彩演講。會後51CTO將專家發言整理成文,希望他們對於技術的理解和實踐中的解決方法能夠對大家有所借鑒。
張康 奇虎360人工智能研究院技術經理
深度推薦系統在360的應用
張康演講的主要內容是分享在360各種場景下,基於深度學習推薦系統的應用。他表示,最淺顯層次的推薦系統就是通過函數來建模。如果需要在抽象層次再深入一點,就是將簡單的數學公式拆分成不同的算法模塊,如召回、排序、策略。最後一個層次是把推薦系統服務於線上,主要由五大部分組成: ETL(數據清洗)、Server模塊、Platform(機器學習訓練平台)、A/B測試、報表。
他認為,現實生活中的深度推薦系統,很多論文中80%的內容會側重對模型部分的描寫,只有20%的內容留給實驗,而事實上實驗包含豐富內容,卻很容易被人忽視。他舉例說道,數據分析和清洗、特徵設計和交叉、模型對比、召回策略、重排序策略都有很多內容需要去實踐,而真正傳統意義上的實驗如測評、A/B,實驗分析,其實是和之前這幾項內容相互交接起來的。
深度推薦系統在360的應用主要有三個方面:APP推薦(360手機助手)、常搜詞(360搜尋&導航)、個性化消息推送(快視頻)。APP推薦算是他們整個團隊在推薦領域的第一次試水,他們最終建立一個多分類模型,引入圖像搜尋的方案,預測用戶安裝是否準確,最終交給業務部門做代理優化,反饋也比較好。「常搜詞」,就是用戶經常會搜的詞,張康介紹到,360導航每天都有好幾億的PV,因此他們需要進行天級離線更新,基於用戶的搜尋日志、瀏覽日志進行統計特徵。經過個性化+特徵優化後,這部分業務收入上升5%。
個性化消息推送的出發條件和時間條件跟用戶的個性化實時相關,並非每天定時定點推薦,內容與用戶行為相關,需要個性化推薦,對於「拉活」的意義非常大。他們先是針對語義、視覺、行為召回做優化,後來發現這樣用戶體驗並不好,還需要做召回數據流的優化、模型的更新、在線服務的調整等大量工作。除此之外,還要對視覺領域、語義模型、排序做優化。在架構上,既要有離線部分做到倒台服務和日志搜集、報表,也要跟業務方在線系統做實時交互,給業務有更多的活躍用戶。
王建強 Stitch Fix創始人、前Twitter高級技術主管
Stitch Fix : 基於算法推薦的背水一戰
王建強告訴聽眾,Stitch Fix是一家數據驅動的服裝新零售公司,100%的銷售都源於推薦和算法,其中在亞馬遜的銷售約35%都來自推薦,LinkedIn中50%用戶都來自推薦。Stitch Fix是一個盲盒模式銷售,即用戶收到衣服之前不知道收到的是哪些衣服,「我們會給用戶配送五件衣服,以快遞形式送到用戶家,用戶留下自己喜歡的,免費送回其他的衣服。」王建強表示,公司試錯成本比較高,還有雙向物流的支出,正是基於此,算法推薦的準確性對Stitch Fix是關乎企業生存能力的重要指標。
據他介紹,Stitch Fix有四個特點來幫助那些沒有時間逛商場或者不太精通穿搭的職場人士,即推薦的細顆粒度、低頻、自建庫存、人機耦合的模式做推薦。其中人機耦合的效果起到了1+1>2的效果,通過機器計算做到對大量庫存SKU篩選和排序,從大規模數據中找到Pattern,減輕了人工的壓力。
王建強在現場舉了一個算法推薦模型的實際應用案例。當造型師給用戶推薦衣服的時候,看到的是用戶的相關數據,如這位用戶30歲,是一個母親,號碼是超小號,生活在明尼蘇達,美國中西部的一個州。系統會把用戶的風格樣式劃分到七個緯度,每個緯度是一到四個打分,造型師會根據這個打分來判斷用戶的風格偏好。最後根據身材尺寸數據,造型師就可以比較有把握地給用戶推薦衣服。「在推薦主模型里,我們現在用的模型是混合效應模型,之所以選擇混合效應模型,有兩個因素,一個原因是,我們團隊主要是以統計背景為主。另外一個原因,混合效應模型,科技執行力會更高一些,精度也更高一些。」
蔣前程 美團高級算法技術專家
美團O2O服務搜尋的深度學習實踐
蔣前程表示,美團覆蓋了用戶吃住行遊購娛各個領域,年度活躍買家達3.1億,正因為服務種類多,所以也存在一個困擾就是如何快速地找到用戶想要的內容,這就是搜尋在美團平台上發揮的價值。據了解,服務搜尋大概會覆蓋40%的交易,每天服務的用戶產品量在億級別。
美團搜尋平台與傳統搜尋平台相比,有很多自己的特色和挑戰。蔣前程介紹到,首先用戶個性化需求更高,其次需求場景化,不同場景下數據和檢索層面都存在很大不同,再次是美團用戶具有非標屬性,產品沒有標準,即使同一個菜品,不同用戶喜歡也各不相同。此外還有實時化特點,上午在公司和晚上在家里對於美食的需求都不一樣。
那麼美團如何解決這些挑戰呢?蔣前程表示,總結起來就是通過兩個路徑——通過智能匹配技術找到用戶想要的,如何讓用戶更快速地找到,這兩點本質其實就是召回和排序。
智能匹配技術需要注意兩點,一是用戶意圖的匹配,二是周圍度的匹配。蔣前程舉了一個例子,例如在北京南站,用戶對餐飲的需求比較大,但是如果是第一次來北京或者是偶爾出差,那可能對住宿的需求就更多一些。所以即使在同一個地點,但是在不同場景下美團會呈現不同的內容。「在多維度方面,除了傳統的文本匹配,也加入了向量化召回的思路。」蔣前程解釋道,做好用戶匹配之後,即使給用戶推薦一百款內容,但是用戶最多看幾個,不滿意就會離開,因此,這就需要通過個性化排序來找到用戶最想要的內容。
個性化排序主要有三個層面:召回層、模型層、業務層。其中模型層演進到如今,已經進入實時化和深度學習階段。其中實時化需要通過特徵實時化和在線學習來做到。蔣前程重點講了美團深度學習的框架,它可以更好地支持非常大規模的數據和模型的在線支持、多種模型定義支持、流式模型訓練支持。「最終,美團訂單有明顯提升,在各個業務線上,我們現在的主體模型都是深度學習的模型,也是流式模型,都有非常正向的效果。」蔣前程總結道。
以上內容是51CTO記者根據WOT2018全球人工智能技術峰會的《推薦搜尋》分論壇演講內容整理,更多關於WOT的內容請關注51cto.com。
【51CTO原創稿件,合作站點轉載請註明原文作者和出處為51CTO.com】