尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️
人工智能技術是當今炙手可熱的技術領域,它在製造、家居、零售、交通、安防等行業的應用已經是大勢所趨。在本月雲棲Techday音視頻技術沙龍中,阿里雲視頻雲產品專家肖長傑為我們分享了一些AI技術在視頻中應用的小趨勢,帶大家回顧了AI是如何滲透到了短視頻生產中的各個環節中的。
趨勢一:AI技術創新已經滲透到了短視頻各個環節。
可能我們沒有注意到,其實人工智能技術已經應用到了視頻的生產、傳輸、消費等各個階段。比如,在用戶創作階段,基於人臉識別及跟蹤技術做到瘦臉、大眼、美白功能已經相當常見;當視頻上傳到服務端之後,我們會對視頻內容進行審核、去重、溯源等處理,並進一步對視頻的打標、分類,同時採用AI技術去定義最有美學感的封面,便於完成用戶個性化搜尋、智能推薦等動作,提升用戶的點擊率和體驗。
趨勢二:算法在數據積累到一個臨界點後,才會帶來爆發。
這里舉個我們非常熟悉的例子,今年9月,移動資訊的獨角獸平台趣頭條赴美上市了,股價更是一路飆漲。趣頭條的安裝用戶數在2018年達到一定數量級,伴隨著用戶數增多,上傳視頻數也成倍增長,所以到達了某個數據積累的臨界點之後,個性化推薦的算法開始發揮其強大的作用,用戶DAU激增。
趨勢三:用戶對視頻質量要求高,短視頻雖短,但處理流程趨於精細化。
移動互聯網時代視頻量暴增起來,但是其中不乏一些低質量的內容,比如一些互聯網搬運工的作品,他們在網上下載視頻後經過批量地二次加工,再上傳到網上去。這種情況對於原創者是個致命的打擊,同時也影響了平台的用戶體驗。所以,現在一般平台都採用多重方式,對視頻的質量進行把控審核。處理流程大概是:面對平台100個視頻,去重和版權違規過濾掉一些視頻,涉黃又過濾了一部分視頻,最終到轉碼的時候可能只有70個視頻,整個處理流程變成的好處是,轉碼和存儲的量會大大降低,用戶體驗也會相應提升。
阿里雲視頻AI解決方案典型場景分析
採用視頻DNA技術做到視頻的去重、溯源與盜版打擊
短視頻平台通常會面臨視頻大量重復的情況,所以在整個視頻AI的應用中,怎麼樣去辨別視頻的唯一性,以及根據內容分析來追溯視頻來源是第一步關鍵所在。比如下面的攻擊舉例中,視頻左下角的黑色鍵盤被稍稍做了一點改動,又上傳到平台上了,這樣的重復內容破壞了用戶的體驗,又會給平台帶來大量數據冗餘,也損害了原創者的利益,視頻AI就可以幫助平台高效地判定對視頻的剪拼改編行為。
這里面所用到的視頻DNA,它的技術原理是:當你上傳一個視頻的時候,可以生成唯一的指紋,指紋的特性是唯一性,即兩個不同視頻擁有相同DNA的幾率低於千萬分之一,接近於0,同時具有穩定性,它不會隨音視頻文件的格式轉換、剪輯拼接、壓縮、旋轉、增加logo等變換而變化。所以當其他視頻上傳的視頻,你就可以再在視頻庫中與現有視頻做檢索比對,相似性達到一定程度,就被證明重復性視頻。
同時,我們運用視頻DNA在做相似性溯源的時候,會對視頻內容關聯關係進行挖掘,對視頻內容製作路徑溯源。它的應用場景是:平台可以先將電視劇的長視頻錄入庫中,當用戶看了長視頻後,可以把相應的短視頻做推薦,根據用戶偏好進行推送,提升用戶體驗。
此外,視頻DNA可以配合DRM數字版權保護技術(沒有授權的帳號不能播放)和視頻水印(專屬LOGO識別),更好的打擊行業盜版。
談到盜版,還有非常關鍵的一步是存證。視頻DNA和存證體系做關聯,推出了可信數字內容版權服務。方案運用了區塊鏈將DNA等關鍵信息上鏈,做到多方透明共享、無法篡改和刪除,進而構建擁有版權存證、侵權追溯和版權交易等能力的平台。可以重塑版權價值,並提供侵權監測、法律維權、IP孵化等相關服務,進而助力提升全社會的版權意識。
更低成高效率的視頻審核
在最開始第三個趨勢中,我們也提到,視頻在去重後會進入審核階段。低成本高危視頻審核方案可以針對色情、廣告、暴恐、涉政、不良場景、視頻黑庫等做審核,它具備兩個特點,第一是色情圖片識別準確度高於90%,模型高度靈活,可根據用戶要求實時調整生效;第二是能夠針對二維碼、文字、logo等內容多層防護,層層過濾,以最快的速度達到最大的效果。
通常內容審核需要截取視頻幀進行排查,那在直播中,我們通過業務截幀策略決策系統,先判斷是否是高危業務,如果是高危的話,進行高頻截幀,加大審核力度,如果不是高危業務,可直接進行關鍵幀截取,排除違禁內容。這樣可以做到成本的節約與效率提升。
更「智能」的視頻轉碼——窄帶高清2.0
對點播來說,單視頻帶來的流量帶寬非常大,那麼如果有一種技術能讓熱點視頻的單視頻帶寬都相應減少的話,那對整個流量帶寬的節省是非常有效的。
阿里的窄帶高清技術精髓就在於使每一個碼率分配到最需要它的地方,利用人眼習慣來強化聚焦區域的碼率,在脫焦區域少配合一些碼率,通過幀間、幀內的碼率分配,讓整個視頻的質量更高。在節省碼率的同時,也能提供更加清晰的觀看體驗,同等視頻質量下最高節省 20-40%帶寬。
基於視頻內容分析搭建智能推薦與智能生產系統
內容分析和用戶標籤挖掘是搭建推薦系統的基石。它可以應用在兩個場景之中,第一個場景是:當上傳一個短視頻,系統會將其先拆成最低的元素:聲音、圖片、文字等,對基本維度做一些識別與分析,進而對視頻採取分類、打標籤等動作,選取最佳的視頻封面,對於後續的廣告推薦、內容個性化推薦有了基礎輸出。以下整個過程可以在阿里雲官網的視網膜系統中體驗:https://retina.aliyun.com
第一個是通過內容分析幫助視頻內容更好地消費,那麼反過來思考,我們的視頻如果都是人去產生,是不是效率太低了呢?我們能不能通過一篇文章、一句話、甚至一個標籤,生成一段視頻?
所以有了第二個應用場景,通過視頻智能產生系統,輸入視頻、音頻、文字等信息,一系列分析後,可以從庫里拿一些圖片、文字、聲音,去生成一個視頻。在今年世界盃的時候,阿里雲視頻AI技術通過下圖的方案,在比賽結束後幾分鐘內快速生成了明星集錦視頻,點擊跳轉查看集錦
以上視頻都是機器自動生成的,極大地提高了視頻生產效率。
作者:樰籬
本文為雲棲社區原創內容,未經允許不得轉載。