幾個月前,用戶@將記憶深埋 在微博表示:鑒於很多人都在說碼農是各種退休女生的接盤俠,我聯合了幾個小夥伴準備把1024、91等各種知名或者不知名網站上的視頻及圖片打tags去做匹配。為碼農朋友們做一個初步過濾。
最近,該用戶表示,經過了半年的時間,采集了100多TB的數據,利用1024、91等網站采集的數據對比Facebook、Instagram、tiktok、抖音、微博等社交媒體,在全球範圍內成功的識別了10萬多從事不可描述行業的女生。(使用Face Recognition/Identification和Behavior Recognition 對 Spider 抓取)
針對何時開放的問題,作者表示短期內並沒有計劃開放API或查詢頁面,因為數據公布後可能涉嫌違反當地法律,需要做進一步的脫敏處理和考慮返回結果的顆粒細度。鑒於很多說偷拍視頻存在的問題,在解決法律風險的情況下合法的產品對外發布時,我會單獨把偷拍數據比對放在另外個數據庫。僅供本人通過eID 實名登錄後並人臉識別認證了才能查詢本人是否存在網上存在或存在過不雅視頻或照片。
同時也看到有網友留言說做一個男版的,由於現在算力和存儲有限,後續會考慮增加新的存儲和算力來做。
關於能否識別美顏,作者表示目前通過步態分析、VPR以及其他身體特徵來進行美顏和deepfakes的對抗。基本達到90%的有效識別率。假的始終是假的,偽裝總要剝去。至於某些對聲音語氣模仿的系統,聲紋檢測能達到100%的有效識別率。因為要商業化,paper就不公開了。
目前作者微博下面一片罵聲,很多都是頂著網紅頭像,性別為女的用戶,表現得也是相當的精彩。