探訪綠城數據「貼標員」 他們讓人工智能更聰明

尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️

加入LINE好友

鄭州觀察記者 李林

綠城鄭州,天寒地凍,但一批人工智能(下稱AI)數據「貼標員」卻忙得如火如荼。 他們是一批什麼樣的人,從事著什麼內容的工作?在最先進的人工智能行業扮演著什麼樣的角色,又會在AI的世界中有何作為?

1月7日,記者走進鄭州一家名為「點我」的科技公司,探訪AI數據「貼標」這一新業態的發展情況。

河南日報1月8日第9版截圖▲

AI航母上的「螺絲釘」

剛走進這家公司,記者的採訪就不得不先調至「靜音」模式,因為偌大的辦公區安靜至極,一群年輕人端坐在電腦前,一言不發,都各自緊盯螢幕,右手不停點擊滑鼠,隨之螢幕上的箭頭在一張張大同小異的照片上反復閃動。

公司負責人韓錦晧是位85後,他把記者讓進里間,才開始調高嗓門的音量。「‘貼標員’從事的是AI數據標註工作,簡單說就是按照不同任務要求將照片的特定細節進行標註,以便人工智能算法進行學習和測試。」他說,比如人工智能「識別」一只水杯,它需要看到關於杯子的大量圖片數據來建立認知,越複雜的人工智能算法需要的標註數據就越多,所以「貼標員」有了大量的就業崗位和生存機會。

22歲的陳怡在這家公司做「貼標員」快一年了,他告訴記者,在這兒每天至少工作8個小時,標註處理的照片從30張到50張不等,每月能領4000元左右的薪水。「標註照片不複雜,對從業者的學歷沒有嚴格要求,但想成為一名優秀的‘貼標員’,需要用大量的時間進行實際操作。」陳怡趁接水的空隙和記者聊了幾句,回到座位前他轉動了幾下有點僵硬的腰和脖子。

陳怡感嘆,「貼標員」其實就是AI航母上的「螺絲釘」,乾的是最基礎的工作,但又是人工智能不可或缺的人工部分。

「數據貼標」如滾動的「春潮」

AI的世界里,一切都很快。

從2017年下半年開始接觸數據標註,韓錦晧就迎來了行業的「春天」,他迅速擴大公司規模,一度擁有上百名員工。

由於鄭州從業者眾多,組織培訓便捷,來自全國各地的數據標註合同紛至沓來,頭腦靈活的韓錦晧迅速建起了「數據標註聯盟」平台,聯合本地甚至省外的企業共同接單、共享利益。

「平台吸引了不少鄭州數據標註公司的加盟,其中最大的公司‘貼標員’能超過500人。」韓錦晧回憶說,在2018年上半年,鄭州數據標註行業的規模與效益幾乎同時達到了峰值。

但是,「春潮」是快速滾動的。

「數據標註目前主要拼的還是人海戰術。」韓錦晧坦言,「一旦薪水下降,就留不住人。現在,公司里的‘貼標員’也在減少。」

與之同頻的是整個鄭州市區的數據標註企業都在不同程度「縮水」,而周邊縣城、村莊憑借人力、房租成本優勢迅速崛起。

「我們必須先人一步。」韓錦晧說,這次他和小夥伴正著手利用AI的核心算法為數據標註完成智能「預算」,通過機器減少人工,把數據標註的「體力活」部分升級為「腦力活」,用科技降低成本,重新贏回市場。

採訪臨近結束,已經過了午飯時間,幾份放涼的外賣還沒來得及打開,「貼標員」還在廢寢忘食地工作……

名詞解釋

數據標註:數據標註是人工智能的專業用語,是通過對圖片進行分類、畫框、註釋、標記等方式,為人工智能的核心算法提供數據資料的工作。比如,想讓人工智能機器識別一種物體,就需要先提供大量該物體的圖片給機器「學習」,而數據標註所負責的就是提供大量被標記的圖片。目前這種工作絕大多數由人工完成,從業者被稱為「貼標員」。

業內人士指出,數據標註可以說是伴隨AI而誕生的一種新工作。在未來AI發展良好的前提下,數據的缺口一定是巨大的。可以預見3至5年內會一直存在對數據「貼標員」的需求。

來源 河南日報

編輯 陳冠男

About 尋夢園
尋夢園是台灣最大的聊天室及交友社群網站。 致力於發展能夠讓會員們彼此互動、盡情分享自我的平台。 擁有數百間不同的聊天室 ,讓您隨時隨地都能找到志同道合的好友!