尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️
AI是人類想要做到真正自由的夢想,到那時很多工作都會自動化,但在此之前,達到這一目標需要投入大量的勞力力。而中國甚至全球的人工智能產業飛速發展的背後是無數年輕工人作支撐,他們拿著低薪做著數據貼標工作,服務著國際科技巨頭。
圖 | Pixabay
多年前就有人提出,數據就是新的石油。
而如果數據是新的能源和寶藏,那麼中國已經成為最大的生產國。這所工廠擠滿了勞力者,他們正努力為機器學習標註圖像和數據。
機器學習的訓練需要大量數據,在過去十年中,機器學習對高質量手工標註數據的需求飆升。一位在數據標籤公司工作的年輕人說:「我曾經認為機器是天才,但現在我才知道我們(人類勞力者)才是它們成為天才的背後原因。」
所有新興行業,包括人工智能,都伴隨著新型藍領勞力力的需求激增。在從事AI相關的公司內,比老一代更精通技術的年輕工人正在從事手工標記數據工作。
圖 | 南華早報
這些年輕員工通常分布在較小的城市里,而這些小城市擁有多家AI初創公司,而這些公司存在的唯一目的是為大型機器學習公司提供高質量的數據。此前,我們也報導過這一產業現象:在河南一些農村地區,有一大群年輕人正成為「數據貼標人」,他們每天坐在電腦前八小時,點擊幾十張照片,概述背景、前景和特定物品。
AI產業成為勞力密集型工作?
《Throwing Rocks at the Google Bus》一書的作者Rushkoff說:「(未來)找工作會更難,每個勞力者付出更多的時間卻只能換來用更少的錢。技術似乎讓我們永遠處於這樣一個狀態,在這種狀態下,勞力力和數據甚至時間都是從人類身上‘壓榨’出來。」
在這樣一個時代,數據標記工作似乎已經成為保住年輕人飯碗的藍領工作,幫助他們遠離AI時代下的失業危機。年輕一代似乎能夠養活AI野獸而不是被它們吞噬。
一個典型的例子是位於北京的創業公司Mada Code,大概擁有自由員工10000人。這些自由職業者為各種任務標記數據,如光學字符識別(OCR)和自然語言處理。該公司將微軟、卡內基-梅隆大學和其他國際公司及機構都視為客戶。
圖 | Pixabay
這些年輕人有兩種工作形式:一種通過網路在線形式,人們可以通過移動應用程序標記圖片;另一種形式則在線下,工廠里滿滿都是「數據貼標人」,他們坐在電腦前,輪流做手工標記。
AI應該是人類想要做到真正自由的夢想,許多工作都能做到自動化。但在我們到達這樣的理想境界之前,世界需要一大堆人類從事標記工作,這項工作可能是非常苛刻,也很單調乏味。
最低薪水、最少福利,為矽谷巨頭們工作
沒有手工標記就沒有機器學習,因此人工智能生態系統需要這樣的行業。
正如一位中國數據標籤公司的聯合創始人所說:「我們是數字世界的建築工人。我們的工作是不斷地鋪蓋一塊又一塊磚。但如果沒有我們在人工智能中發揮的重要作用,他們無法建造AI這座摩天大樓。」
但這些工廠的情況與矽谷的豪華辦公室或北京深圳的中國科技中心截然不同。這些勞力者的薪水很低,也不像許多科技公司還提供免費餐飲,更不可能有醫療保健甚至台球桌那樣的其他福利。
圖 | Pixabay
但是沒有這些勞力者,人工智能的革命幾乎是不可能成功的。
這其實是一個積極的推動力,在勞力成本低得多的地區完成部分工作,可以進一步降低產業成本。在訓練數據時,有些任務比其他任務困難得多,就像人體標記任務比別的都要困難得多,每個對象需要標記15-40個點。
Mada Code的項目經理說:「就像10年前那樣,那時還沒出現iPhone或富士康員工。我想當一些工作被取代時,總會有一些新工作崗位出現。」
來源:analytics india magzine
編輯:木青