喂養(yǎng)AI大模型的小鎮(zhèn)青年:數(shù)字時代的隱形勞動者
本文來自微信公眾號:動察Beating,作者:?
山西大同,這座曾以煤炭為支柱的城市,如今洗去煤灰,將目光投向了無形的數(shù)據(jù)礦山。
平城區(qū)金貿(mào)國際中心的寫字樓里,沒有了升降井與運煤車,取而代之的是上千個電腦工位。上海潤迅云中聲谷大數(shù)據(jù)智慧服務基地占據(jù)數(shù)層樓,數(shù)千名戴耳機的年輕員工盯著屏幕,重復著點擊、拖拽、框選的動作。
官方數(shù)據(jù)顯示,截至2025年11月,大同已投運服務器74.5萬臺,引進69家呼叫標注數(shù)據(jù)企業(yè),帶動超3萬人次就近就業(yè),產(chǎn)值達7.5億元,94%從業(yè)者為本地戶籍。
不止大同,國家數(shù)據(jù)局首批數(shù)據(jù)標注基地中,山西永和縣、貴州畢節(jié)、云南蒙自等中西部縣城也在列。永和縣基地80%是女性員工,多為農(nóng)村寶媽或返鄉(xiāng)青年。
百年前英國曼徹斯特紡織廠擠滿失地農(nóng)民,如今偏遠縣城的電腦前,坐著在實體經(jīng)濟中難尋位置的年輕人。他們從事著看似未來感卻原始的計件工作,為北京、深圳和硅谷的AI巨頭生產(chǎn)大模型所需的數(shù)據(jù)“飼料”。
沒人覺得這有何不妥。
黃土高原上的新流水線
數(shù)據(jù)標注的本質(zhì)是教機器認知世界。自動駕駛需識別紅綠燈與行人,大模型要分辨貓和狗,機器無常識,需人類在圖片上畫框標注,它才能通過千萬張圖學會自主辨認。
這份工作無需高學歷,只要耐心和靈活的食指。2017年黃金期,一個簡單2D框能賣一毛多,甚至有公司開5毛高價,手速快的標注員一天干十幾小時能賺五六百,在縣城算高薪體面工作。
但大模型進化后,流水線的殘酷性顯現(xiàn)。2023年,簡單圖像標注單價跌至3-4分錢,跌幅超90%;難度更高的3D點云圖,標注員需在三維空間拉立體框包裹車輛或行人,一個復雜3D框也僅5分錢。

單價暴跌直接導致勞動強度劇增。為保住每月兩三千底薪,標注員需不斷提升手速。這并非輕松白領工作,許多基地管理嚴苛,上班不能接電話,手機鎖進儲物格,系統(tǒng)記錄鼠標軌跡和停留時間,停超三分鐘就會收到警告。
更崩潰的是容錯率,行業(yè)及格線常超95%,有的公司要求98%-99%,拉100個框錯2個就需返修。動態(tài)圖連幀、車輛遮擋需聯(lián)想找出;3D點云圖超10個點的物體必須畫框,復雜車位項目易因線長、漏標被質(zhì)檢挑錯,一張圖返修四五次是常態(tài),一小時工作可能僅賺幾毛錢。
湖南一位標注員曬出結(jié)算單,一天拉700多個框,單價4分,總收入30.2元。
這是割裂的圖景:一邊是發(fā)布會上科技大佬暢談AGI解放人類;另一邊是黃土高原和西南大山縣城的年輕人,每天盯屏幕8-10小時機械拉框,甚至做夢都在畫車道線。
有人說,人工智能外表是豪車,打開車門卻有一百人騎自行車拼命踩踏板。
沒人覺得這有何不妥。
教機器“如何去愛”的計件工
圖像識別瓶頸突破后,大模型向深層進化,需學會人類般思考、對話,甚至展現(xiàn)“同理心”,催生了核心且昂貴的RLHF(基于人類反饋的強化學習)環(huán)節(jié)。
簡單說,就是真人對AI回答打分,告知哪個更符合人類價值觀和情感偏好。ChatGPT“像人”,正因背后無數(shù)RLHF標注員的“教導”。
眾包平臺上,這類任務明碼標價3-7元/件,標注員需對AI回答做主觀情感打分,評判是否“溫暖”“有同理心”“照顧情緒”。
拿著兩三千月薪、在現(xiàn)實中疲于奔命的底層打工人,要在系統(tǒng)中擔任AI的情感導師和價值觀裁判。

他們需將溫暖、同理心等復雜人類情感量化為1-5的分數(shù),若打分與系統(tǒng)標準答案不符,就會因正確率不達標被扣微薄工資。這是認知抽空,人類復雜情感被拖入算法漏斗,在量化刻度中失去溫度。當人們驚嘆AI會寫詩譜曲、噓寒問暖時,屏幕外的標注員卻在機械判斷中退化成無情緒的打分機器。
這是產(chǎn)業(yè)鏈最隱秘的一面,從未出現(xiàn)在融資新聞和技術白皮書里。
沒人覺得這有何不妥。
985碩士與小鎮(zhèn)青年
底層拉框工作被AI碾壓,賽博流水線向上蔓延,吞噬高階腦力勞動。大模型不再滿足于簡單常識,需吞噬人類專業(yè)知識和高階邏輯。
招聘平臺頻繁出現(xiàn)“大模型邏輯推理標注”“AI人文訓練師”等兼職,門檻高,要求“985/211碩士及以上學歷”,涉及法律、醫(yī)學等專業(yè)領域。

名校研究生被吸引涌入外包群,卻發(fā)現(xiàn)這是精神折磨。接單前需閱讀幾十頁打分標準,經(jīng)兩三輪試標,正式標注中正確率低于平均水平就會被踢群。更窒息的是標準不固定,相似問題和回答用相同方式打分結(jié)果可能相反,像做無標準答案的試卷,無法通過努力提升正確率,只能消耗腦力體力。
這是大模型時代的新型剝削——階層折疊。知識曾是打破壁壘的階梯,如今淪為算法的復雜“草料”。在算法和系統(tǒng)權力面前,985碩士與小鎮(zhèn)青年殊途同歸,一同跌落賽博礦坑,被剝奪光環(huán)、抹平差異,成為履帶上廉價可替換的齒輪。
國外也如此,2024年蘋果砍掉圣地亞哥121人的AI語音標注團隊,他們負責改善Siri多語言處理,曾以為在核心業(yè)務邊緣,卻瞬間失業(yè)。在科技巨頭眼中,縣城拉框大媽和名校邏輯訓練師都是可替換的“耗材”。
沒人覺得這有何不妥。
萬億巴別塔,砌滿幾分錢的血汗
中國信通院數(shù)據(jù)顯示,2023年中國數(shù)據(jù)標注市場規(guī)模60.8億元,2025年預計200-300億元,2030年全球市場銷售額將達1171億元。這些數(shù)字背后是OpenAI、微軟等巨頭數(shù)千億、萬億美元的估值狂歡,但財富未流向喂養(yǎng)AI的人。
中國數(shù)據(jù)標注行業(yè)呈倒金字塔外包結(jié)構:頂層是握核心算法的科技巨頭,第二層是大型數(shù)據(jù)服務商,第三層是各地標注基地和中小型外包公司,最底層是拿計件工資的標注員。每一層外包都刮走油水,大廠5毛單價經(jīng)層層盤剝,到縣城標注員手中可能不足5分。
希臘前財長雅尼斯·瓦魯法基斯在《技術封建主義》中提出,科技巨頭是“云領主”,擁有算法、平臺、算力等數(shù)字領土,用戶是數(shù)字佃農(nóng),社交媒體上的互動都是免費上供數(shù)據(jù);下沉市場的標注員是最底層數(shù)字農(nóng)奴,需生產(chǎn)、清洗、分類、打分數(shù)據(jù),轉(zhuǎn)化為大模型的高質(zhì)量飼料。
這是隱秘的認知圈地運動,如19世紀英國圈地運動將農(nóng)民趕進紡織廠,如今AI浪潮把實體經(jīng)濟中難尋位置的青年趕到屏幕前。AI未抹平階層鴻溝,反而建立了從中西部縣城到北上廣深科技巨頭的“數(shù)據(jù)與血汗輸送帶”,技術革命的底色是廉價勞動力的規(guī)?;?。
沒人覺得這有何不妥。
不再需要人類的明天
殘酷結(jié)局加速到來,大模型能力躍升,曾需人類日夜勞作的標注任務正被AI接管。2023年4月,理想汽車創(chuàng)始人李想透露,過去一年需1000萬幀自動駕駛圖像人工標定,外包成本近一億,用大模型自動化標注后,一年的事3小時就能完成,效率是人的1000倍,2024年3月理想還發(fā)布了新一代自動標注引擎。
行業(yè)自嘲“有多少智能,就有多少人工”,但大廠數(shù)據(jù)標注外包投入已斷崖式下降40%-50%。小鎮(zhèn)青年們親手喂大的巨獸,正在砸掉他們的飯碗。
夜幕下大同平城區(qū)寫字樓依舊明亮,交接班的年輕人在電梯間沉默交換疲憊。在多邊形框禁錮的折疊空間里,沒人關心Transformer架構的躍遷,也聽不懂千億參數(shù)的算力轟鳴,他們的視線只焊死在后臺的“及格線”進度條上,算計著計件數(shù)字能否拼湊起體面生活。
一邊是納斯達克敲鐘聲與AGI降臨的慶祝;另一邊是喂大AI的數(shù)字農(nóng)奴,在酸痛睡夢中等待巨獸踢飛飯碗。
沒人覺得這有何不妥。
本文僅代表作者觀點,版權歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。
免責聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權或非授權發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com



