欧美三级电影完整|亚洲一二三四久久|性爱视频精品一区二区免费在线观看|国产精品啪啪视频|婷婷六月综合操人妻视频网站|99爱免费视频在线观看|美女一级片在线观看|北京熟女88av|免费看黄色A级电影|欧美黄色毛片儿

人民的AI為人民:印度公司反擊剝削,為貧困數(shù)據(jù)工人“分紅”

2023-08-01

人工智能背后的數(shù)據(jù)工人只得到很少的回報(bào),常常受中間公司的剝削,甚至遭遇身心傷害。印度初創(chuàng)公司Karya想要解決這個(gè)問(wèn)題:提高工資標(biāo)準(zhǔn),并讓工人獲得數(shù)據(jù)版權(quán)帶來(lái)的“分紅”。

·盡管Karya目前在擴(kuò)展規(guī)模和維持愿景上仍存挑戰(zhàn),但這一實(shí)踐為數(shù)據(jù)產(chǎn)業(yè)提供了新的可能性和借鑒。

 

數(shù)據(jù)工作者在建設(shè)人工智能大語(yǔ)言模型的語(yǔ)料庫(kù)方面發(fā)揮著關(guān)鍵作用,但他們的勞動(dòng)卻常常得不到公平對(duì)待,而這種不公平現(xiàn)象在全球數(shù)據(jù)產(chǎn)業(yè)并不罕見(jiàn)。面對(duì)這一現(xiàn)狀,印度初創(chuàng)企業(yè)Karya試圖找到一種切實(shí)可行的新模式——提高工資標(biāo)準(zhǔn),并讓工人獲得數(shù)據(jù)版權(quán)帶來(lái)的“分紅”。

Karya公司的首席執(zhí)行官曼努·喬普拉(Manu Chopra)表示,Karya公司的愿景是通過(guò)數(shù)據(jù)工作幫助印度農(nóng)民擺脫貧困。他認(rèn)為,合理的報(bào)酬不僅提高了數(shù)據(jù)質(zhì)量,也能夠幫助社會(huì)邊緣群體,讓更多人受益于人工智能技術(shù)的發(fā)展,美國(guó)《時(shí)代》雜志7月27日發(fā)表封面文章“人民的AI為人民”,對(duì)Karya公司的故事進(jìn)行了報(bào)道,并表示盡管Karya目前在擴(kuò)展規(guī)模和維持愿景上仍存挑戰(zhàn),但這一實(shí)踐為數(shù)據(jù)產(chǎn)業(yè)提供了新的可能性和借鑒。

 

人工智能背后的工人

印度南部卡納塔克邦的阿拉哈利村,在一棵椰子樹(shù)的陰影下,錢(qián)德里卡(Chandrika)一邊滑動(dòng)屏幕,一邊連續(xù)點(diǎn)擊幾個(gè)音頻進(jìn)行剪輯,每次輕觸,她用母語(yǔ)說(shuō)話的聲音就從手機(jī)里傳出。

在使用這個(gè)應(yīng)用之前,30歲的錢(qián)德里卡的銀行賬戶中只有184盧比(2.25美元)。但是在4月下旬的連續(xù)幾天,她只需工作約6個(gè)小時(shí),就收到了2570盧比(31.30美元)的報(bào)酬。這個(gè)數(shù)額大致相當(dāng)于她在一所離家很遠(yuǎn)的學(xué)校擔(dān)任教師,抵扣通勤的三趟公交車(chē)費(fèi)用之后一個(gè)月的收入。

與錢(qián)德里卡的日常工作不同,這個(gè)應(yīng)用程序不會(huì)讓她等到月底才能收到款項(xiàng),幾個(gè)小時(shí)后錢(qián)就會(huì)進(jìn)她的銀行賬戶。僅僅通過(guò)用母語(yǔ)卡納達(dá)語(yǔ)朗讀文本——這種語(yǔ)言主要由分布在印度中部和南部的6000萬(wàn)人使用,她就用這款應(yīng)用賺到了每小時(shí)大約5美元的工資,幾乎是印度最低工資的20倍。而且,幾天后,她還會(huì)收到更多的錢(qián)——只要音頻剪輯被驗(yàn)證為準(zhǔn)確,她就會(huì)得到50%的獎(jiǎng)金。

正是因?yàn)锳I的蓬勃發(fā)展,錢(qián)德里卡的語(yǔ)音才能換來(lái)這么高的收益。目前,像ChatGPT這樣的先進(jìn)AI工具在英語(yǔ)等語(yǔ)言中表現(xiàn)最佳,因?yàn)檫@些語(yǔ)言的文本和音頻數(shù)據(jù)在網(wǎng)絡(luò)上非常豐富。然而,對(duì)于卡納達(dá)語(yǔ)這樣的語(yǔ)言來(lái)說(shuō),情況就差得多,盡管這種語(yǔ)言被千萬(wàn)人使用,但在互聯(lián)網(wǎng)上卻很少見(jiàn),例如,維基百科上有600萬(wàn)篇英文文章,但只有3萬(wàn)篇卡納達(dá)語(yǔ)文章。在這些“資源較少”的語(yǔ)言中,人工智能即使能夠運(yùn)行,也可能存在偏見(jiàn)——比如經(jīng)常認(rèn)為醫(yī)生是男性,護(hù)士是女性,并且可能難以理解當(dāng)?shù)氐姆窖浴R獎(jiǎng)?chuàng)建一個(gè)有效的英語(yǔ)人工智能,只需從已經(jīng)積累的數(shù)據(jù)中收集就足夠了。但對(duì)于像卡納達(dá)語(yǔ)這樣的語(yǔ)言,需要尋找更多的數(shù)據(jù)。

這就導(dǎo)致了,對(duì)以一些世界上最貧困人民所使用的語(yǔ)言為基礎(chǔ)的數(shù)據(jù)集的巨大需求。需求的一部分來(lái)自尋求構(gòu)建AI工具的科技公司,另一大部分來(lái)自學(xué)術(shù)界和政府,特別是在擁有14億人口、22種官方語(yǔ)言和至少780種土著語(yǔ)言的印度,英語(yǔ)和印地語(yǔ)長(zhǎng)期以來(lái)占據(jù)著重要地位。這種需求的上升意味著數(shù)以億計(jì)的印度人突然掌握了一種稀缺且有價(jià)值的資產(chǎn):他們的母語(yǔ)。

數(shù)據(jù)工作在印度并非新事物。20世紀(jì)末,印度在將呼叫中心和服裝工廠轉(zhuǎn)變?yōu)樯a(chǎn)力引擎方面作出了巨大貢獻(xiàn),并在21世紀(jì)默默地將同樣的事情應(yīng)用于數(shù)據(jù)工作。和之前一樣,這個(gè)行業(yè)再次被一些中間公司所主導(dǎo),他們支付接近法定最低工資的工資,同時(shí)以高額利潤(rùn)向外國(guó)客戶出售數(shù)據(jù)。預(yù)計(jì)到2030年,全球價(jià)值超過(guò)20億美元的AI數(shù)據(jù)行業(yè)將增至170億美元。然而,這些錢(qián)很少流向印度、肯尼亞和菲律賓的數(shù)據(jù)工作者。

創(chuàng)造一個(gè)更公平的模式

在阿拉哈利和奇盧卡瓦迪相鄰的村莊,Karya公司正在測(cè)試一種新模式。錢(qián)德里卡就在Karya公司工作,該公司成立于2021年,總部位于班加羅爾,自稱為“世界上第一個(gè)道德數(shù)據(jù)公司”。與競(jìng)爭(zhēng)對(duì)手一樣,它以市場(chǎng)價(jià)向大型科技公司和其他客戶出售數(shù)據(jù)。但Karya沒(méi)有把大部分收入留作利潤(rùn),而是用來(lái)支付成本,剩下的部分則用于幫助印度農(nóng)村的貧困人群。Karya與當(dāng)?shù)胤钦M織合作,確保最貧困的人群以及歷史上被邊緣化的社區(qū)首先獲得就業(yè)機(jī)會(huì)。除了每小時(shí)5美元的最低工資,Karya還讓工人在工作中實(shí)際擁有所創(chuàng)造數(shù)據(jù)的所有權(quán),因此每當(dāng)數(shù)據(jù)再次銷(xiāo)售時(shí),工人們除了過(guò)去的工資外還將獲得收益。這是行業(yè)內(nèi)其他地方都沒(méi)有的模式。

“現(xiàn)有的工資體系是市場(chǎng)的失敗?!?7歲的Karya首席執(zhí)行官喬普拉告訴《時(shí)代》,“我們決定成為一家非營(yíng)利組織,因?yàn)閺母旧险f(shuō),你無(wú)法在市場(chǎng)中解決市場(chǎng)的失敗?!?/p>

Karya告訴工人:這不是一份長(zhǎng)久的工作,而是一種快速增加收入的方式,讓你能夠繼續(xù)做其他事情。工人通過(guò)該應(yīng)用程序可以獲得的最高收入為1500美元,大致相當(dāng)于印度的年平均收入。Karya表示,已向全國(guó)范圍內(nèi)約3萬(wàn)名印度農(nóng)村居民支付了6500萬(wàn)盧比(近80萬(wàn)美元)的工資。到2030年,喬普拉希望能夠觸及1億人口?!叭绻龅煤?,我真誠(chéng)地認(rèn)為這是數(shù)百萬(wàn)人迅速擺脫貧困的最快途徑?!彼f(shuō)。喬普拉出生于貧困家庭,曾因?yàn)楂@得斯坦福獎(jiǎng)學(xué)金改變?nèi)松壽E,“這絕對(duì)是一個(gè)社會(huì)項(xiàng)目。財(cái)富就是力量。我們希望將財(cái)富重新分配給那些被遺落的社區(qū)?!?/p>

喬普拉不是第一個(gè)發(fā)現(xiàn)人工智能數(shù)據(jù)工作能幫助世界最貧困人口,并對(duì)其潛力贊不絕口的科技公司創(chuàng)始人。Sama是一家外包公司,曾經(jīng)負(fù)責(zé)過(guò)OpenAI的ChatGPT和Meta的Facebook的數(shù)據(jù)處理合同,它也把自己宣傳為科技公司幫助全球人民擺脫貧困的一種“道德”方式。但是根據(jù)此前的報(bào)道,為ChatGPT工作的肯尼亞工人表示,他們接觸到的訓(xùn)練數(shù)據(jù)讓他們受到創(chuàng)傷,而其中一些人每小時(shí)收入不到2美元。Sama還為Facebook進(jìn)行類似的內(nèi)容審查工作,其中一名參與該項(xiàng)目的工作者說(shuō),他在為改善工作條件發(fā)起運(yùn)動(dòng)時(shí)被解雇。Sama公司的創(chuàng)始人在2018年被BBC(英國(guó)廣播公司)問(wèn)及低工資問(wèn)題時(shí)辯稱,支付更高的工資可能會(huì)破壞當(dāng)?shù)亟?jīng)濟(jì),弊大于利。很多數(shù)據(jù)工作者不滿Sama公司這種說(shuō)法,他們認(rèn)為這只是靠數(shù)據(jù)工作者賺取大筆利潤(rùn)的公司的一種方便的借口。

第一次聽(tīng)說(shuō)Karya時(shí),《時(shí)代》記者立刻產(chǎn)生了懷疑。Sama也是作為一個(gè)專注于消除貧困的非營(yíng)利組織開(kāi)始的,但后來(lái)轉(zhuǎn)型為營(yíng)利性企業(yè)。Karya真的能成為一個(gè)更包容和道德的人工智能行業(yè)模式嗎?即使可以,它能擴(kuò)展嗎?有一點(diǎn)是清楚的:在這些問(wèn)題上,印度可能是最好的試驗(yàn)場(chǎng)所。印度是移動(dòng)數(shù)據(jù)價(jià)格最便宜的國(guó)家之一,即使是貧困的農(nóng)民也常常擁有智能手機(jī)和銀行賬戶。還有潛在的好處:根據(jù)世界銀行的數(shù)據(jù),即使在疫情之前,印度約有1.4億人每天生活費(fèi)不到2.15美元。對(duì)于那些人來(lái)說(shuō),喬普拉所說(shuō)的巨額現(xiàn)金注入可能會(huì)改變他們的生活。

數(shù)據(jù)質(zhì)量和生活收入的“雙贏”

在距離繁忙的科技大都市班加羅爾70英里的地方,在奇魯卡瓦迪村一座低矮的混凝土建筑內(nèi),當(dāng)?shù)剞r(nóng)業(yè)合作社的總部聚集了十幾名男女,他們都是在過(guò)去一周內(nèi)開(kāi)始為Karya工作的人。

瘦弱的21歲年輕人卡納卡拉杰(Kanakaraj)在附近的一所大學(xué)學(xué)習(xí),為了支付書(shū)本和交通費(fèi)用,偶爾在周?chē)奶锏乩镒雠R時(shí)工。一天的工作可以賺到350盧比(約4美元),但由于氣候變化,當(dāng)?shù)氐南募颈韧8友谉?,這種體力勞動(dòng)變得更加難以忍受。在附近城市的工廠工作可以帶來(lái)稍微高一點(diǎn)的工資,但意味著每天乘坐不可靠和價(jià)格昂貴的公交車(chē)上下班,離開(kāi)他習(xí)慣的生活環(huán)境,住在城市的宿舍里。

在Karya,卡納卡拉杰一個(gè)小時(shí)的收入比他在田里一天的收入還要多?!肮ぷ骱芎??!彼f(shuō),“而且很輕松?!眴唐绽f(shuō),這是村民的典型說(shuō)法?!八麄兒芨吲d我們支付給他們很多錢(qián)?!彼f(shuō),但更重要的是,“這不是辛苦的工作。這不是體力勞動(dòng)?!碑?dāng)卡納卡拉杰看到第一筆工資進(jìn)入銀行賬戶時(shí),他感到很驚訝。“我們被騙了很多錢(qián)。”他向記者解釋,村民常常收到利用他們絕望心理的短信,承諾將他們的存款增加10倍。當(dāng)有人第一次告訴他Karya時(shí),他以為這是一個(gè)類似的騙局。

由于儲(chǔ)蓄很少,當(dāng)?shù)厝私?jīng)常不得不貸款支付緊急費(fèi)用。這些掠奪性機(jī)構(gòu)往往對(duì)這些貸款收取高利率,導(dǎo)致一些村民陷入債務(wù)循環(huán)。例如,錢(qián)德里卡利用她在Karya的工資幫助家人償還一筆巨額醫(yī)療貸款,這筆貸款是她25歲的妹妹治病時(shí)產(chǎn)生的。其他Karya工人也面臨類似的情況。25歲的阿賈伊·庫(kù)馬爾(Ajay Kumar)陷入了為治療母親嚴(yán)重背部傷病而產(chǎn)生的醫(yī)療債務(wù)中。38歲的希瓦納(Shivanna N.)在小時(shí)候因燃放鞭炮而失去了右手。盡管他沒(méi)有債務(wù),但殘疾意味著他很難謀生。

 

這些村民正在參與Karya在卡納塔克邦推出的一個(gè)新項(xiàng)目,該項(xiàng)目是為一家印度醫(yī)療非政府組織進(jìn)行的,該組織正在尋求關(guān)于結(jié)核病的語(yǔ)音數(shù)據(jù),結(jié)核病每年導(dǎo)致約20萬(wàn)印度人死亡。這些語(yǔ)音錄音,收集了卡納達(dá)語(yǔ)的10種不同方言,將幫助訓(xùn)練一個(gè)人工智能語(yǔ)音模型,以理解當(dāng)?shù)厝说姆谓Y(jié)核問(wèn)題,并回答旨在減少疾病傳播的信息。當(dāng)這個(gè)應(yīng)用完成時(shí),它希望能夠讓不識(shí)字的人更容易獲得可靠的信息,而不用讓肺結(jié)核患者尋求幫助時(shí)承擔(dān)經(jīng)常遭受的污名。這些錄音還將作為卡納達(dá)語(yǔ)數(shù)據(jù)集的一部分,在Karya的平臺(tái)上轉(zhuǎn)售給許多AI公司。這些公司對(duì)訓(xùn)練數(shù)據(jù)的內(nèi)容不太在意,而是更關(guān)注它對(duì)語(yǔ)言整體結(jié)構(gòu)的編碼。每次轉(zhuǎn)售,100%的收入都將分配給參與數(shù)據(jù)集的Karya工人,并按照他們投入的時(shí)間比例分配。

雖然規(guī)模較小,但Karya已經(jīng)擁有一系列知名客戶,包括微軟公司、麻省理工學(xué)院和斯坦福大學(xué)。今年2月,該公司為比爾與梅琳達(dá)·蓋茨基金會(huì)開(kāi)展了一個(gè)新項(xiàng)目,旨在為10億印度人口使用的5種語(yǔ)言(馬拉地語(yǔ)、泰盧固語(yǔ)、印地語(yǔ)、孟加拉語(yǔ)和馬拉雅拉姆語(yǔ))構(gòu)建語(yǔ)音數(shù)據(jù)集,最終目標(biāo)是建立一個(gè)可以用母語(yǔ)和方言回答印度農(nóng)民關(guān)于醫(yī)療保健、農(nóng)業(yè)、衛(wèi)生、銀行和職業(yè)發(fā)展等問(wèn)題的聊天機(jī)器人。這項(xiàng)技術(shù)可以被視為致力于消除貧困的ChatGPT,有助于傳播改善印度人生活質(zhì)量的知識(shí)。

“我認(rèn)為應(yīng)該有一個(gè)世界,語(yǔ)言不再是使用技術(shù)的障礙,這樣每個(gè)人都能使用技術(shù),無(wú)論他們說(shuō)什么語(yǔ)言?!蔽④浹芯恐行牡恼Z(yǔ)言學(xué)家和首席研究員卡利卡·巴利(Kalika Bali)說(shuō)。她與蓋茨基金會(huì)合作進(jìn)行該項(xiàng)目,并擔(dān)任Karya監(jiān)督委員會(huì)的無(wú)薪酬成員。Karya相對(duì)較高的工資“滲透到數(shù)據(jù)的質(zhì)量上”,巴利說(shuō),“這將立即提高系統(tǒng)輸出的準(zhǔn)確性?!彼f(shuō)她通常從Karya那里得到的數(shù)據(jù)錯(cuò)誤率不到1%,這在構(gòu)建AI模型時(shí)幾乎從未發(fā)生過(guò)。

特殊的公司結(jié)構(gòu)

喬普拉說(shuō),最初他和他的團(tuán)隊(duì)向任何人開(kāi)放應(yīng)用程序,結(jié)果發(fā)現(xiàn)最早的100個(gè)注冊(cè)用戶都是占主導(dǎo)地位的高種姓男性。這一經(jīng)歷讓他認(rèn)識(shí)到“知識(shí)是通過(guò)權(quán)力渠道傳遞的”。為了接觸到最貧困的社區(qū),以及邊緣化的種姓、性別和宗教,他很早就意識(shí)到必須與在農(nóng)村地區(qū)有基層影響力的非營(yíng)利組織合作。這些組織可以代表Karya按照收入和多樣性的要求分發(fā)訪問(wèn)碼?!八麄冎缹?duì)于誰(shuí)來(lái)說(shuō),這筆錢(qián)是錦上添花,對(duì)于誰(shuí)來(lái)說(shuō),這筆錢(qián)是改變命運(yùn)的?!彼f(shuō),這個(gè)過(guò)程也確保了工人最終生成的數(shù)據(jù)有更強(qiáng)多樣性,這有助于減少AI偏見(jiàn)。

“我們需要的是讓更多人意識(shí)到,大多數(shù)數(shù)據(jù)公司是不道德的。”他說(shuō),“而且有一種道德的方式?!睘榱俗屵@個(gè)應(yīng)用發(fā)揮出他認(rèn)為能夠發(fā)揮的影響力,他需要贏得更多的客戶——說(shuō)服更多的科技公司、政府和學(xué)術(shù)機(jī)構(gòu)從Karya獲取他們的AI訓(xùn)練數(shù)據(jù)。

但在追求新客戶的過(guò)程中,即使是自詡為“有道德”的企業(yè),最終也可能妥協(xié)。那么,什么能阻止Karya陷入與Sama公司同樣的境地呢?喬普拉說(shuō),答案的一部分在于Karya的公司結(jié)構(gòu)。Karya在美國(guó)注冊(cè)為非營(yíng)利組織,控制著印度的兩個(gè)實(shí)體:一個(gè)非營(yíng)利組織和一個(gè)營(yíng)利組織。這個(gè)營(yíng)利組織在法律上有義務(wù)將它賺取的任何利潤(rùn)(在支付工人之后)捐贈(zèng)給非營(yíng)利組織,后者再將它們用于再投資。他說(shuō),這種安排的好處在于,消除了他或聯(lián)合創(chuàng)始人為了有利可圖的合同而犧牲工人工資或福利的任何動(dòng)機(jī)。目前,這是一個(gè)有效的模式,但如果慈善資金枯竭,這個(gè)模式可能會(huì)崩潰。

奇魯卡瓦迪和阿拉哈利村的村民對(duì)人工智能的了解有限。喬普拉表示,向工人們解釋他們正在做什么時(shí)可能存在挑戰(zhàn),最成功的方法是告訴工人們他們正在“教計(jì)算機(jī)說(shuō)卡納達(dá)語(yǔ)”。那里沒(méi)有人知道ChatGPT,但村民們知道谷歌助手,他們稱之為“OK Google”。35歲的失業(yè)父親思達(dá)拉久(Siddaraju L.)表示,他不知道什么是人工智能,但如果計(jì)算機(jī)能說(shuō)他的語(yǔ)言,他會(huì)感到驕傲。“我對(duì)我的母語(yǔ)像對(duì)我的父母一樣尊敬?!?/p>

人們希望,通過(guò)Karya等項(xiàng)目的努力,印度語(yǔ)言的人工智能項(xiàng)目能夠從英語(yǔ)人工智能的錯(cuò)誤中吸取教訓(xùn),并從一個(gè)更可靠和無(wú)偏見(jiàn)的起點(diǎn)開(kāi)始?!爸钡讲痪们埃⒄Z(yǔ)的語(yǔ)音識(shí)別引擎甚至都不能理解我的英語(yǔ)口音?!蔽④浹芯恐行牡恼Z(yǔ)音研究員巴利談到她的口音時(shí)說(shuō),“如果人工智能技術(shù)不滿足它們的受眾,那么這些技術(shù)的存在有什么意義呢?”

本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。

免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com