欧美三级电影完整|亚洲一二三四久久|性爱视频精品一区二区免费在线观看|国产精品啪啪视频|婷婷六月综合操人妻视频网站|99爱免费视频在线观看|美女一级片在线观看|北京熟女88av|免费看黄色A级电影|欧美黄色毛片儿

AlphaGo對(duì)弈李世石十周年:首爾五日傳奇對(duì)決的幕后細(xì)節(jié)

5天前
那改變認(rèn)知的第37手

2016年的首爾,AlphaGo與李世石的人機(jī)大戰(zhàn)牽動(dòng)著全球目光。第二局中,AlphaGo落下的第37手,完全跳出了人類棋手的認(rèn)知邊界:現(xiàn)場(chǎng)解說(shuō)員直言“無(wú)法理解”;李世石更是沉思了12分鐘,才艱難落子回應(yīng)。


鮮為人知的是,這手震驚世界的棋背后,是DeepMind創(chuàng)始人哈薩比斯的堅(jiān)持。備戰(zhàn)時(shí),研究員為避免系統(tǒng)出錯(cuò),建議降低隨機(jī)走法概率,哈薩比斯卻力排眾議:“我們研發(fā)AI,不是為了復(fù)制人類思維,而是要探索智能的未知領(lǐng)域?!?/p>


這段持續(xù)五天的傳奇對(duì)決,在哈薩比斯首部官方授權(quán)傳記《哈薩比斯:谷歌AI之腦》中得到完整還原。我們從書中摘錄這段故事,與讀者分享。




2016年1月,《自然》雜志發(fā)表了DeepMind關(guān)于圍棋的論文并將其登上封面。論文發(fā)表前一天,雜志向記者分發(fā)禁刊副本,一位記者聯(lián)系Facebook尋求評(píng)論,消息很快傳到扎克伯格耳中。扎克伯格展現(xiàn)出競(jìng)爭(zhēng)鋒芒,在論文公開(kāi)前倉(cāng)促發(fā)布聲明,宣揚(yáng)Facebook遠(yuǎn)不如DeepMind亮眼的圍棋項(xiàng)目。記者凱德·梅茨評(píng)論這是“古怪且不幸的搶先公關(guān)”,也預(yù)示了AI競(jìng)賽的正式展開(kāi)。


媒體對(duì)Facebook的聲明不屑一顧,轉(zhuǎn)而聚焦DeepMind。擊敗樊麾后,DeepMind的智能體(已命名為AlphaGo)首次戰(zhàn)勝人類圍棋冠軍,比專家預(yù)期提前約10年。哈薩比斯在《自然》封面文章發(fā)布時(shí)宣布,3月AlphaGo將與韓國(guó)傳奇棋手、18次國(guó)際錦標(biāo)賽冠軍李世石對(duì)決,DeepMind還設(shè)立了100萬(wàn)美元獎(jiǎng)金。


哈薩比斯選擇對(duì)手時(shí)經(jīng)過(guò)深思熟慮。最初想與日本冠軍比賽,但當(dāng)時(shí)日本無(wú)頂尖選手——韓國(guó)和中國(guó)是圍棋強(qiáng)國(guó)??紤]后,他選定李世石,不僅因其職業(yè)成就,還因其體現(xiàn)的精神。這場(chǎng)比賽如同卡斯帕羅夫與“深藍(lán)”的對(duì)決,會(huì)讓癡迷圍棋的韓國(guó)人陷入狂熱?!袄钍朗敲褡逵⑿郏n國(guó)人熱愛(ài)圍棋,也熱愛(ài)AI。”哈薩比斯后來(lái)表示。


比賽時(shí)間的選擇需謹(jǐn)慎判斷。西爾弗估計(jì)AlphaGo3月能準(zhǔn)備就緒,但團(tuán)隊(duì)部分成員希望有緩沖時(shí)間,因?yàn)橄到y(tǒng)偶爾會(huì)產(chǎn)生“幻覺(jué)”,出現(xiàn)看似隨機(jī)的走法。但因其他AI實(shí)驗(yàn)室的威脅,哈薩比斯否決了懷疑者的意見(jiàn)。Facebook已緊追不舍,《自然》論文也揭示了AlphaGo的工作原理,包括策略網(wǎng)絡(luò)、價(jià)值網(wǎng)絡(luò)和蒙特卡洛樹(shù)搜索的組合模式,中國(guó)互聯(lián)網(wǎng)巨頭也可能借此迎頭趕上。


DeepMind母公司的支持促成了全速推進(jìn)的決定。2015年底,黃士杰和同事開(kāi)始在谷歌自研的“張量處理單元”(TPU)上運(yùn)行AlphaGo,這種芯片比英偉達(dá)GPU運(yùn)算更快,通過(guò)犧牲少量精度執(zhí)行更多乘法運(yùn)算。測(cè)試時(shí),配備TPU的AlphaGo對(duì)陣GPU版勝率超80%。已加入團(tuán)隊(duì)的樊麾表示,升級(jí)后的AlphaGo棋風(fēng)不同,走法極富創(chuàng)造性且精妙。


赴韓參賽幾周前,谷歌董事長(zhǎng)埃里克·施密特拜訪哈薩比斯,希望確保勝利。“進(jìn)展如何?”他問(wèn)。“指標(biāo)不錯(cuò),但仍有擔(dān)憂?!惫_比斯回答?!昂芎?,別搞砸了?!笔┟芴匕腴_(kāi)玩笑地說(shuō)。


2016年3月,哈薩比斯、西爾弗和團(tuán)隊(duì)抵達(dá)首爾,施密特從加州飛來(lái),TPU芯片功臣杰夫·迪恩同行,聯(lián)合創(chuàng)始人謝爾蓋·布林三天后也加入。賽事盛況超出預(yù)期,街上有大批媒體和大屏幕,超過(guò)2億人觀看,是“深藍(lán)”擊敗卡斯帕羅夫時(shí)的兩倍多,甚至超過(guò)超級(jí)碗觀眾數(shù)。


西爾弗感到膽怯:“我低估了這件事的影響,差了兩個(gè)數(shù)量級(jí)。”


李世石信心滿滿,研究了AlphaGo與樊麾比賽的每一步,預(yù)測(cè)自己會(huì)5∶0或4∶1獲勝,因他比樊麾強(qiáng)得多。多數(shù)職業(yè)棋手也認(rèn)同,認(rèn)為擊敗DeepMind是輕松賺百萬(wàn)美元的機(jī)會(huì)?!拔覍⒈M全力捍衛(wèi)人類智能的尊嚴(yán)。”李世石承諾。


3月9日比賽當(dāng)天,黃士杰坐在黑色皮椅上,面前是棋盤,左側(cè)電腦屏幕顯示AlphaGo的行棋(由太平洋彼岸服務(wù)器生成),對(duì)面是李世石,他的走法由腎上腺素和咖啡驅(qū)動(dòng)。


第一場(chǎng)比賽開(kāi)始幾分鐘,李世石就陷入困境。他走出常規(guī)第三步并挑起沖突,試圖用訓(xùn)練數(shù)據(jù)外的策略迷惑AlphaGo,但AlphaGo不為所動(dòng)。他低估了AlphaGo自10月與樊麾比賽后的進(jìn)步。


李世石表情時(shí)而震驚、時(shí)而好笑、時(shí)而無(wú)奈,靠在椅上笑,按摩脖子。他通過(guò)研究與樊麾比賽做出的預(yù)期都毫無(wú)意義,這套系統(tǒng)當(dāng)時(shí)雖可能被擊敗,但5個(gè)月后已不可戰(zhàn)勝。最終他認(rèn)輸:“我沒(méi)預(yù)料到AlphaGo會(huì)下得如此完美。”


第二場(chǎng)比賽,李世石嘗試不同策略,小心翼翼落子等待AlphaGo出錯(cuò)。走了36步后,他起身抽煙休息,回來(lái)研究局勢(shì)。離開(kāi)期間,AlphaGo下出第37步:一顆黑子落在幾乎空曠的區(qū)域,突襲李世石右側(cè)。


李世石花了12分鐘才回應(yīng),他從未見(jiàn)過(guò)這樣的走法。世界頂尖西方棋手邁克爾·雷德蒙德在另一個(gè)房間直播解說(shuō),看到這步棋后,在棋盤上放了黑子又拿起:“不,這不可能正確?!钡@確實(shí)正確,他放回棋子試圖理解:“我真的不知道這步棋是好是壞。”


事實(shí)證明這是絕妙好棋,100多步后被證明是決定性的?!翱吹竭@步棋時(shí),我認(rèn)為AlphaGo肯定有創(chuàng)造力。”李世石賽后說(shuō),“我真的無(wú)話可說(shuō)?!?/p>


第三天是休息日,DeepMind科學(xué)家們逛街、品嘗韓國(guó)烤肉。每家報(bào)紙都報(bào)道AlphaGo,一位年輕女子在街上認(rèn)出哈薩比斯,作暈倒?fàn)?,仿佛他是流行偶像?!斑@種事經(jīng)常發(fā)生?!惫_比斯對(duì)身邊記者說(shuō)。對(duì)全球AI研究人員來(lái)說(shuō),一切都變了,AlphaGo的出現(xiàn)終結(jié)了AI領(lǐng)域默默無(wú)聞的純真時(shí)代。


第四天,AI第三次擊敗李世石。李世石展現(xiàn)了職業(yè)生涯中精彩的技藝,但AlphaGo表現(xiàn)更勝一籌。新聞發(fā)布會(huì)上,他向人類道歉:“我感到有點(diǎn)無(wú)能為力?!?/p>


面對(duì)機(jī)器超級(jí)智能,一種回應(yīng)是“打不過(guò)就加入”。0∶5失利后,樊麾加入DeepMind,稱失敗讓他看到人生無(wú)限可能:“我發(fā)現(xiàn)世界比想象的大得多,很喜歡這種感覺(jué)。”這是謙遜的情感,但掩蓋了人類失利的現(xiàn)實(shí)。機(jī)器拓展了可能性,也以不安的方式威脅人類,意味著人類直覺(jué)和想法可能不再重要。


另一種回應(yīng)是繼續(xù)抗?fàn)?。第四?chǎng)比賽中,李世石憑借第78步“神之一手”擊敗AlphaGo。這步精妙的棋讓計(jì)算機(jī)陷入被動(dòng),算法出現(xiàn)類似人類的慌亂,走出無(wú)章法的棋步,最終認(rèn)輸。李世石慶祝勝利,稱感受到無(wú)上溫暖,棋迷高呼他的名字,一位程序員甚至將第37步和第78步棋形文在手臂上。但3年后,當(dāng)圍棋系統(tǒng)空前強(qiáng)大時(shí),李世石黯然退役,稱再也無(wú)法從下棋中感受到快樂(lè)。


DeepMind團(tuán)隊(duì)也不確定如何看待勝利。AlphaGo是人類創(chuàng)造的,是人類行動(dòng)力和好奇心的體現(xiàn),但他們也共情李世石的絕望。“我無(wú)法慶祝?!惫_比斯回憶李世石1∶4失利時(shí)說(shuō),他知道競(jìng)爭(zhēng)失利的滋味。


幾年后,托雷·格雷佩爾被問(wèn)及機(jī)器超越人類的感受時(shí)說(shuō):“初代圍棋系統(tǒng)棋路與人類相似,摸索出人類千年策略讓我們開(kāi)心;后來(lái)它發(fā)現(xiàn)人類策略可反制,就放棄了;再后來(lái)系統(tǒng)變強(qiáng),下法變得陌生,棋子看似隨機(jī)散布,但30步、50步、100步后,所有棋子都聯(lián)系在一起……”“就像絞索勒緊脖頸?”我緊張地問(wèn)?!皼](méi)錯(cuò),就是這樣!堪稱魔法。”格雷佩爾說(shuō),這不是魔法,是算法的先見(jiàn)之明,只是在低等智能看來(lái)像魔法?!斑@就是我們必須想象的未來(lái)。圍棋領(lǐng)域已實(shí)現(xiàn)超級(jí)智能,我們能體驗(yàn)與它互動(dòng)的感受。一開(kāi)始它看似無(wú)威脅,然后用途完全主導(dǎo),我們不理解它的運(yùn)作機(jī)制、戰(zhàn)術(shù)和策略,只知道控制權(quán)在它手中……”


本文來(lái)自微信公眾號(hào)“紅杉匯”(ID:Sequoiacap),作者:洪衫,36氪經(jīng)授權(quán)發(fā)布。


本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。

免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com