AI智能體顛覆科研“七步馬拉松”,知識(shí)生產(chǎn)方式迎來新變革
科研長(zhǎng)期以來被賦予了浪漫色彩。
它并非單一的行為,而是一條被精細(xì)拆分的流水線。檢索、篩選、閱讀、整理、假設(shè)、實(shí)驗(yàn)、驗(yàn)證,再到寫作與發(fā)表——這七個(gè)環(huán)節(jié)幾乎構(gòu)成了所有學(xué)術(shù)工作的基本路徑。
問題在于,這條路徑的每個(gè)環(huán)節(jié)都在消耗時(shí)間,卻并非都能創(chuàng)造價(jià)值。
文獻(xiàn)檢索往往需要在成千上萬篇論文中篩選出幾十篇真正相關(guān)的內(nèi)容。閱讀階段要逐篇理解方法與結(jié)論,再在腦中構(gòu)建一個(gè)尚不穩(wěn)定的認(rèn)知結(jié)構(gòu)。直到問題定義時(shí),研究者才進(jìn)入“創(chuàng)造”環(huán)節(jié),而此時(shí)已消耗了大量時(shí)間。

這些環(huán)節(jié)本質(zhì)上都屬于“確定性勞動(dòng)”,可被拆解、描述和重復(fù)執(zhí)行,卻仍需人工完成。這形成了典型的錯(cuò)配:最寶貴的認(rèn)知資源,被大量消耗在最易被替代的部分。
過去十年,AI雖進(jìn)入科研領(lǐng)域,但多停留在邊緣。它能幫人更快找論文、更順暢翻譯文本,甚至寫出結(jié)構(gòu)完整的綜述,卻未改變科研的基本形態(tài)??蒲腥允且粓?chǎng)“七步馬拉松”,只是速度稍有提升。
一個(gè)更激進(jìn)的命題擺在眼前:若將科研流程整體交給智能體執(zhí)行,會(huì)發(fā)生什么?
近期升級(jí)的AI學(xué)術(shù)智能體切問學(xué)術(shù)(WisPaper中文版)給出了新可能。將確定性勞動(dòng)交給算力,把不確定的靈感還給人。這句話背后,是科研生產(chǎn)方式的全面重新分配。

AI不直接生產(chǎn)論文,卻加速科研進(jìn)程
傳統(tǒng)科研的“七步馬拉松”,需要人在不同環(huán)節(jié)間反復(fù)切換與銜接。
切問學(xué)術(shù)的出現(xiàn),并非意味著它能直接生成論文,而是嵌入科研推進(jìn)過程,成為貫穿式能力。給定研究任務(wù),系統(tǒng)可從文獻(xiàn)檢索出發(fā),完成閱讀、分析與信息結(jié)構(gòu)化,識(shí)別潛在問題,進(jìn)而進(jìn)入實(shí)驗(yàn)設(shè)計(jì)與執(zhí)行,最終輸出結(jié)果與報(bào)告。
AI在科研中的角色由此改變。過去的AI更像“助手”,提供建議或完成局部工作,如翻譯論文、總結(jié)內(nèi)容或補(bǔ)全代碼,研究者需不斷接管流程,在任務(wù)間切換以推進(jìn)整體。
無法避免的機(jī)器幻覺,讓這些工作需復(fù)審以規(guī)避學(xué)術(shù)欺詐、造假風(fēng)險(xiǎn)。切問學(xué)術(shù)作為AI智能體,更接近“執(zhí)行者”,可在無持續(xù)人工介入下自主完成部分內(nèi)容,科研流程首次出現(xiàn)“被托管”的可能。
直觀類比,它類似自動(dòng)駕駛:人類設(shè)定目標(biāo),系統(tǒng)負(fù)責(zé)路徑與執(zhí)行。
同樣邏輯引入科研后,分工模式改變:研究者定義問題,切問學(xué)術(shù)作為智能體負(fù)責(zé)推進(jìn)過程。
科研流程的變化由此顯現(xiàn)。
首先是流程歸屬重新劃分。原本需人逐步完成的任務(wù),被整合為系統(tǒng)可整體接管的過程。檢索、閱讀、整理等高度依賴人工的環(huán)節(jié),無需逐一介入,而是在同一邏輯中連續(xù)處理。
其次,科研工作方式從串行轉(zhuǎn)向并行。AI智能體介入后,科研不再僅沿單一路徑推進(jìn),多個(gè)假設(shè)可同時(shí)展開,多個(gè)方向可并行驗(yàn)證。研究者的工作方式從完成單個(gè)問題,轉(zhuǎn)向管理一組問題。
流程重組后,科研節(jié)奏也隨之改變。
100倍速引擎,科研效率現(xiàn)“代差”
從產(chǎn)品能力看,切問學(xué)術(shù)首先將傳統(tǒng)科研路徑的鏈條“解耦”。傳統(tǒng)路徑中,各環(huán)節(jié)間存在等待與切換成本,而切問學(xué)術(shù)帶來指數(shù)級(jí)效率提升。
這種變化具體可感。據(jù)公開資料,對(duì)比傳統(tǒng)人工,切問學(xué)術(shù)的AI4S模式在文獻(xiàn)檢索方面預(yù)估提效10至100倍,原本數(shù)周的文獻(xiàn)篩選壓縮至分鐘級(jí);論文閱讀提效20倍,數(shù)月的閱讀整理壓縮至小時(shí)級(jí)結(jié)構(gòu)化提??;問題識(shí)別可在全域數(shù)據(jù)中系統(tǒng)掃描定位,50倍速鎖定。效率飛升幾乎重塑科研生命周期。
同時(shí),切問學(xué)術(shù)的提效建立在有效可靠基礎(chǔ)上。公布數(shù)據(jù)顯示,其文獻(xiàn)搜索準(zhǔn)確率達(dá)93.78%,主流模型約70%;文檔版式、公式與表格解析準(zhǔn)確率均超90%,整體高于行業(yè)水平。

這些能力不直接產(chǎn)生結(jié)論,卻決定信息進(jìn)入后續(xù)處理的形態(tài)。變量關(guān)系、實(shí)驗(yàn)結(jié)構(gòu)、數(shù)據(jù)分布被提前拆解,閱讀從逐篇處理轉(zhuǎn)為結(jié)構(gòu)化接收。
尤其切問學(xué)術(shù)測(cè)試中的綜述一致性達(dá)22.26%,引用真實(shí)性接近99.8%。前者確保不同來源信息納入同一邏輯框架,后者在杜絕生成式模型機(jī)器幻覺上邁出關(guān)鍵一步。
正是基于此,其嵌入科研流程的價(jià)值才得以成立。
本次升級(jí)的亮點(diǎn)之一是實(shí)驗(yàn)環(huán)節(jié)的深入。上傳論文后,系統(tǒng)自動(dòng)閱讀理解,拆解核心任務(wù)與算法邏輯;解析實(shí)驗(yàn)方法,生成可執(zhí)行方案;自動(dòng)搭建計(jì)算環(huán)境(含算力配置與依賴項(xiàng));生成代碼并執(zhí)行實(shí)驗(yàn),最終輸出結(jié)果與完整報(bào)告。
整個(gè)過程無需人工逐步介入。切問學(xué)術(shù)可基于已有文獻(xiàn)或識(shí)別出的研究空白,自動(dòng)生成實(shí)驗(yàn)路徑,自主匹配或?qū)ふ覕?shù)據(jù),完成環(huán)境搭建、實(shí)驗(yàn)執(zhí)行與結(jié)果輸出。
傳統(tǒng)科研中“認(rèn)知”與“執(zhí)行”分離,理解可加速,但驗(yàn)證仍依賴人。如今,原本需人反復(fù)切換、試錯(cuò)的整段流程被整體提速。科研流程從“人驅(qū)動(dòng)”變?yōu)椤爸悄茯?qū)動(dòng)”。
從這個(gè)意義上,它或許代表科研效率的代際更替。
這并非通用大模型可實(shí)現(xiàn)。例如學(xué)習(xí)能力,傳統(tǒng)大模型或許擅長(zhǎng)考試,但對(duì)新知識(shí)存在學(xué)習(xí)障礙。在CL-bench測(cè)試中,大模型需理解陌生規(guī)則并立即應(yīng)用,多數(shù)模型失效,平均成功率僅17.2%。
科研場(chǎng)景恰恰依賴這種能力,每個(gè)問題都是新的。模型只有能在上下文中快速建立規(guī)則理解,才具備進(jìn)入科研流程的基礎(chǔ)。
因此,切問學(xué)術(shù)針對(duì)真實(shí)環(huán)境推進(jìn)任務(wù)做了針對(duì)性優(yōu)化。其AgentGym-RL訓(xùn)練方式更接近真實(shí)科研環(huán)境,模型需在網(wǎng)頁操作、實(shí)驗(yàn)流程等任務(wù)中不斷調(diào)整路徑,執(zhí)行不依賴預(yù)設(shè)答案,而是在反饋中修正。
相關(guān)論文顯示,僅70億參數(shù)的小模型(Llama-3.1-8B)經(jīng)AgentGym-RL訓(xùn)練后,在多個(gè)場(chǎng)景中表現(xiàn)與GPT-4o、Claude 3.5-Sonnet相當(dāng)甚至更優(yōu)。
訓(xùn)練中,其對(duì)推理、代碼等關(guān)鍵能力相關(guān)Token賦予更高權(quán)重,讓能力提升與訓(xùn)練指標(biāo)對(duì)齊。
但即便具備真實(shí)環(huán)境任務(wù)推進(jìn)能力,仍面臨挑戰(zhàn):訓(xùn)練穩(wěn)定性。
RLHF是大模型對(duì)齊能力的核心路徑,但PPO訓(xùn)練極不穩(wěn)定,導(dǎo)致很多模型短任務(wù)表現(xiàn)好,復(fù)雜流程易失控偏移。
切問學(xué)術(shù)通過PPO-max的細(xì)粒度約束與獎(jiǎng)勵(lì)機(jī)制,讓訓(xùn)練過程穩(wěn)定,不再依賴運(yùn)氣。
穩(wěn)定后是執(zhí)行。調(diào)用工具、編寫代碼、處理環(huán)境依賴充滿不確定性,傳統(tǒng)模型常依賴模板或停留在“生成代碼”層面,進(jìn)入真實(shí)執(zhí)行環(huán)境易偏差。
科研環(huán)境中信息并非總是一致,不同論文結(jié)論可能沖突,數(shù)據(jù)來源也可能有偏差。模型若簡(jiǎn)單整合,易在多源信息中失真。
切問學(xué)術(shù)面對(duì)“已有記憶”與“當(dāng)前輸入”不一致時(shí),會(huì)形成兩條內(nèi)部處理路徑,最終根據(jù)信號(hào)強(qiáng)度選擇,使模型在復(fù)雜文獻(xiàn)環(huán)境中具備基本判斷能力,而非被動(dòng)接受信息。
這些能力聚合后,變化不再是局部提升,更代表科研生產(chǎn)方式的范式轉(zhuǎn)變。
科研回歸“人”的核心,加速突破臨界點(diǎn)
這場(chǎng)變革中,改變的不只是效率。
科研工作方式從親自完成每一步,轉(zhuǎn)向在關(guān)鍵節(jié)點(diǎn)做判斷。執(zhí)行被系統(tǒng)接管后,研究者無需反復(fù)進(jìn)入確定性流程,逐漸退出具體操作,轉(zhuǎn)而站在更上層理解問題、選擇路徑、審視結(jié)果。
這種微妙變化悄悄重寫科研角色分工。最聰明的大腦不再需在流程中奔波,從執(zhí)行者轉(zhuǎn)向架構(gòu)者或領(lǐng)導(dǎo)者。
同時(shí),一道隱形門檻正在消失。很多領(lǐng)域中,想法與結(jié)果之間隔著代碼、算力與實(shí)驗(yàn)環(huán)境。一旦切問學(xué)術(shù)這類智能體解決了這部分需求,科研進(jìn)入門檻將被重新定義。
結(jié)果是,科研競(jìng)爭(zhēng)開始前移,從“誰能做出來”變成“誰能更早發(fā)現(xiàn)問題”,回歸到定義問題的“人”。原本受技術(shù)條件限制的研究者,也能更直接參與問題本身。

科研本質(zhì)是知識(shí)生產(chǎn)。知識(shí)生產(chǎn)周期壓縮,影響整個(gè)技術(shù)體系節(jié)奏。除時(shí)間成本下降,知識(shí)庫更新頻率同步加快。如新材料、靶向藥、清潔能源等受驗(yàn)證成本限制的領(lǐng)域,驗(yàn)證壓縮后路徑篩選加快,錯(cuò)誤方向更早淘汰,可行路徑更快浮現(xiàn)。
這意味著研究在更高密度試探中不斷逼近答案,原本需多年積累的試錯(cuò)過程被壓縮到更短周期反復(fù)發(fā)生。
技術(shù)突破的出現(xiàn)方式也隨之改變,從依賴個(gè)體經(jīng)驗(yàn)的偶然發(fā)現(xiàn),轉(zhuǎn)向高頻驗(yàn)證中的逐步收斂。
這種節(jié)奏持續(xù)疊加后,科研進(jìn)入新分工結(jié)構(gòu):AI負(fù)責(zé)推進(jìn)已知路徑,持續(xù)壓縮確定性部分;人則聚焦未知區(qū)域,判斷哪些問題值得繼續(xù)追問。
本文來自微信公眾號(hào)“智能涌現(xiàn)”,36氪經(jīng)授權(quán)發(fā)布。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com



