23歲非生物專業(yè)女生跨界,靠AI獨立分析全基因組數(shù)據(jù)生成檢測報告
本文來自微信公眾號:科學(xué)網(wǎng),編輯:方圓,作者:孫滔
今年3月4日中午,23歲的馮睿洋收到家人發(fā)來的消息:一位和她年紀(jì)相仿的親戚確診癌癥,春節(jié)前剛做完手術(shù),正在進(jìn)行化療。
和親戚年齡相近,馮睿洋不由得緊繃起神經(jīng)。她告訴家人,自己擔(dān)心這個癌癥存在遺傳相關(guān)風(fēng)險,打算做一次全基因組測序排查。
當(dāng)下國內(nèi)商業(yè)基因檢測的主流技術(shù)是二代測序,但馮睿洋查閱資料后,選擇了目前更多應(yīng)用在實驗室研究中的三代測序——這項技術(shù)目前僅在特定疾病診療、生育篩查、遺傳檢測等場景使用,精準(zhǔn)度更高。
初步估算下來,測序費用大概在3萬到5萬元之間,得到家人支持后,馮睿洋立刻啟動了計劃。從得知親戚患病、查詢資料到確定做三代測序,她只用了24小時;梳理完整套完整流程,也僅僅花了48小時。
籌備期間,她還在社交平臺向幾位名校生物專業(yè)的博士生咨詢意見。其中一位博士生并不建議她這么做:不僅成本高,數(shù)據(jù)分析難度也很大,很可能花了大價錢卻得不到有參考價值的結(jié)果。
市面上的商業(yè)基因檢測只會給出簡化的結(jié)果報告,但馮睿洋提出想要拿到三代測序的全部原始數(shù)據(jù)。這個23歲的姑娘有著極強的探索欲——她要親自研究自己的基因組,親手分析出一份屬于自己的基因檢測報告。
說做就做的行動派
馮睿洋是北京一所普通高校信息管理專業(yè)的大四學(xué)生,剛剛完成畢業(yè)論文答辯,她選擇延畢一年,保留應(yīng)屆生身份,給自己留出更多時間規(guī)劃未來方向。
從2025年8月開始,她就在香港科技大學(xué)(廣州)深度交叉智能實驗室岳玉濤課題組擔(dān)任科研助理,日常硬性任務(wù)不多,在接觸AI前沿知識的同時,她還會定期分享自己的研究進(jìn)展。
馮睿洋了解到,天津有一家機構(gòu)可以承接個人三代測序業(yè)務(wù),但樣本運輸是個難題:血液樣本如果處于4℃以上的環(huán)境,DNA會快速降解,影響檢測結(jié)果。
她干脆用了最直接的辦法:自己親自送樣本上門。
3月21日,她回到北京,和朋友郭昂揚一起開車直接到了天津這家機構(gòu)樓下的停車場,在車上完成采血后,她立刻帶著用冰塊冷藏的新鮮樣本提交給機構(gòu)。后續(xù)工作人員告訴她,樣本沒有污染,質(zhì)量非常好,其中不少DNA片段長度超過了3萬個堿基。
4月7日,測序結(jié)果出爐,僅DNA堿基序列數(shù)據(jù)就有131G,加上和癌癥、衰老等多種疾病相關(guān)的DNA甲基化數(shù)據(jù),總數(shù)據(jù)量超過了600G。
接下來才是真正的挑戰(zhàn):馮睿洋要自己動手分析這些龐大數(shù)據(jù)。
她之所以選擇自己動手分析,一方面是商業(yè)機構(gòu)的數(shù)據(jù)分析收費很高,僅僅完成主流的七八項特定分析,收費就要兩三萬元;更重要的是,這有限的幾項分析根本滿足不了她的需求——她想要得到盡可能全面的分析結(jié)果。
作為一個沒有接受過系統(tǒng)生物信息學(xué)訓(xùn)練的本科生,她找來了最強外援:人工智能AI。

馮睿洋的云計算體驗
靠AI協(xié)作,親手產(chǎn)出分析報告
個人基因組測序分析的邏輯,是把個人的DNA序列和人類通用參考基因組做比對,找出基因差異,再結(jié)合現(xiàn)有研究數(shù)據(jù)解讀這些差異,以此評估疾病風(fēng)險、了解祖源信息和個人體質(zhì)特征。
馮睿洋一步步分析,得到了不少有意思的結(jié)果。
4月20日,她發(fā)現(xiàn)自己攜帶紅綠色盲的隱性基因,忍不住感嘆:“如果我是男性,現(xiàn)在就是色盲了?!彼肫鸶咧凶詫W(xué)《陳閱增普通生物學(xué)》的時候,還在紅綠色盲隱性遺傳的章節(jié)做了批注,現(xiàn)在發(fā)現(xiàn)這個結(jié)果,只覺得“太奇妙了”。
在藥物代謝分析結(jié)果中,她看到了自己對不同藥物的耐受程度和禁忌,基因結(jié)果也解開了她生活里的一些小疑問:比如為什么自己皮膚容易泛紅,蹺二郎腿被壓到的腿會紅一大片。
她還發(fā)現(xiàn),這次分析的某個結(jié)果,和她三年前在天壇醫(yī)院做的簡單位點測序結(jié)果完全一致,這也印證了她自己分析處理數(shù)據(jù)的可靠性。
更關(guān)鍵的是,她找到了和親戚所患癌癥相關(guān)的可疑突變。不過雖然發(fā)現(xiàn)了基因異常,但現(xiàn)有研究還沒辦法直接判定她的患病風(fēng)險——目前人類對這種癌癥的基因研究還不夠深入。
馮睿洋發(fā)現(xiàn),有些突變并沒有被收錄到現(xiàn)有的基因數(shù)據(jù)庫中,于是她主動給國內(nèi)外好幾個相關(guān)課題組發(fā)了郵件咨詢。
4月27日,浙江大學(xué)的一位研究員給她回了信:馮睿洋提到的這個基因突變,目前還沒有在人類身上發(fā)現(xiàn)過相關(guān)報道,但小鼠身上的相同突變會引發(fā)健康問題,不過也叮囑她不用太過擔(dān)心,人類和模式動物小鼠之間的差異還是很大的。
兩天后,日本宮崎大學(xué)醫(yī)學(xué)院的一位教授也回信了,說明馮睿洋問到的另一個基因突變,在小鼠身上不會影響健康。
那位浙江大學(xué)的研究員還在回信中表示:“我們非常希望得到您的這份罕見樣本信息,進(jìn)一步擴(kuò)展我們相關(guān)領(lǐng)域的研究,希望可以有更多的發(fā)現(xiàn)以及探索潛在治療方向?!?/p>
直到這一刻,馮睿洋才真切意識到,自己這次親手分析的工作,真的能對生命科學(xué)研究產(chǎn)生價值。
馮睿洋說:“我敢直接動手做,是因為測序結(jié)果的解讀本來就是相對固定的流程,相關(guān)的方法和工具都已經(jīng)公開了,我可以通過和AI合作、自主學(xué)習(xí)完成這些操作?!?/p>

馮睿洋和AI的合作過程
這件事其實也意味著科研操作正在走向平民化,原來橫亙在不同專業(yè)之間的森嚴(yán)壁壘,正在慢慢松動。
更讓人意外的是,馮睿洋就讀的大學(xué)甚至沒有開設(shè)生物學(xué)專業(yè),所有和基因檢測相關(guān)的知識,都是她自學(xué)而來。她并沒有精通每一個生物學(xué)細(xì)節(jié),但可以借助AI輕松跨越專業(yè)門檻,完成跨領(lǐng)域的工作。
不走尋常路的成長軌跡
在熟悉馮睿洋的人看來,她這次做出這種“跨界操作”一點都不意外——她一直就是個不走尋常路的人。
早在2018年,剛上高中的馮睿洋讀了《奇點臨近》《未來簡史》這類探討未來發(fā)展的書籍之后,突然擁有了一種更宏大的視角:她覺得自己的人生就像在玩《地球Online》這款開放式游戲。
從那時候開始,她就專門收集自己的個人數(shù)據(jù),包括海量錄音、大量照片截圖、無紙化筆記、社交軟件聊天記錄等等。最開始她只是想做一份屬于自己的“外部記憶”,在別人看來,這其實就是數(shù)字永生的一種實踐。
馮睿洋積累了數(shù)萬個文件,總內(nèi)容接近10TB,她還通過音頻轉(zhuǎn)文字技術(shù),利用本地大模型做了簡單的數(shù)據(jù)處理,做出了一個初步的“數(shù)字生命”。2024年,她還在廣州舉辦的機器人人文學(xué)術(shù)研討會上,分享了自己的這項研究。
用現(xiàn)在的流行詞來說,她相當(dāng)于提煉出了自己的個人能力模型,但后來她發(fā)現(xiàn)這項工作牽扯到太多隱私安全、數(shù)據(jù)歸屬、倫理層面的問題,就沒有再繼續(xù)推進(jìn)了。
馮睿洋這種不走常規(guī)的嘗試,遠(yuǎn)不止這一次。
高一的時候,她組織過中學(xué)生哲學(xué)大會,后來這個活動慢慢發(fā)展成了全國性的中學(xué)生哲學(xué)活動;大學(xué)期間,她在科學(xué)社區(qū)集智俱樂部主持通用人工智能AGI主題的讀書會,這個讀書會會定期邀請教授或者行業(yè)大佬分享,參與者大多是研究生,馮睿洋是活動的策劃人和主持人。她讀了大量和大模型相關(guān)的文獻(xiàn),和參與者討論“什么是智能”,也積累了不少AI前沿知識,也正是在這個讀書會上,她認(rèn)識了岳玉濤。
這些經(jīng)歷都不是傳統(tǒng)校園課堂能帶給她的,全都是她走出課堂自由探索得到的收獲。
那時候馮睿洋背不進(jìn)去英語單詞,她的英語老師發(fā)現(xiàn),這個孩子很有自己的想法,不喜歡的事情堅決不會做,“哪怕跟她說這個對高考很重要,她也不會去做”。
之后馮睿洋決定脫離學(xué)校課堂,從高二開始就很少到學(xué)校上課了。她所在的是北京海淀區(qū)的一所高中,“尊重個性”是學(xué)校的辦學(xué)核心理念之一,校長也給了她足夠的自由空間。她買了各個學(xué)科的大學(xué)教材自學(xué),同時毫無顧慮地參與各種自己感興趣的活動。
她的自學(xué)也得到了正向反饋:2019年11月,很多本科生參賽的北京師范大學(xué)實驗科學(xué)錦標(biāo)賽上,還是高中生的馮睿洋拿到了二等獎,這也讓她覺得,“985大學(xué)學(xué)生的水平也沒有那么難達(dá)到”。
她決定自學(xué)還有一個原因:高一的時候她就去過美國波士頓,在華人科學(xué)家創(chuàng)辦的腦機接口公司強腦科技BrainCo實習(xí)了兩個月,這家孵化自哈佛大學(xué)創(chuàng)新實驗室的公司,讓她見識到前沿科技的發(fā)展速度,也讓她意識到,未來30年社會需要的知識和技能,和當(dāng)下學(xué)校教授的內(nèi)容完全不同,如果按部就班跟著課堂走,不知道自己能不能適應(yīng)未來社會。
遠(yuǎn)離課堂也帶來了一個結(jié)果:她的考試成績逐漸下滑,復(fù)讀一年之后,她的高考分?jǐn)?shù)在北京只能報考一所雙非院校。雖然也會羨慕其他同學(xué)的名校光環(huán),但她覺得自己現(xiàn)在的發(fā)展?fàn)顟B(tài)“剛剛好”。
馮睿洋說,她從高中開始就參加集智俱樂部的各類活動,從某種意義上來說,她不少知識和研究方法都是在這里跟著北京師范大學(xué)的老師學(xué)到的。到了大學(xué)之后,她更是按照自己的節(jié)奏學(xué)習(xí),從大二開始就很少去上課了,AI成了她最重要的學(xué)習(xí)幫手,而ChatGPT正好就是在她19歲那年推出的。
馮睿洋的朋友郭昂揚現(xiàn)在是首都醫(yī)科大學(xué)的大四學(xué)生,他認(rèn)為:“疫情期間,應(yīng)試教育和唯成績論的體系出現(xiàn)了松動,給了我們突破傳統(tǒng)學(xué)習(xí)模式的機會。而AI正好適合知識面廣但不精通細(xì)枝末節(jié)的人完成跨領(lǐng)域工作,剛好契合我們這類人的情況?!?/p>
拒絕被定義的野生極客
馮睿洋還是一個電競愛好者,早在高中的時候,她就去電競俱樂部當(dāng)過領(lǐng)隊,還在《電子競技》雜志做過實習(xí)生。她現(xiàn)在正在推進(jìn)的一個項目,就是為電競選手定制營養(yǎng)補劑方案。
她會根據(jù)選手的體重、代謝、心率、呼吸等個人數(shù)據(jù),用AI推薦補劑的劑量、服用時間和組合方案,還會實時監(jiān)測調(diào)整方案。這個項目屬于生命科學(xué)和信息科學(xué)的交叉領(lǐng)域,核心不是銷售補劑,而是給選手提供個性化的精準(zhǔn)方案。
她接下來計劃報考研究生,這樣既可以平衡個人追求和家庭、社會的期待,也能拿到一個得體的社會身份,獲得更多自由探索的時間。
戴旭升對馮睿洋有著不一樣的觀察,兩人是因為人大附中的活動認(rèn)識的。高三的時候,戴旭升打算創(chuàng)業(yè)做零脂肪薯片,找投資人,馮睿洋直接投了2000元。三年后項目失敗,戴旭升把專利賣出了幾十萬元,把本金和利息一并退給了馮睿洋。
后來兩人還一起多次參加支教活動,戴旭升是地區(qū)負(fù)責(zé)人,馮睿洋負(fù)責(zé)一部分具體工作。
現(xiàn)在戴旭升是清華大學(xué)教育學(xué)院的研究生,研究方向正好是未來教育。他認(rèn)為,馮睿洋之所以幾乎完全拋開學(xué)校課堂學(xué)習(xí),很大一部分原因是初中的時候被類似衡水中學(xué)的高強度應(yīng)試教育模式影響,所以到高中之后走向了另一個極端。
大概在2023年,馮睿洋想做一個音樂大模型項目,找戴旭升融資,戴旭升后來回憶:“那個項目拖了一年多,想法很好,我們也討論了很多內(nèi)容,但后來沒能推進(jìn)下去,錢就又退給我了?!?/p>
在戴旭升看來,馮睿洋的自學(xué)模式有兩面性:一方面給了她足夠的時間自由探索,但另一方面也讓她缺少系統(tǒng)做事的訓(xùn)練,也缺少持之以恒的習(xí)慣。
戴旭升說:“對于馮睿洋的未來,我大概不會投她的種子輪和天使輪,但會投她的A輪。”
這就是真實的馮睿洋,她不是傳統(tǒng)意義上完美的“學(xué)霸”,而是一個充滿棱角、拒絕被現(xiàn)有體系定義的野生極客。
好在她足夠年輕,有充足的資本去自由探索,也有足夠?qū)拸V的空間,去修正、定義屬于自己的人生主線。
本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com





