欧美三级电影完整|亚洲一二三四久久|性爱视频精品一区二区免费在线观看|国产精品啪啪视频|婷婷六月综合操人妻视频网站|99爱免费视频在线观看|美女一级片在线观看|北京熟女88av|免费看黄色A级电影|欧美黄色毛片儿

王小川直言醫(yī)療AI“虛假過多”,新模型幻覺率僅2.6%且推兩周免費政策

01-24 06:24
新模型將面向部分企業(yè)和機構(gòu)長期免費開放。

1月22日,百川智能推出了Baichuan-M3-Plus詢證增強醫(yī)療大模型,該模型沿用了M2-Plus同款的“六源詢證”方法,再次刷新行業(yè)最佳水平,幻覺率低至2.6%。


不僅如此,Baichuan-M3-Plus還創(chuàng)新應(yīng)用了“證據(jù)錨定”技術(shù),讓AI回答里的每個結(jié)論都能精準對應(yīng)到原文獻的具體位置,據(jù)稱匹配率高達95%,遠超行業(yè)40%-50%的平均水平。


該模型以API模式對外服務(wù),價格較前代下降70%,發(fā)布后兩周內(nèi)免費,為醫(yī)務(wù)工作者提供服務(wù)的機構(gòu)可通過“海納百川計劃”長期免費使用。


Baichuan-M3-Plus發(fā)布之時,智東西等媒體走進百川總部,與百川智能創(chuàng)始人兼CEO王小川、模型技術(shù)負責人鞠強深入交流,他們分享了M3 Plus的技術(shù)細節(jié)及對行業(yè)熱點的看法。



交流中,王小川多次強調(diào),醫(yī)療AI的核心目標必須聚焦患者利益。他主動回應(yīng)張文宏“拒絕AI入病歷系統(tǒng)、擔心影響年輕醫(yī)生成長”的觀點,直言若因擔憂AI影響醫(yī)生訓練而限制應(yīng)用,本質(zhì)是讓當下患者成為醫(yī)生成長的成本。


在他看來,“AI+醫(yī)生”在多場景已展現(xiàn)出優(yōu)于單純依賴醫(yī)生的潛力,且醫(yī)生也存在判斷偏差與“幻覺”,從客觀數(shù)據(jù)看,當前醫(yī)療AI的幻覺率并不比人類醫(yī)生高。


同時,王小川提到中國醫(yī)生對AI工具接納度低,并非模型能力不足,而是醫(yī)療系統(tǒng)高強度運轉(zhuǎn)與行業(yè)風氣所致。


一方面,國內(nèi)醫(yī)生單日接診量遠高于海外,幾乎沒時間真正使用和驗證AI工具;另一方面,醫(yī)療AI領(lǐng)域缺乏求真氛圍,“虛假東西太多”,真正有技術(shù)突破的產(chǎn)品反而難快速建立信任。


他呼吁國內(nèi)行業(yè)應(yīng)良性競爭,讓醫(yī)療行業(yè)更真實,這樣發(fā)展速度才會加快,否則會出現(xiàn)很多“皇帝的新衣”。


當被問及百川API客戶群體畫像時,王小川回應(yīng),M3發(fā)布前已有一批機構(gòu)用戶,包括醫(yī)院和為醫(yī)院提供科研輔助的中小企業(yè)。M3發(fā)布后,隨著近期價格調(diào)整和合作推進,客戶結(jié)構(gòu)預(yù)計會有較大變化。


體驗鏈接:https://www.baichuan-ai.com


01.從六源詢證到證據(jù)錨定,讓醫(yī)療AI實現(xiàn)“白盒化”


上周,百川智能開源了當前業(yè)界醫(yī)學能力領(lǐng)先的開源模型Baichuan-M3,該模型在權(quán)威醫(yī)療AI基準測試HealthBench中位居全球第一,表現(xiàn)超過OpenAI最強模型。


Baichuan-M3-Plus以M3為基礎(chǔ),結(jié)合首創(chuàng)的“六元循證系統(tǒng)”,在M3原有抗幻覺能力上進一步降低了幻覺發(fā)生率。



百川對“降低幻覺率”的堅持,源于當前醫(yī)療AI領(lǐng)域的突出問題?,F(xiàn)場演示中,鞠強指出部分醫(yī)療AI產(chǎn)品存在幻覺現(xiàn)象:AI生成的答案看似專業(yè),引用了論文、指南等來源,但實際錯誤率可能高達90%。這種“看似專業(yè)”的幻覺,對經(jīng)驗不足的醫(yī)生或普通用戶風險更大。


這類幻覺常因AI引用內(nèi)容與支持表述缺乏實質(zhì)關(guān)聯(lián)。


對醫(yī)生和用戶而言,核驗這些引用的正確性過程繁瑣,需耗費大量時間逐條核對,反而可能增加工作負擔。


為此,百川創(chuàng)新引入“證據(jù)錨定技術(shù)”,確保模型引用段落與表述嚴格對應(yīng),可精確定位至原文位置,使證據(jù)具備可核驗、可追溯性,最終實現(xiàn)診療輔助過程的“白盒化”。



Baichuan-M3-Plus采用低成本API模式服務(wù),通過模型架構(gòu)、Infra等工程優(yōu)化,API價格較前代下降70%。


發(fā)布后兩周內(nèi),Baichuan-M3-Plus完全免費。此外,王小川宣布“海納百川計劃”,面向所有為醫(yī)務(wù)工作者服務(wù)的機構(gòu)免費提供M3-Plus API服務(wù),以促進行業(yè)協(xié)作發(fā)展,這項免費服務(wù)成本最高或達1億元左右。


新模型API價格大幅下調(diào)有多重原因。鞠強介紹,上一代M2是稠密模型,M3架構(gòu)切換為MoE,本身帶來不少成本收益。


同時,百川升級了投機采樣技術(shù)Eagle3,加入門控機制,進一步提升推理效率。


02.王小川回應(yīng)“AI影響醫(yī)生成長”:患者不應(yīng)為醫(yī)生成長買單


日前,張文宏拒絕AI入醫(yī)院病歷系統(tǒng)、認為會影響年輕醫(yī)生成長的言論引發(fā)熱議。


王小川在采訪中主動提及該討論并全面回應(yīng)。


他認為患者利益應(yīng)放在首位,“AI+醫(yī)生”模式已顯示出優(yōu)于單純依賴醫(yī)生的潛力,符合醫(yī)學發(fā)展規(guī)律。若因擔憂AI影響醫(yī)生成長而限制應(yīng)用,實則阻礙對患者有益的技術(shù)進步——“醫(yī)生成長不能以當下患者為成本”。醫(yī)生也有幻覺,目前AI幻覺率其實比醫(yī)生更低。


在應(yīng)用方式上,王小川認為可探索調(diào)整,若擔心醫(yī)生能力退化,可讓AI輔助年輕醫(yī)生,在診療中提供實時提醒與校驗。


王小川還談到醫(yī)院做大模型的現(xiàn)象,他認為“醫(yī)生是用模型的,不是造模型的,就像AlphaGo不是圍棋選手造的”,雙方應(yīng)做好專業(yè)分工。


百川與醫(yī)生群體合作密切,鞠強提到,百川有一支專業(yè)專職醫(yī)生團隊,成員有豐富一線醫(yī)療經(jīng)驗,部分來自三甲醫(yī)院全職加入,還與合作醫(yī)院深度協(xié)作,有醫(yī)生長期駐場提供醫(yī)學指導。


此外,百川還有一個覆蓋主要臨床學科的兼職醫(yī)學專家團,規(guī)模達數(shù)百人,為模型研發(fā)提供專業(yè)知識和數(shù)據(jù)支持。


03.察言觀色的醫(yī)療AGI三年可期,國內(nèi)采用率低非模型之過


王小川預(yù)判,具身智能領(lǐng)域能做手術(shù)的AI還較遠,但具備表達、察言觀色能力的AGI級別AI醫(yī)生有望三年內(nèi)實現(xiàn)。


采訪中提到,美國醫(yī)療AI工具OpenEvidence在醫(yī)生中的滲透率達45%,但中國醫(yī)生接納度、使用率仍不高。


王小川認為這并非模型能力問題,而是國內(nèi)醫(yī)療系統(tǒng)現(xiàn)狀和行業(yè)風氣所致。


一方面,中國醫(yī)生工作壓力大,美國醫(yī)生一天看10個病人,中國醫(yī)生可能看50-100人,平均每個患者僅3-5分鐘,沒時間好好使用AI產(chǎn)品。


另一方面,國內(nèi)醫(yī)療AI產(chǎn)品未真實展現(xiàn)技術(shù)進展,虛假產(chǎn)品過多,真產(chǎn)品難快速獲信任。他呼吁行業(yè)真誠評價技術(shù)進展,推動良性競爭,讓醫(yī)療行業(yè)更真實,否則會有很多“皇帝的新衣”。


關(guān)于AI醫(yī)療的責任邊界,王小川認為現(xiàn)行法規(guī)下AI不能直接做最終診斷,權(quán)力責任仍由醫(yī)生承擔,AI是輔助工具;美國部分地區(qū)已允許AI直接開處方,為中國未來制度探索提供參考。


商業(yè)模式上,百川不會復(fù)制美國OpenEvidence通過藥企營銷變現(xiàn)的路徑,而是堅持符合中國國情,在合規(guī)前提下通過學術(shù)體系參與醫(yī)療生態(tài)建設(shè),需尋找不同于美國的價值回報方式。


AI制藥領(lǐng)域,百川重點不在早期分子發(fā)現(xiàn)或患者招募,而是通過藥效評價、藥物伴隨和數(shù)字化伴隨體系,提高真實世界藥物療效,屬于精準醫(yī)療方向。


針對醫(yī)療AI“幻覺”可接受閾值,王小川指出由醫(yī)院和醫(yī)療體系決定,而非企業(yè)單方面設(shè)定;百川定位先輔助醫(yī)生,再服務(wù)患者。未來兩到三年,隨著醫(yī)生對AI工具的適應(yīng),醫(yī)療行業(yè)對AI接受度有望顯著提升,需政策、行業(yè)伙伴與技術(shù)共同推動。


04.結(jié)語:醫(yī)療AI熱度高漲,落地與信任是關(guān)鍵


近幾周,AI醫(yī)療健康領(lǐng)域新玩家增多,國外OpenAI、Anthropic,國內(nèi)京東等大廠及多家創(chuàng)企相繼發(fā)布新品,賽道熱度攀升。


但正如采訪中反復(fù)提到的,影響醫(yī)療AI落地的不只是模型能力,獲取用戶和專業(yè)醫(yī)生的信賴、結(jié)合真實場景解決具體問題,或許比發(fā)布模型和產(chǎn)品更關(guān)鍵,也更考驗企業(yè)長期投入。


本文來自微信公眾號“智東西”(ID:zhidxcom),作者:陳駿達,編輯:李水青,36氪經(jīng)授權(quán)發(fā)布。


本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。

免責聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com