作者丨洪雨欣,編輯丨陳彩嫻
“一家三甲醫(yī)院頂級??坪鸵患掖髲S,擁抱AI醫(yī)療的決心。”? ? ? ? ? ? ? ?? ? ??? ? ?? ? ? ?? ? ??
“DeepSeek 一上線,行業(yè)有個聲音是醫(yī)生以后可能就沒飯吃了?!苯谠谝粓龉_活動中,上海交通大學醫(yī)學院附屬仁濟醫(yī)院(下簡稱“仁濟醫(yī)院”)副院長、泌尿科學科帶頭人薛蔚說道。這番話的另一面,是傳統(tǒng)醫(yī)療機構對新一代AI技術的價值重估。2025 年開年,DeepSeek掀起了大模型領域的新走向,將行業(yè)落地的算力、算法門檻都大幅降低,使得AI與產業(yè)融合開始爆發(fā),醫(yī)療就是其中的熱門場景之一。
一時間,涌入了更多參賽者。有以騰訊、華為、京東、螞蟻為代表的頭部大廠,也有商湯、訊飛這樣的科技巨頭。一方面,醫(yī)療行業(yè)需要AI:醫(yī)患比例不平衡,使醫(yī)院增效需求明顯,分級診療的推進,也需要快速縮小各級機構診斷能力的差別。當前,先進模型在醫(yī)學問答測試中的部分表現已經超越全科醫(yī)生水平。另一方面,AI也需要醫(yī)療:AI醫(yī)療上限還遠未到達,專才大模型得靠高質量醫(yī)療數據的調教,需要行業(yè)進一步合理利用數據、驅動創(chuàng)新發(fā)生。
在仁濟醫(yī)院,更早一步的探索已經顯露出階段性成果:基于螞蟻醫(yī)療大模型開發(fā)的仁濟醫(yī)院泌尿外科智能體(簡稱“RJUA智能體”),涵蓋98%常見泌尿系統(tǒng)疾病類別,上線支付寶AI健康管家運行8個月以來,服務30多萬病人,已超出仁濟醫(yī)院泌尿科半年的門診量。這是首個用疾病結構化數據訓練、在真實醫(yī)療場景運行的??浦悄荏w,采用上海仁濟醫(yī)院97.6%疾病譜的標準化病例數據集,以及20多個??漆t(yī)生撰寫的場景疾病知識圖譜,首次將三甲醫(yī)院診療邏輯與AI技術結合。根據院方評測結果顯示,在該智能體的輔助下,基層醫(yī)生診斷準確率可提升4%-8%,已初步具備“下基層”的能力。
01、大模型需要醫(yī)生
專攻專攻,有專才可攻,這句話放在AI醫(yī)療領域依然適用?!捌鋵嵑芏噌t(yī)院接入DeepSeek還不知道怎么用,一些醫(yī)院推出大模型還沒有具備臨床使用的能力??萍己歪t(yī)療的結合,不是丟給大模型一些醫(yī)院數據就夠用了?!币晃会t(yī)生坦言。目前,通用大模型在一些基礎全科疾病的診療上已擁有較高準確率,但??圃\療智能體仍然是探索AI醫(yī)療的深水區(qū)。
仁濟醫(yī)院在內部做過一個研究:50位仁濟醫(yī)院的實習醫(yī)生(平均年齡21歲)、50位上海各個社區(qū)衛(wèi)生服務中心的全科醫(yī)生(平均年齡49歲)和50位來仁濟進修的區(qū)縣級三級醫(yī)院的泌尿外科??漆t(yī)生(平均年齡39歲)對1000名真實患者進行問診,并分別和RJUA、DeepSeek等主流產品的診斷結果進行比對。對比測試中,市面上的醫(yī)療大模型,包括DeepSeek,準確率都在40-50%之間,只相當于全科醫(yī)生的水平。而RJUA以69.81%的準確率擊敗了社區(qū)醫(yī)生(48.33%)和實習醫(yī)生(43.85%),基本接近專科醫(yī)生的水平(73.65%)。
70%和50%的數據差異,其關鍵在于“大模型的老師是誰,是不是這個學科最頂級的醫(yī)生”。大多數醫(yī)療大模型的“語料”來自臨床指南、科研文獻及少量的真實診療數據,而RJUA的知識庫則完全由仁濟醫(yī)院醫(yī)生團隊共同完成。仁濟泌尿科是國內體量最大的泌尿外科臨床診療中心。仁濟醫(yī)院泌尿科主任潘家驊提到,“我們每年有55萬人次的就診量,手術量在3萬例以上,將近120位臨床醫(yī)生,每年的產值將近達到12個億。
如此之大的臨床體量,為形成仁濟泌尿智能體語料庫提供了非常重要的數據來源?!睔v時半年時間,仁濟醫(yī)院和螞蟻集團共同完成國內首個臨床專科推理數據集的構建,總共包含2132個問答對,對應25000多條診療依據和臨床數據,涉及67個泌尿系統(tǒng)常見疾病,病種覆蓋人群超過泌尿科就醫(yī)人群的97.6%。
“在醫(yī)療領域,精準知識的訓練比注入規(guī)?;瘮祿匾?,除了教給AI醫(yī)學文獻和指南,關鍵還在讓AI學會醫(yī)生的邏輯和思維,因此在這個過程中頂尖醫(yī)生與技術應該成為搭檔。”仁濟醫(yī)院泌尿外科主治醫(yī)生、RJUA智能體項目的主要參與者遲辰斐對雷峰網表示。醫(yī)生深度參與,??拼竽P筒拍軌蚋诱鎸嵉啬M診療路徑。
02、螞蟻醫(yī)療大模型進醫(yī)院的730天
2023年3月,螞蟻醫(yī)療大模型團隊和仁濟醫(yī)院泌尿科醫(yī)生第一次見面?!袄辖淌邳S翼然分享自己在陜西農村義診的經歷,看到一些基層患者因為得不到及時和專業(yè)的救治最終走向生命的終點。基層患者也因缺乏診療認知,得了病要不忍著,要不找村醫(yī),往往不能對癥下藥?!蔽浵伡瘓F仁濟合作項目核心技術成員申月對此印象深刻。
當時,百億規(guī)模的大模型僅具備對話的能力,推理能力處于明顯的弱勢。如果能通過知識圖譜和醫(yī)療專家的合作,數字化三甲醫(yī)生的臨床經驗,結合大模型去做to b的產品,就能點對點地到相關的基層里面去給老百姓們做診療。于是,在仁濟醫(yī)院泌尿科和螞蟻集團的合作下,由7個權威醫(yī)生、10個專業(yè)技術團隊構成的項目組成立了。愿景雖美,難度卻大。如果單是給模型喂養(yǎng)文獻數據,大部分的通用模型都能做到。
最大的挑戰(zhàn)是——如何把醫(yī)生腦袋里的知識“蒸餾”出來。在和醫(yī)生溝通的過程中,申月發(fā)現,醫(yī)生的決策判斷和經驗很難被數字化,而不能數字化,大模型就學不會。對此,雙方確認了兩條訓練路徑來突破瓶頸。第一條,圍繞近5年泌尿??频臋嗤\療指南和論文,搭建一個模型基座。第二條,構建一個專科的推理數據庫,對模型進行數據訓練。為了搭建??茢祿欤浵佀惴▓F隊翻出了2019到2023年五年間仁濟醫(yī)院的所有病例資料,涵蓋門診診療、急診搶救、住院手術和操作及日常科普等多種形式。覆蓋的病例范圍不僅有常見疾病,還有復雜罕見的疾病。螞蟻先后挑選了2132個病例,在此基礎上模擬設計出各種各樣的虛擬患者,讓醫(yī)生對他們進行問診,再將問答過程投喂給模型。
在知識圖譜的構建上,螞蟻和仁濟磨和了很久。圖譜的搭建觸及到主導權的問題:醫(yī)生、算法、工程,到底由誰來主導?如果完全由醫(yī)生主導,他更多重心是在兩個癥狀之間的關系,而非知識圖譜的底層設計。但由技術人員主導,很多經驗和數據又沒法驗證。為了平衡醫(yī)生和技術團隊的知識,雙方每周基本上每個時間都會在釘釘上面交流,“醫(yī)生每天也很忙,我們經常半夜的時候打電話讓他們驗收數據,就是這樣一步步過來的?!边t辰斐回憶道,光是構建專業(yè)語料庫,前后就耗時數月。光前列腺增生這一個病種,就需要參考上萬條病例信息,把可能涉及的癥狀,影像資料、化驗指標全都編出來,再在模型給出的診斷結果上進行標注。
但是,拿出數據以后呢?需要參考什么資料進行診療?要融合醫(yī)生的思維鏈,還得結合指南里的診療方案和醫(yī)生的臨床經驗對病例進行修改。這又是一個難題,因為??浦改虾驼撐纳婕按罅繌碗s的醫(yī)學知識,而且現實中醫(yī)生也不會完全照著指南上的步驟進行診療。申月認為,如果技術人員不懂怎么看病例,那大模型肯定也學不會。只有懂了,才能更好地訓練它。
為了加深對醫(yī)學知識的理解,在項目啟動的三、四個月里,申月的團隊有80%以上的時間都花在學習泌尿相關專業(yè)知識上,也曾穿著白大褂和醫(yī)生一塊出門診,大家在辦公室里也開始頻繁地聊起PSA值之類的臨床術語。申月每周都要和醫(yī)生開至少兩次會,討論病例、梳理指南。他們還向基層醫(yī)生和專家請教,結合醫(yī)生理性和非理性的思維,打造大模型的思維鏈路。申月開玩笑道,大模型出來之后,你會感覺這個世界上的各種知識一下子離你很近了。她甚至利用業(yè)余時間研讀在職醫(yī)學博士課程。他們還做了一個很有意思的事,申月給了仁濟醫(yī)院的醫(yī)生一個錄音筆,在經門診患者同意的情況下進行了多段錄音,以此收集更多真實患者反饋的數據?!拔覀兿M玫礁嗷颊叩脑V求數據,讓大模型看看他的能力怎么樣?!?/p>
通過驗證,他們發(fā)現大模型已具備理解患者的能力?!叭绻颊叩男枨笫遣豢紤]手術方案,那大模型就不會推給他?!睆?3年9月到24年9月,整整一年多的時間,螞蟻和仁濟都在磨合??仆评淼臄祿痛竽P偷耐评砟芰?。在雙方的推動下,模型的尺寸從最開始的10B擴大到現在的600B,能夠幫助智能體的能力越來越像一個真正的醫(yī)生。深度綁定的合作形態(tài),也帶來了突破性的研究成果。2023年12月,首個基于中文語料的??茊柎饠祿疪JUA-QA發(fā)布;2024年4月,基于醫(yī)療真實場景的場景AI專科測評體系——RJUA測評體系面世;2024年9月,國內首個由醫(yī)生深度參與開發(fā)的??浦悄荏w——RJUA智能體上線。
“將三甲醫(yī)師的水平封裝進大模型”,這句話正在逐步成真。正所謂長風破浪會有時,螞蟻和仁濟的合作,也許會是一個AI向下扎根醫(yī)療行業(yè)的有效路徑。
03、向下扎根,步入醫(yī)療行業(yè)的深處
與仁濟醫(yī)院的共建,是行業(yè)中的一條“少數派”路徑,也可以被視為螞蟻布局AI醫(yī)療的內在思路?!霸卺t(yī)療這個領域,我們要‘敬畏行業(yè),趴地而行’。11年前開始,我們就深知干醫(yī)療沒有捷徑,支付寶從能做的事開始做起,啃的都是醫(yī)療行業(yè)的硬骨頭?!拔浵伡瘓F數字醫(yī)療健康事業(yè)部總經理張俊杰曾表示。
以支付為起點,2014年螞蟻開始探索與醫(yī)院合作,2016年上線醫(yī)保線上支付服務、打造“未來醫(yī)院”,如今,支付寶醫(yī)療健康已經是國內規(guī)模最大的醫(yī)保第三方在線服務平臺。以大模型為支點,2023年,螞蟻在大模型發(fā)展中選擇醫(yī)療健康作為重點發(fā)力方向。
自研底座通用大模型加入了強大的專家知識增強,使得醫(yī)療大模型可以更嚴謹、更符合產業(yè)落地的實際需求。螞蟻還聯合硬件廠商、醫(yī)療信息化領域企業(yè),共同探索AI醫(yī)療產品。由此,面向下一個十年,螞蟻構建出了一個以AI為核心能力,銜接底層技術廠商、上層醫(yī)療機構客戶等維度的AI醫(yī)療開放生態(tài)。互聯網醫(yī)療是連接,AI醫(yī)療則是擴容。醫(yī)療大模型的賽道從不缺乏競爭的身影,各家能否抵達彼岸,仍是一個未知數,但可以明確的是,螞蟻已先行一步。