每日經(jīng)濟(jì)新聞 2024-09-17 22:49:28
每經(jīng)記者 林姿辰 每經(jīng)編輯 張海妮
距離谷歌大模型(MedPaLM 2)拿下美國(guó)醫(yī)學(xué)執(zhí)照考試已經(jīng)快兩年了,人工智能(AI)夠資格成為臨床醫(yī)生的“假想敵”了嗎?
今年7月,一篇發(fā)表于Nature Medicine的論文顯示,即使是目前最先進(jìn)的大語(yǔ)言模型(LLM)也無法為所有患者作出準(zhǔn)確診斷,且診斷正確率(73%)明顯差于人類醫(yī)生(89%);在極端情況(膽囊炎診斷)下,LLM的正確率僅為13%。
但對(duì)于北京清華長(zhǎng)庚醫(yī)院神經(jīng)中心醫(yī)師邳靖陶來說,他今年剛被AI“上了一課”。8月下旬,邳靖陶參與的靈犀醫(yī)學(xué)腦血管病專病大模型正式發(fā)布,該模型由其所在醫(yī)院的神經(jīng)中心武劍教授團(tuán)隊(duì)主導(dǎo)研發(fā),是國(guó)內(nèi)首個(gè)基于專病的醫(yī)學(xué)人工智能模型。
“大模型的能力說強(qiáng)也強(qiáng),說弱也弱,我們不能讓它天馬行空地自由發(fā)揮。”邳靖陶表示,專病大模型與ChatGPT的最大不同,是要將AI杜撰的似是而非的診療建議扼殺在搖籃里,避免災(zāi)難性后果。
8月下旬,靈犀醫(yī)學(xué)腦血管病專病大模型正式發(fā)布,該模型由北京清華長(zhǎng)庚醫(yī)院神經(jīng)中心武劍教授團(tuán)隊(duì)主導(dǎo)研發(fā),是國(guó)內(nèi)首個(gè)基于專病的醫(yī)學(xué)人工智能模型。圖為靈犀醫(yī)學(xué)大模型技術(shù)交流會(huì)現(xiàn)場(chǎng)。 受訪者供圖
對(duì)標(biāo)??坪蛯2<?/strong>
作為國(guó)內(nèi)四大慢病之一,腦血管病的首次發(fā)病者約有三分之二是60歲以上的老年人,其具有“高發(fā)病率、高患病率、高死亡率、高復(fù)發(fā)率”的特點(diǎn)。而截至2021年,我國(guó)65歲及以上的老年人口已經(jīng)超過2億人,腦血管病醫(yī)生短缺、水平參差不齊的問題尤為突出。
“基層醫(yī)院不缺全科醫(yī)生,但缺??茖<一?qū)2<?,這就是大模型要解決的問題。”邳靖陶介紹,腦血管病專病大模型是醫(yī)療機(jī)構(gòu)與科技企業(yè)的合作產(chǎn)物。具體來說,新華三集團(tuán)提供技術(shù)人員、AI算法和算力,北京清華長(zhǎng)庚醫(yī)院和清華大學(xué)提供大數(shù)據(jù)和臨床需求,共同打造一款面向臨床醫(yī)生的輔助診斷工具。
武劍教授曾表示,醫(yī)學(xué)人工智能在緩解醫(yī)療資源緊張和提升醫(yī)療服務(wù)水平方面,具有巨大的潛力和優(yōu)勢(shì)。其核心在于對(duì)海量健康數(shù)據(jù)的深度挖掘和智能分析,這能夠大幅提升臨床診斷和治療的準(zhǔn)確性與效率。
目前,這個(gè)大模型的核心功能是分析和提取病歷中的關(guān)鍵信息,并與臨床知識(shí)庫(kù)相匹配,最終提供符合臨床指南的標(biāo)準(zhǔn)化治療建議。
一方面,臨床醫(yī)生可以輸入脫敏(不包括患者個(gè)人信息)的臨床病程信息,由大模型生成最終的治療方案。其間,如果大模型察覺到病程信息存在疏漏,會(huì)提醒醫(yī)生及時(shí)補(bǔ)充,保證病歷記錄的標(biāo)準(zhǔn)化。
另一方面,臨床醫(yī)生也可以輸入患者主訴(如主要癥狀和持續(xù)時(shí)間等信息)等簡(jiǎn)單信息,大模型將通過選擇性交互引導(dǎo)問診方向,根據(jù)醫(yī)生點(diǎn)擊的選項(xiàng),逐步完善臨床診療過程,提升醫(yī)生的循證能力。
專業(yè)性體現(xiàn)在兩方面
在邳靖陶看來,與ChatGPT等通用大模型相比,專病大模型的專業(yè)性體現(xiàn)在思維鏈和知識(shí)庫(kù)兩方面。以腦血管病專病大模型為例,其數(shù)據(jù)來源包括兩大部分:一部分是經(jīng)過脫敏處理的臨床資料,涉及疾病的特定特征,發(fā)病情況以及診療過程等綜合信息。另一部分是公開獲取的臨床指南、大量神經(jīng)病學(xué)和神經(jīng)科學(xué)的教科書和參考書籍,這些構(gòu)成了數(shù)據(jù)庫(kù)的核心內(nèi)容。值得注意的是,大模型并不能直接接收這些知識(shí),而是需要經(jīng)臨床醫(yī)生和工科團(tuán)隊(duì)之手,將臨床指南的框架和重點(diǎn)內(nèi)容重新整理,轉(zhuǎn)化為計(jì)算機(jī)能夠理解的語(yǔ)言和流程后,再輸給大模型。
“如果不加限制地直接投喂,大模型會(huì)發(fā)散到其他方面,生成一些新的理解。但臨床指南已經(jīng)是最高級(jí)別的標(biāo)準(zhǔn)化診療推薦,在此基礎(chǔ)上的任何修改都是錯(cuò)誤的,也不是我們想要的。”邳靖陶告訴記者,想讓大模型“聽話”,除了要投喂計(jì)算機(jī)能“聽懂”的知識(shí),更關(guān)鍵的是教給它一套臨床醫(yī)生的“思維鏈”,并依托這一能力對(duì)不同患者的臨床資料進(jìn)行推理。
例如,一位腦血管病醫(yī)生的診療流程大致包括詢問病史,進(jìn)行體格檢查,考慮輔助檢查,綜合分析后給出準(zhǔn)確診斷等環(huán)節(jié)?;谠\斷結(jié)果,醫(yī)生會(huì)考慮患者的具體病因和其他基礎(chǔ)疾病情況,結(jié)合標(biāo)準(zhǔn)化的診療建議,制定規(guī)范化的治療方案。
在這個(gè)過程中,不同的患者主訴指向不同的詢問方向。但問題是,大模型的思維雖然“發(fā)散”,但不具備自主搭建思維鏈的能力,所以需要工科團(tuán)隊(duì)深刻理解臨床診療場(chǎng)景,將醫(yī)生的臨床思維轉(zhuǎn)換為機(jī)器可以理解的思維。而這個(gè)過程讓臨床醫(yī)生和技術(shù)團(tuán)隊(duì),都經(jīng)歷了交叉學(xué)習(xí)的歷練。
“Gap(差距)主要是語(yǔ)言交流上的障礙,比如我們不理解思維鏈,他們不理解不同疾病間的關(guān)系。但這不會(huì)對(duì)我們的研究造成實(shí)質(zhì)性影響,只要了解對(duì)方領(lǐng)域的基礎(chǔ)知識(shí),就能掃清困難。”邳靖陶說。
負(fù)責(zé)的仍是臨床醫(yī)生
邳靖陶透露,目前腦血管病專病大模型正在北京清華長(zhǎng)庚醫(yī)院神經(jīng)中心進(jìn)行臨床驗(yàn)證。此前,他和同事們使用真實(shí)病例或模擬復(fù)雜臨床場(chǎng)景,對(duì)大模型進(jìn)行過內(nèi)部測(cè)試。這項(xiàng)測(cè)試建立在前期簡(jiǎn)單測(cè)試的基礎(chǔ)之上,旨在評(píng)估大模型對(duì)不同復(fù)雜程度、不同語(yǔ)言風(fēng)格和不同級(jí)別醫(yī)生的病歷的理解能力。
其中,最困擾邳靖陶的一個(gè)問題是,如果大模型出現(xiàn)了錯(cuò)誤,怎么保證臨床醫(yī)生不受干擾呢?換言之,臨床醫(yī)生應(yīng)該怎么處理和大模型之間的關(guān)系?
這一矛盾在首次內(nèi)部測(cè)試時(shí)就出現(xiàn)了。當(dāng)時(shí),邳靖陶模擬了一個(gè)復(fù)雜的臨床場(chǎng)景,大模型給出的治療方案和預(yù)想的“標(biāo)準(zhǔn)答案”有所出入。隨后,技術(shù)人員介入并回溯了大模型的推理過程,試圖找出可能的錯(cuò)誤,卻無功而返。而當(dāng)邳靖陶用“標(biāo)準(zhǔn)答案”去匹配臨床指南時(shí),讓他印象深刻的結(jié)果出現(xiàn)了:是自己的診療思路存在盲區(qū)。
“一開始這個(gè)模型設(shè)計(jì)出來,到底能不能用于臨床,能不能起到提升和改善(診療效率)的作用,其實(shí)我心里也沒有底。但是這件事之后,給了我特別大的底氣。”邳靖陶總結(jié)這次經(jīng)歷,發(fā)現(xiàn)患者的臨床癥狀是一個(gè)綜合結(jié)果。例如,患者可能因?yàn)樯窠?jīng)系統(tǒng)問題住院,但心血管、腎臟、肝臟狀況也在發(fā)生變化。盡管醫(yī)生接受過規(guī)范化的??婆嘤?xùn),但診療思維仍可能存在盲點(diǎn),無法保證每次都能提供全面的診療方案。
另外,臨床指南是不斷更新的,并非所有醫(yī)生都能及時(shí)更新知識(shí)。當(dāng)醫(yī)生的知識(shí)更新滯后時(shí),大模型可以幫助彌補(bǔ)這些紕漏。
不過,閱讀指南并作出判斷,仍是臨床醫(yī)生不能丟棄的基本功。邳靖陶表示,如果醫(yī)生發(fā)現(xiàn)大模型提供的診療方案與自身判斷不符,不應(yīng)簡(jiǎn)單地接受或拒絕,而應(yīng)深入探究原因。這一思考過程有助于醫(yī)生提高臨床診療能力,是大模型作為臨床輔助診斷工具的終極愿景。畢竟,雖然大模型可以提供結(jié)論,但對(duì)診療過程負(fù)責(zé)的仍是臨床醫(yī)生本人。
呼吁更多人加入
2023年7月,谷歌Research和DeepMind共同打造的全球首個(gè)全科醫(yī)療大模型Med-PaLM M正式發(fā)布。資料顯示,這個(gè)大模型具備臨床語(yǔ)言、影像和基因組學(xué)的理解能力,用于臨床指日可待。
而根據(jù)《2023醫(yī)療健康A(chǔ)I大模型行業(yè)研究報(bào)告》,截至2023年10月,國(guó)內(nèi)累計(jì)公開的大模型數(shù)量達(dá)到238個(gè),其中,醫(yī)療大模型近50個(gè),涉及患者問診、醫(yī)生助手、藥物研發(fā)、健康科普等多個(gè)領(lǐng)域。據(jù)邳靖陶觀察,許多醫(yī)療大模型的開發(fā)從“全科”出發(fā),試圖直接構(gòu)建一個(gè)涵蓋所有??频拇笮腿颇P?,供用戶咨詢各種疾病。
但在參與構(gòu)建腦血管病專病大模型后,武劍教授團(tuán)隊(duì)對(duì)這一模式表示懷疑。他們發(fā)現(xiàn),把一種疾病的臨床指南梳理清楚頗具難度,打造對(duì)應(yīng)的思維鏈也耗時(shí)耗力,短期內(nèi)很難用同樣的方法訓(xùn)練出全科模型。換言之,目前的全科大模型能夠做到醫(yī)學(xué)科普,但很難在特定??祁I(lǐng)域提供有效的臨床指導(dǎo)。因此,武劍教授團(tuán)隊(duì)的研發(fā)思路是以專病為起點(diǎn),再走向全科。
“如果針對(duì)腦血管病的專病大模型走通了,我們可以把成功經(jīng)驗(yàn)復(fù)制到其他神經(jīng)系統(tǒng)疾病上;如果神經(jīng)系統(tǒng)疾病覆蓋全面了,就成了??拼竽P停簧窠?jīng)科的經(jīng)驗(yàn)再?gòu)?fù)制到其他科,就會(huì)形成一個(gè)真正的全科醫(yī)療大模型。”邳靖陶表示,在武劍教授看來,國(guó)內(nèi)發(fā)病人數(shù)越多、疾病負(fù)擔(dān)越大的疾病,其專病大模型的臨床需求和研發(fā)空間就會(huì)越大,例如我國(guó)發(fā)病率最高的四大慢病——高血壓、糖尿病、冠心病、腦血管病都有非常廣闊的大模型開發(fā)空間。
而在腦血管病專病大模型的發(fā)布會(huì)上,武劍教授已經(jīng)通過招募令的形式,呼吁全國(guó)神經(jīng)系統(tǒng)疾病領(lǐng)域的專家,以及人工智能領(lǐng)域的專業(yè)人士攜手把握創(chuàng)新技術(shù)的改革可能,改善臨床診療現(xiàn)狀。他表示,如果能打破學(xué)術(shù)壁壘,醫(yī)療大模型的重復(fù)性工作是完全可以避免的。
“這不是我們一個(gè)人能做的事情。”邳靖陶說。
封面圖片來源:受訪者供圖
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP