?
投資 干貨 消費(fèi) 評論 學(xué)院 滾動(dòng)
風(fēng)投 科技 創(chuàng)業(yè) 業(yè)內(nèi) 要聞
ChatGPT能看病嗎?醫(yī)生出了一百道單選題,它沒及格
發(fā)布日期: 2023-02-23 06:27:27 來源: 澎湃新聞

智能聊天機(jī)器人ChatGPT能代替醫(yī)生問診嗎?杭州一名醫(yī)生試著給它出了一套中國執(zhí)業(yè)醫(yī)師“考試卷”,滿分100分,ChatGPT的成績是57分,沒及格。


(資料圖片)

“十大科目各選了10題,一半是基礎(chǔ)醫(yī)學(xué)知識,基本是書上有的;一半是專業(yè)實(shí)踐題,需要邏輯推理。ChatGPT基礎(chǔ)題、實(shí)踐題的得分差不多,正確率都不到60%。”2月22日,浙江大學(xué)醫(yī)學(xué)院附屬第一醫(yī)院精神衛(wèi)生科醫(yī)生呂海龍告訴澎湃新聞(www.thepaper.cn)。

呂海龍想到做這個(gè)實(shí)驗(yàn),是因?yàn)樗诳剖覅⑴c一項(xiàng)人工智能研究,希望未來借助AI監(jiān)測眼球活動(dòng)等,輔助精神科臨床醫(yī)生診斷。ChatGPT面世后,醫(yī)學(xué)界也有關(guān)于它是否能代替醫(yī)生問診的討論,呂海龍和浙江一家媒體一起做了這項(xiàng)實(shí)驗(yàn)。

“ChatGPT是依據(jù)2021年以前的數(shù)據(jù)訓(xùn)練的,我從2020年臨床執(zhí)業(yè)醫(yī)師資格考試真題庫中選了100道單選題?!彼嬖V澎湃新聞,題目涵蓋十大科目,包括生理學(xué)、醫(yī)學(xué)微生物學(xué)、病理學(xué)、藥理學(xué)、衛(wèi)生法規(guī)、內(nèi)科、外科、婦產(chǎn)科、兒科和心理學(xué)-精神科。

據(jù)介紹,中國執(zhí)業(yè)醫(yī)師考試滿分600分,及格線360分。這次給ChatGPT出的“考卷”滿分100分,將一道道題目發(fā)在對話框內(nèi)進(jìn)行。

按照呂海龍的預(yù)期,ChatGPT對一些可背誦的、書上有的基礎(chǔ)醫(yī)學(xué)知識,答題情況會(huì)比較好,一些需要診斷推理的題略遜?!暗珜?shí)測下來,ChatGPT基礎(chǔ)醫(yī)學(xué)知識的答題準(zhǔn)確率是56%,和專業(yè)實(shí)踐題的58%基本持平,很多書上有答案的基礎(chǔ)題,它給了錯(cuò)誤答案——我們猜,是不是在網(wǎng)站上‘學(xué)習(xí)’了錯(cuò)誤答案?”呂海龍表示,超出預(yù)期的是,對一些條件充足、邏輯清晰的實(shí)踐題,ChatGPT的準(zhǔn)確率很高。

實(shí)踐題中,ChatGPT的主要失分項(xiàng)是一些信息不全、癥狀不典型的病例判斷?!叭缁颊咧髟V乏力,醫(yī)生可以大致預(yù)想幾種可能再排除,而ChatGPT不會(huì)‘猜’,只能放棄回答?!眳魏}埍硎?。

從學(xué)科看,ChatGPT“偏科”比較嚴(yán)重:內(nèi)科題的準(zhǔn)確率最低,只有20%;醫(yī)學(xué)微生物學(xué)、病理學(xué)、兒科、心理學(xué)-精神科這幾個(gè)科目的準(zhǔn)確率達(dá)到70%。

不過,呂海龍仍看好ChatGPT未來在醫(yī)學(xué)領(lǐng)域的應(yīng)用,“完善數(shù)據(jù)庫后,如果ChatGPT能做到對基礎(chǔ)醫(yī)學(xué)類知識100%正確,在患者有科普需求時(shí)準(zhǔn)確作出專業(yè)知識回答,或是成為醫(yī)生的助手,也是很有意義的?!?/p>

(來源:澎湃新聞 記者陸玫)

【編輯:符櫻】 

關(guān)鍵詞:
24小時(shí)熱點(diǎn) 精彩推薦
資訊新聞
?