人工智能輔助臨牀決策,挑戰究竟在哪?

來自明尼蘇達大學醫學院、斯坦福大學、貝斯以色列女執事醫療中心以及弗吉尼亞大學的一個合作研究團隊研究了醫生利用 GPT-4(一種人工智能(AI)大型語言模型系統)爲患者進行診斷的效果。

該研究在《JAMA 網絡開放》雜誌上發表。

這項研究是與 50 位持有美國行醫執照的家庭醫學、內科和急診醫學領域的醫生共同開展的。研究團隊發現,與傳統資源相比,爲醫生提供 GPT-4 作爲診斷輔助手段,並未顯著提升臨牀推理能力。其他關鍵發現包括:

“AI 領域正在迅速擴展,並在醫學內外影響着我們的生活。重要的是,我們要研究這些工具,並且瞭解怎樣才能最好地利用它們來改善我們所提供的護理以及提供護理的體驗,”明尼蘇達大學醫學院教授、M Health Fairview 醫院的醫生安德魯·奧爾森醫學博士說道。“這項研究表明,在臨牀實踐中,醫生與 AI 合作存在進一步改進的機會。”

這些結果凸顯了將人工智能融入臨牀實踐的複雜性。雖然 GPT-4 本身顯示出了有希望的結果,但將 GPT-4 作爲診斷輔助工具與臨牀醫生配合使用,並沒有顯著優於使用傳統診斷資源。這表明人工智能在醫療保健領域的潛力較爲微妙,強調了進一步探索人工智能如何最好地支持臨牀實踐的重要性。此外,還需要更多研究來弄清楚臨牀醫生應如何接受使用這些工具的培訓。