原始文章

本研究針對西班牙語電子健康紀錄(EHR)進行自動分類,並強調可解釋性的重要性。我們引入了一個新指標Leberage,來量化預測的決策支持水平,並評估三種解釋方法:SHAP、LIME和IG。使用長型變壓器處理長文檔,並識別影響ICD分類的相關文本片段。結果顯示,我們的方法在同樣任務上提升了7%的效果,且LIME的表現最佳。整體而言,這些技術有效闡明黑箱模型的輸出,Leberage指標則為可解釋性技術的貢獻提供了量化工具。 PubMed DOI


站上相關主題文章列表

醫學專家可能更信任人工智慧(AI)系統,若有「情境解釋」支持,將系統推論與現實應用連結。研究聚焦於合併症風險預測,探討如何利用醫學指南資訊為AI提供情境。透過大型語言模型(LLMs)建立端對端AI流程,研究顯示情境解釋可改善臨床對AI模型的理解與應用。結果顯示,像BERT和SciBERT的LLMs可有效提供臨床相關解釋,有助增進臨床醫師對AI模型的應用。 PubMed DOI

研究比較四個大型語言模型(LLMs)與專家醫師在協助精準腫瘤學臨床決策的表現。LLMs提供更多治療方案,但品質和可信度不如專家。然而,部分LLMs提出的治療方案獲得委員會認可。研究建議LLMs可提供協助,但無法取代人類專家。 PubMed DOI

深度學習在醫療研究中有顯著進展,尤其在自然語言處理領域。然而,模型複雜性需要解釋性以支持可靠的決策。本文討論了醫療自然語言處理中的可解釋深度學習,介紹了「可解釋和可解釋的人工智慧」(XIAI)概念。不同模型根據功能和範圍進行分類,其中注意機制是常見技術。挑戰在於全局建模過程的有限探索和最佳實踐的缺乏。機會則在於發展多模態XIAI以實現個性化醫療,並將深度學習與因果邏輯結合。在醫療領域成功應用XIAI需要合作和專業知識,以建立可解釋的自然語言處理算法。 PubMed DOI

研究專注於從電子健康記錄中提取社會健康決定因素,以改善健康公平。研究建立跨機構數據集,開發分類模型,包括大型語言模型,從不同醫療機構的臨床註釋中檢測SDoH因素。研究發現不同病人群、註釋類型和醫院有不同的SDoH記錄實踐和標籤分佈。LLM在辨識SDoH因素方面表現最佳,但在跨數據集泛化上仍有挑戰。為促進合作,研究提供了PhysioNet存儲庫上的註釋數據集和模型訪問權。 PubMed DOI

大型語言模型(LLMs)在臨床決策中或許有好處,但目前還不適合實際醫療使用。一項研究指出,LLMs在真實病例中無法正確診斷、無法遵循指引、難以解釋檢驗結果,且難以整合到臨床流程中,可能危害患者健康。需要更多研究以改進LLMs在臨床決策的應用。 PubMed DOI

全球放射科醫師短缺問題日益嚴重,急需創新解決方案,人工智慧(AI)成為一個有潛力的工具。然而,醫療專業人員對AI的信任不足,主要因為許多AI模型運作不透明,稱為「黑箱」。可解釋的人工智慧(XAI)旨在提供透明度,幫助使用者理解AI決策過程。 這項調查是首個針對醫療可解釋用戶介面(XUI)的研究,分析了42個介面,強調有效傳達資訊的重要性。研究提出介面設計屬性分類法,並指出未來研究方向,包括醫療影像的反事實解釋需求及大型語言模型的潛力。提升AI可解釋性對建立信任及臨床整合至關重要。 PubMed DOI

這項研究探討大型語言模型(LLMs)中的醫學知識,並評估整合統一醫學語言系統(UMLS)對診斷決策的影響。研究目標包括評估LLMs的醫學知識、UMLS對診斷預測的影響,以及人類評估與UMLS指標的相關性。結果顯示,GPT-3.5在UMLS路徑的完成度上優於其他模型,且整合UMLS知識能提升預測性能,但傳統評估指標與人類專家評估的相關性較弱。研究強調需針對特定任務調整UMLS,並尋找更符合人類判斷的評估指標。 PubMed DOI

這項研究的目的是評估大型語言模型(LLM)在理解和推理關鍵醫療事件方面的能力,特別是拔管(extubation)。研究人員專注於LLM對表格數據的理解及識別變數重要性的能力。此外,研究還探討了將LLM與現有機器學習模型(如XGBoost)結合使用的潛力,以提升醫療決策的能力。 PubMed DOI

醫療領域,特別是腫瘤學,面臨許多挑戰,如腫瘤委員會會議繁忙、討論時間短,以及護理品質的擔憂。為了解決這些問題,越來越多人關注整合臨床決策支持系統(CDSSs)來協助醫生管理癌症護理。然而,CDSSs在臨床上的應用仍然有限。2022年OpenAI推出的ChatGPT引發了對大型語言模型(LLMs)作為CDSS的興趣。我們進行了一項回顧,評估LLMs在醫療專科,特別是腫瘤學中的有效性,並比較使用者看法與實際表現,以探討其在改善癌症護理結果的可行性。 PubMed DOI

這項研究探討大型語言模型(LLMs)在識別接受免疫檢查點抑制劑(ICI)治療患者的免疫相關不良事件(irAEs)中的應用,並與傳統手動裁定及ICD代碼進行比較。研究分析了超過12年的住院紀錄,發現LLMs在檢測irAEs的敏感性顯著高於ICD代碼,且效率更佳,平均每份病歷僅需9.53秒。總體來說,LLMs被認為是檢測irAEs的有效工具,提供更高的敏感性和效率。 PubMed DOI