Informing clinical assessment by contextualizing post-hoc explanations of risk prediction models in type-2 diabetes.
在第二型糖尿病中，透過將風險預測模型的事後解釋置於情境中，以提供臨床評估資訊。 Artif Intell Med 2023-03-23

醫學專家可能更信任人工智慧（AI）系統，若有「情境解釋」支持，將系統推論與現實應用連結。研究聚焦於合併症風險預測，探討如何利用醫學指南資訊為AI提供情境。透過大型語言模型（LLMs）建立端對端AI流程，研究顯示情境解釋可改善臨床對AI模型的理解與應用。結果顯示，像BERT和SciBERT的LLMs可有效提供臨床相關解釋，有助增進臨床醫師對AI模型的應用。 PubMed DOI

Leveraging Large Language Models for Decision Support in Personalized Oncology.
運用大型語言模型於個性化腫瘤醫療決策支援。 JAMA Netw Open 2023-11-27

研究比較四個大型語言模型（LLMs）與專家醫師在協助精準腫瘤學臨床決策的表現。LLMs提供更多治療方案，但品質和可信度不如專家。然而，部分LLMs提出的治療方案獲得委員會認可。研究建議LLMs可提供協助，但無法取代人類專家。 PubMed DOI

From explainable to interpretable deep learning for natural language processing in healthcare: How far from reality?
從可解釋到可解釋的深度學習在醫療自然語言處理中：離現實有多遠？ Comput Struct Biotechnol J 2024-05-27

深度學習在醫療研究中有顯著進展，尤其在自然語言處理領域。然而，模型複雜性需要解釋性以支持可靠的決策。本文討論了醫療自然語言處理中的可解釋深度學習，介紹了「可解釋和可解釋的人工智慧」（XIAI）概念。不同模型根據功能和範圍進行分類，其中注意機制是常見技術。挑戰在於全局建模過程的有限探索和最佳實踐的缺乏。機會則在於發展多模態XIAI以實現個性化醫療，並將深度學習與因果邏輯結合。在醫療領域成功應用XIAI需要合作和專業知識，以建立可解釋的自然語言處理算法。 PubMed DOI

Large Language Models for Social Determinants of Health Information Extraction from Clinical Notes - A Generalizable Approach across Institutions.
臨床記錄中社會健康決定因素資訊提取的大型語言模型 - 跨機構通用方法。 medRxiv 2024-06-03

研究專注於從電子健康記錄中提取社會健康決定因素，以改善健康公平。研究建立跨機構數據集，開發分類模型，包括大型語言模型，從不同醫療機構的臨床註釋中檢測SDoH因素。研究發現不同病人群、註釋類型和醫院有不同的SDoH記錄實踐和標籤分佈。LLM在辨識SDoH因素方面表現最佳，但在跨數據集泛化上仍有挑戰。為促進合作，研究提供了PhysioNet存儲庫上的註釋數據集和模型訪問權。 PubMed DOI

Evaluation and mitigation of the limitations of large language models in clinical decision-making.
評估和緩解大型語言模型在臨床決策中的限制。 Nat Med 2024-07-04

大型語言模型(LLMs)在臨床決策中或許有好處，但目前還不適合實際醫療使用。一項研究指出，LLMs在真實病例中無法正確診斷、無法遵循指引、難以解釋檢驗結果，且難以整合到臨床流程中，可能危害患者健康。需要更多研究以改進LLMs在臨床決策的應用。 PubMed DOI

Intelligent systems in healthcare: A systematic survey of explainable user interfaces.
醫療保健中的智能系統：可解釋用戶界面的系統性調查。 Comput Biol Med 2024-07-27

全球放射科醫師短缺問題日益嚴重，急需創新解決方案，人工智慧（AI）成為一個有潛力的工具。然而，醫療專業人員對AI的信任不足，主要因為許多AI模型運作不透明，稱為「黑箱」。可解釋的人工智慧（XAI）旨在提供透明度，幫助使用者理解AI決策過程。這項調查是首個針對醫療可解釋用戶介面（XUI）的研究，分析了42個介面，強調有效傳達資訊的重要性。研究提出介面設計屬性分類法，並指出未來研究方向，包括醫療影像的反事實解釋需求及大型語言模型的潛力。提升AI可解釋性對建立信任及臨床整合至關重要。 PubMed DOI

On the role of the UMLS in supporting diagnosis generation differential diagnoses proposed by Large Language Models.
大型語言模型在支持診斷生成的鑑別診斷中 UMLS 的角色。 J Biomed Inform 2024-08-14

這項研究探討大型語言模型（LLMs）中的醫學知識，並評估整合統一醫學語言系統（UMLS）對診斷決策的影響。研究目標包括評估LLMs的醫學知識、UMLS對診斷預測的影響，以及人類評估與UMLS指標的相關性。結果顯示，GPT-3.5在UMLS路徑的完成度上優於其他模型，且整合UMLS知識能提升預測性能，但傳統評估指標與人類專家評估的相關性較弱。研究強調需針對特定任務調整UMLS，並尋找更符合人類判斷的評估指標。 PubMed DOI

Well-Tempered Medical Prompt Engineering for Explainable Extubation.
可解釋的拔管的良性醫療提示工程。 Stud Health Technol Inform 2024-08-23

這項研究的目的是評估大型語言模型（LLM）在理解和推理關鍵醫療事件方面的能力，特別是拔管（extubation）。研究人員專注於LLM對表格數據的理解及識別變數重要性的能力。此外，研究還探討了將LLM與現有機器學習模型（如XGBoost）結合使用的潛力，以提升醫療決策的能力。 PubMed DOI

Measured Performance and Healthcare Professional Perception of Large Language Models Used as Clinical Decision Support Systems: A Scoping Review.
大型語言模型作為臨床決策支持系統的測量性能與醫療專業人員的看法：範疇回顧。 Stud Health Technol Inform 2024-08-23

醫療領域，特別是腫瘤學，面臨許多挑戰，如腫瘤委員會會議繁忙、討論時間短，以及護理品質的擔憂。為了解決這些問題，越來越多人關注整合臨床決策支持系統（CDSSs）來協助醫生管理癌症護理。然而，CDSSs在臨床上的應用仍然有限。2022年OpenAI推出的ChatGPT引發了對大型語言模型（LLMs）作為CDSS的興趣。我們進行了一項回顧，評估LLMs在醫療專科，特別是腫瘤學中的有效性，並比較使用者看法與實際表現，以探討其在改善癌症護理結果的可行性。 PubMed DOI

Enhancing Precision in Detecting Severe Immune-Related Adverse Events: Comparative Analysis of Large Language Models and International Classification of Disease Codes in Patient Records.
提升檢測嚴重免疫相關不良事件的精確性：大型語言模型與國際疾病分類代碼在病歷中的比較分析。 J Clin Oncol 2024-09-03

這項研究探討大型語言模型（LLMs）在識別接受免疫檢查點抑制劑（ICI）治療患者的免疫相關不良事件（irAEs）中的應用，並與傳統手動裁定及ICD代碼進行比較。研究分析了超過12年的住院紀錄，發現LLMs在檢測irAEs的敏感性顯著高於ICD代碼，且效率更佳，平均每份病歷僅需9.53秒。總體來說，LLMs被認為是檢測irAEs的有效工具，提供更高的敏感性和效率。 PubMed DOI

原始文章

站上相關主題文章列表