原始文章

在臨床環境中,深度學習面臨標註數據不足和可解釋性等挑戰。概念瓶頸模型(CBMs)透過將疾病預測與可理解的概念連結來提升可解釋性,但需要大量標註和重新訓練。本研究提出一種兩步驟的方法,利用預訓練的視覺語言模型自動預測臨床概念,並用大型語言模型生成診斷。這方法允許在測試時進行人工修正,改善診斷結果和透明度。實驗顯示其表現優於傳統CBMs,且訓練需求低。相關程式碼可在GitHub上找到。 PubMed DOI


站上相關主題文章列表

這項研究提出了一種新型的生成視覺歸因技術,專為醫學影像設計,重點在於突顯與診斷相關的特徵,特別是異常情況下。不同於傳統方法,這種技術利用潛在擴散模型和大型語言模型生成正常影像,並與原始影像比較,以識別關鍵診斷組件。研究人員在COVID-19放射影像數據庫上測試,並使用多種指標評估影像質量。該系統還能進行零樣本局部疾病誘導,增強醫學影像的可解釋性。 PubMed DOI

這項研究提出了一種新穎的人工智慧方法,幫助皮膚科醫生診斷皮膚疾病,模擬專業診斷過程。它結合了影像分析、語言模型和機器學習工具,採用多種AI技術來提升決策能力。測試數據集顯示,準確率達87%,顯示出良好的推理和診斷能力。這項研究不僅驗證了AI在皮膚科的應用潛力,還提出了未來實施的策略框架,以改善病人經驗。 PubMed DOI

這項研究評估了多模態大型語言模型(LLMs)在識別皮膚疾病的應用,並檢視性別和年齡的偏見。研究中使用了ChatGPT-4和LLaVA-1.6,結果顯示它們的準確率和F1分數超過了多個深度學習模型,但仍低於最佳的視覺變壓器模型。值得注意的是,ChatGPT-4和LLaVA-1.6在性別和年齡方面沒有偏見,顯示出在皮膚科應用中的潛力。未來需進一步研究以確保這些模型在醫療中的可靠性與公平性。 PubMed DOI

這篇論文針對大型語言模型在皮膚科的應用進行全面評估,探討如何整合各種病人數據,如人口統計、臨床影像、醫療訪談和基因資訊。論文強調這些模型能提升診斷準確性、治療建議及病人教育。透過回顧現有研究,旨在識別主要挑戰並探索未來機會,最終目標是改善病人健康結果及與醫療提供者的互動。 PubMed DOI

本研究針對肝癌診斷提出一個結合大型與小型模型的輔助工具,旨在提升基層醫療醫生的診斷能力。透過開發更準確的肝腫瘤與血管分割模型,並整合患者醫療紀錄,這個框架能有效改善影像分析的準確性。結果顯示,小型模型在分割表現上有所提升,而大型模型則在醫生評估中獲得更高分數。此研究不僅優化了診斷過程,還增強了模型的可靠性與可解釋性,減少了錯誤推理的情況。 PubMed DOI

這項研究首度公開570份專家撰寫的臨床鑑別診斷解釋資料集,並提出新架構「Dual-Inf」來提升大型語言模型產生DDx解釋的準確度。此創新做法評估了AI在診斷推理解釋上的能力,期望提升AI診斷透明度與品質,幫助臨床決策更可靠。 PubMed DOI

這項研究提出一套用多個本地大型語言模型(LLMs)自動從外科病理報告中擷取癌症相關重點資訊的方法。每個模型會給出結構化結果和理由,經彙整後再由病理醫師確認。實測超過4,000份報告,準確率高,但在分期和側別等部分仍有困難。這方法提升了解釋性和稽核性,證明本地LLMs能可靠支援臨床自動化。 PubMed DOI

這項研究比較七款主流多模態大型語言模型在診斷皮膚病的表現,GPT-4o準確率最高達67.8%。不同疾病和圖片的診斷準確度差異大,有些圖片所有模型都誤判。部分模型遇到敏感圖片會拒絕診斷。整體來說,這些模型在皮膚科影像判讀有潛力,但目前還有不少限制,未來需結合臨床資料才能更可靠。 PubMed DOI

單靠大型語言模型(LLMs)做高風險決策有風險,因為它們會出現幻覺和偏誤。這項研究提出結合醫師和LLM的混合系統,分析四萬多個診斷案例後發現,醫師和LLM合作比單獨使用任何一方都更準確,因為他們各有不同的優缺點。這種混合方式能提升醫療診斷的準確率。 PubMed DOI

這篇論文提出一套新架構,結合影像分割、圖譜定位和大型語言模型,能自動產生清楚又可信的醫學報告。透過防止AI亂編(像用JSON格式和限制提示),大幅提升報告正確性和可解釋性,解決AI黑盒問題。實測在腦腫瘤和多發性硬化症上,分割和報告表現都很優秀,有助提升醫界對AI的信任。完整程式碼可在GitHub下載。 PubMed DOI