原始文章

在臨床環境中,深度學習面臨標註數據不足和可解釋性等挑戰。概念瓶頸模型(CBMs)透過將疾病預測與可理解的概念連結來提升可解釋性,但需要大量標註和重新訓練。本研究提出一種兩步驟的方法,利用預訓練的視覺語言模型自動預測臨床概念,並用大型語言模型生成診斷。這方法允許在測試時進行人工修正,改善診斷結果和透明度。實驗顯示其表現優於傳統CBMs,且訓練需求低。相關程式碼可在GitHub上找到。 PubMed DOI


站上相關主題文章列表

這研究用預先訓練的視覺-語言模型,在放射學臨床影像上自動產生高品質文字報告。模型名叫ClinicalBLIP,用臨床影像轉文字資料集開發,強調深化語意理解和整合先前知識。實驗結果顯示,ClinicalBLIP比現有方法更優秀,展現在臨床上的應用潛力。 PubMed DOI

黑色素瘤是一種致命的皮膚癌,常因曬太陽而起,早期檢查很重要。錯誤分類會降低存活率。研究指出,使用人工智慧來分類黑色素瘤病變,有助於提高準確性。未來需增加數據集,並自動計算皮膚鏡特徵。 PubMed DOI

LLMs在醫學診斷上有潛力,尤其在皮膚科。SkinGPT-4結合視覺轉換器和LLM,訓練過大量數據後,能準確診斷皮膚問題。已通過真實案例驗證,可提供互動治療建議。 PubMed DOI

本研究針對西班牙語電子健康紀錄(EHR)進行自動分類,並強調可解釋性的重要性。我們引入了一個新指標Leberage,來量化預測的決策支持水平,並評估三種解釋方法:SHAP、LIME和IG。使用長型變壓器處理長文檔,並識別影響ICD分類的相關文本片段。結果顯示,我們的方法在同樣任務上提升了7%的效果,且LIME的表現最佳。整體而言,這些技術有效闡明黑箱模型的輸出,Leberage指標則為可解釋性技術的貢獻提供了量化工具。 PubMed DOI

這項研究提出了一種新方法,結合大型語言模型(LLMs)與電腦輔助診斷(CAD)網絡,提升胸部X光片的醫學影像分析。雖然LLMs在自然語言處理上表現優異,但在醫學影像上通常不佳。這個框架利用LLMs的優勢,改善CAD系統的診斷準確性和報告生成,讓報告品質更高。使用ChatGPT後,診斷表現提升了16.42個百分點,GPT-3則在F1-score上提高了15.00個百分點。這種創新方法有潛力改變臨床決策過程,並改善病患互動。 PubMed DOI

這項研究探討熱帶地區診斷瘧疾和傷寒的挑戰,因為傳統方法在症狀重疊和藥物抗性上遇到困難。強調準確診斷的重要性以降低死亡率。雖然機器學習模型能提供準確預測,但缺乏透明度,讓醫療人員難以理解決策過程。研究採用可解釋的人工智慧技術,特別是LIME和大型語言模型(如GPT),來提升診斷的透明度。結果顯示隨機森林模型表現最佳,並提出整合這些技術的行動應用程式,雖然系統性能受限於數據質量和計算需求,但未來有潛力應用於其他醫療條件。 PubMed DOI

這篇論文探討了深度學習在生物醫學文本挖掘的進展,特別是獲取高品質標註數據的挑戰,如數據稀缺和隱私問題。作者提出了LetEx-Learning方法,將可解釋性融入少量樣本學習中,利用大型語言模型生成推理解釋,提升學習效果。實驗顯示,這種方法在低資源情況下的表現提升達6.41%。LetEx模型擁有2.2億參數,推理能力優於其他模型,源代碼已公開供研究使用。 PubMed DOI

這項研究提出了一種新型的生成視覺歸因技術,專為醫學影像設計,重點在於突顯與診斷相關的特徵,特別是異常情況下。不同於傳統方法,這種技術利用潛在擴散模型和大型語言模型生成正常影像,並與原始影像比較,以識別關鍵診斷組件。研究人員在COVID-19放射影像數據庫上測試,並使用多種指標評估影像質量。該系統還能進行零樣本局部疾病誘導,增強醫學影像的可解釋性。 PubMed DOI

這項研究提出了一種新穎的人工智慧方法,幫助皮膚科醫生診斷皮膚疾病,模擬專業診斷過程。它結合了影像分析、語言模型和機器學習工具,採用多種AI技術來提升決策能力。測試數據集顯示,準確率達87%,顯示出良好的推理和診斷能力。這項研究不僅驗證了AI在皮膚科的應用潛力,還提出了未來實施的策略框架,以改善病人經驗。 PubMed DOI

這項研究評估了多模態大型語言模型(LLMs)在識別皮膚疾病的應用,並檢視性別和年齡的偏見。研究中使用了ChatGPT-4和LLaVA-1.6,結果顯示它們的準確率和F1分數超過了多個深度學習模型,但仍低於最佳的視覺變壓器模型。值得注意的是,ChatGPT-4和LLaVA-1.6在性別和年齡方面沒有偏見,顯示出在皮膚科應用中的潛力。未來需進一步研究以確保這些模型在醫療中的可靠性與公平性。 PubMed DOI