原始文章

這項研究探討如何利用臨床實踐指導(CPGs)來強化大型語言模型(LLMs),以改善針對 COVID-19 的門診治療決策。研究開發了三種整合 CPGs 的方法:二元決策樹、程式輔助圖形構建和思考鏈少量提示,並以零樣本提示作為基準。結果顯示,所有 LLMs 在有 CPG 增強的情況下表現優於零樣本提示,特別是二元決策樹在自動評估中表現最佳。這顯示出帶有 CPG 的 LLMs 能提供更準確的治療建議,未來應用潛力廣泛。 PubMed DOI


站上相關主題文章列表

研究指出,GPT-3.5和GPT-4處理臨床數據時,只需少量訓練數據即可提取有價值資訊。透過改進提示策略,可增進模型在臨床命名實體識別任務表現,減少大量標註數據需求。雖GPT模型在臨床應用有潛力,仍需進一步改進。研究結果凸顯了量身定制的提示框架重要性,以提高大型語言模型在臨床環境性能。 PubMed DOI

研究探討如何利用大型語言模型改善臨床決策支援系統在處理慢性丙型肝炎病毒感染上的應用。結果顯示,結合LLMs與結構化指南重排和提示工程,能提高準確性。然而,少量樣本學習效果不顯著,建議優化數據質量和提示工程以增強LLMs在醫療保健指南中的應用效果。 PubMed DOI

研究評估了大型語言模型在醫療保健領域的應用,尤其是在改善患者護理方面。使用MIMIC-III數據庫的電子健康記錄,測試了這些模型在識別特定疾病患者方面的效能。GPT-4在辨識COPD、CKD、PBC和Cancer Cachexia患者方面表現優異,而ChatGPT和LLaMA3則稍遜。儘管LLMs有潛力,但在臨床應用前仍需解決錯誤、解釋不足和倫理問題。進一步研究將有助於提升模型訓練和設計,以更好地應用於醫療保健。 PubMed DOI

這項研究評估了GPT-3.5-turbo和GPT-4-turbo在急診部門提供臨床建議的表現,分析了10,000次就診。結果顯示,這兩個模型的準確性都不如住院醫師,GPT-4-turbo平均低8%,而GPT-3.5-turbo低24%。雖然這些大型語言模型在敏感性上表現良好,但特異性較低,顯示出建議過於謹慎。研究指出,儘管LLMs在臨床應用上有潛力,但在成為可靠的醫療決策支持系統前,仍需大幅改進。 PubMed DOI

大型語言模型(LLMs)如ChatGPT等,正透過其推理能力改變疾病診斷與治療。這些模型能分析醫學文本,提升診斷準確性,並有效識別症狀與檢測結果中的細微模式。多模態大型語言模型(MLLMs)更能分析醫學影像,協助制定基於證據的治療計畫。然而,仍面臨算法偏見及生成不準確資訊的風險,需進行臨床驗證。這篇論文強調政策制定、倫理監督及跨學科合作的重要性,以確保臨床應用的安全與有效性,並探討未來研究方向。 PubMed DOI

多學科腫瘤委員會(MTBs)在癌症治療決策中扮演重要角色,但常面臨案例過載,影響決策品質。臨床決策支持系統(CDSSs)雖已引入協助醫師,但使用仍有限。大型語言模型(LLMs)如ChatGPT的出現,為提升CDSS的效率提供新機會。 OncoDoc2專注於乳腺癌管理,研究探討LLMs如何透過提示工程技術(PETs)改善其可用性。使用200個乳腺癌患者摘要進行評估,結果顯示最佳方法結合Mistral和OpenChat模型,達到不錯的準確率,但與金標準建議的匹配度仍低,顯示LLMs在醫療決策中仍需進一步發展。 PubMed DOI

這項研究探討了大型語言模型(LLMs),特別是GPT-4,在製作癌症臨床試驗教育內容的潛力,旨在提升患者的理解。研究從ClinicalTrials.gov獲取知情同意書,生成簡短摘要和多選題,並透過患者調查和眾包註釋來評估其有效性。結果顯示,摘要內容可讀且具資訊性,患者認為有助於理解臨床試驗並提高參與意願。雖然多選題的準確性高,但當要求提供未明確列出的資訊時,GPT-4的準確性較低。整體而言,研究顯示GPT-4能有效生成患者友好的教育材料,但仍需人類監督以確保準確性。 PubMed DOI

這項研究評估了三個大型語言模型(LLMs)—ChatGPT-4、Gemini 和 Med-Go—在134個醫學領域的臨床決策表現。結果顯示,Med-Go 的中位數得分為37.5,優於其他模型,而 Gemini 得分最低,為33.0,差異顯著(p < 0.001)。所有模型在鑑別診斷上表現較弱,但治療建議則較強。研究建議將專業醫學知識納入 LLM 訓練,以提升效能,並需進一步改善其在臨床環境中的精確性與安全性。 PubMed DOI

大型語言模型(LLMs)如ChatGPT在醫學領域的應用潛力巨大,但也帶來了準確性和可靠性的挑戰。研究顯示,LLMs能提供正確的疾病管理資訊,但必須符合國際指導方針。關鍵考量包括回應的可讀性、與指導方針的一致性、資訊來源的時效性、跨模型和跨語言的一致性,以及臨床使用的驗證。總之,雖然LLMs能提升醫學教育和決策,但仍需謹慎評估,以確保其在臨床中的安全與有效性。 PubMed DOI

大型語言模型(LLMs)在醫療保健,特別是胃腸科,展現出提升臨床決策、研究及病人管理的潛力。為了安全有效地應用這些模型,必須解決偏見、幻覺及法規遵循等挑戰。本文提出一個結構化框架,針對C型肝炎治療進行案例研究,涵蓋臨床目標定義、多學科團隊組建、數據準備、模型選擇與微調等步驟。此外,還強調遵循HIPAA和GDPR等法規,以確保負責任的AI應用。未來研究應聚焦於多機構驗證及AI輔助的臨床試驗。 PubMed DOI