原始文章

這項研究的目的是評估大型語言模型(LLM)在理解和推理關鍵醫療事件方面的能力,特別是拔管(extubation)。研究人員專注於LLM對表格數據的理解及識別變數重要性的能力。此外,研究還探討了將LLM與現有機器學習模型(如XGBoost)結合使用的潛力,以提升醫療決策的能力。 PubMed DOI


站上相關主題文章列表

研究使用大型語言模型如GPT和BERT自動記錄急診科臨床診斷,並進行BERT微調。透過XAI和SHAP方法分析模型,結果顯示KLUE-RoBERTa表現最佳,XAI提供可靠解釋。研究指出LLMs或許可簡化韓國急診科電子病歷記錄。 PubMed DOI

研究發現,透過診斷提示,GPT-4能夠模擬臨床醫師的診斷過程並保持準確性。這對醫師理解並信任LLMs的回應很重要,有助於克服「黑盒子」問題,提升LLMs在醫學實踐中的安全性與效益。 PubMed DOI

研究使用真實世界數據評估大型語言模型(LLMs)在標準化產科診斷術語時的表現,發現LLMs在無監督設置中表現較佳。不同的提示工程設置會影響LLMs的表現,其中QWEN提示效果最好,有助於提高診斷術語對齊效率。 PubMed DOI

研究發現大型語言模型(如GPT-3.5和Llama 2)在處理複雜醫學問題時表現出色。透過提示和專家註釋,它們展現出在推理和回憶專業知識方面的潛力。GPT-3.5利用提示技術,在醫學基準測試中表現優異。Llama 2也有競爭力,其中Llama 2 70B 通過了MedQA-USMLE基準測試。 PubMed DOI

人工智慧,尤其是大型語言模型(LLMs),對急診護理工作流程和決策有改善作用。目前對LLMs在急診醫學的研究意見不一,需要一個全面的框架來了解其應用。這篇文章探討了LLMs在急診醫學的現況,並提出未來研究方向。經分析43篇論文,發現LLMs可強化臨床決策、提升效率、引起道德關注,並促進醫學教育。LLMs有潛力改變急診護理,但仍需進一步研究驗證其應用、建立負責任使用標準、解決道德問題,並提升醫護人員對人工智慧的認識。合作努力是安全有效整合LLMs於急診醫學中的關鍵。 PubMed DOI

研究使用大型語言模型預測手術後結果,表現令人鼓舞,但在預測持續時間方面有困難。模型解釋能力或許對臨床有幫助,可補充傳統風險預測模型。 PubMed DOI

OpenMedLM是一個開源的醫學語言模型,在醫學基準測試中表現優異,且無需大量微調。透過提示策略,OpenMedLM在三個醫學語言模型基準測試中取得領先地位,超越其他模型。這顯示開源基礎模型在提升醫療任務表現方面具有潛力,同時也凸顯提示工程對於醫學應用中易用的語言模型的重要性。 PubMed DOI

大型語言模型(LLMs)在臨床決策中或許有好處,但目前還不適合實際醫療使用。一項研究指出,LLMs在真實病例中無法正確診斷、無法遵循指引、難以解釋檢驗結果,且難以整合到臨床流程中,可能危害患者健康。需要更多研究以改進LLMs在臨床決策的應用。 PubMed DOI

這項研究探討大型語言模型(LLMs)在生成重症監護病房(ICU)病人出院摘要的表現,分析了匿名臨床筆記。三個模型中,GPT-4 API的表現最佳,準確識別41.5%的關鍵臨床事件,ChatGPT和Llama 2則分別為19.2%和16.5%。雖然GPT-4在資訊組織和清晰度上表現優異,但仍有小錯誤,且所有模型在敘事連貫性和重要數據的捕捉上存在挑戰。總體來看,這些LLM在生成出院摘要上有潛力,但仍需改進。 PubMed DOI

大型語言模型(LLMs)有潛力顯著改變臨床醫學,能改善醫療服務的可及性、增強診斷、協助手術規劃及促進教育。不過,這些模型的有效運用需謹慎設計提示,以應對幻覺和偏見等挑戰。理解標記化、嵌入和注意力機制等關鍵概念,以及運用策略性提示技術,對生成準確輸出至關重要。AI技術與醫療專業人員的合作、重視倫理問題如數據安全和偏見緩解,能提升醫療服務質量與可及性。持續的研究與發展對於發揮LLMs在醫療領域的潛力至關重要。 PubMed DOI