原始文章

這項研究提出了一種名為「GAPrompt」的新方法,旨在提升大型語言模型(LLMs)在自動化臨床評估中的應用,特別是針對電子健康紀錄(EHRs)中的中風評估。GAPrompt包含五個關鍵組件,包括選擇適合的LLM、建立增強知識庫、改善檢索、增強推理精確性及結合多重生成輸出。研究結果顯示,GAPrompt能有效分析EHRs並提供定量評估,解決傳統中風評估的勞動密集問題,顯示LLMs在醫療及其他領域的潛力。 PubMed DOI


站上相關主題文章列表

這項研究探討大型語言模型(LLMs),特別是GPT-4,如何生成符合病人和醫師需求的醫療建議回應。研究團隊透過人員參與的迭代過程,優化提示,提升回應質量。經過三次迭代後,臨床醫師對草擬回應的接受度從62%提升至84%,且74%的回應被評為「有幫助」。病人也認為優化後的回應在語氣和質量上更佳,76%的病人無法分辨人類與LLM生成的回應。研究顯示,根據醫師和病人的反饋來精煉提示,能有效生成有用的醫療建議。 PubMed DOI

這項研究探討如何透過提示工程提升ChatGPT在肺結節篩檢中生成電子病歷的能力。研究評估了ChatGPT在患者與醫療提供者口頭諮詢中創建電子病歷的表現,並將這技術整合到像微信小程序等實用工具中,方便患者就醫前使用。結果顯示,ChatGPT顯著提升了臨床環境中的工作流程效率和診斷過程。 PubMed DOI

這篇文章探討大型語言模型(LLMs)在放射學的應用潛力,強調優化互動技術以獲得可靠結果的重要性。主要內容包括: 1. **提示工程**:設計精確的提示能提升LLMs的回應質量,讓其更符合放射學任務需求。 2. **零樣本與少樣本學習**:這些技術讓LLMs在不需大量再訓練的情況下,能適應特定放射學情境。 3. **檢索增強生成(RAG)**:將最新的領域資訊整合進LLMs,幫助生成更準確且具上下文的內容。 文章建議放射科醫生採用這些技術,以提升病患護理和檢查效率。 PubMed DOI

這項研究探討如何利用臨床實踐指導(CPGs)來強化大型語言模型(LLMs),以改善針對 COVID-19 的門診治療決策。研究開發了三種整合 CPGs 的方法:二元決策樹、程式輔助圖形構建和思考鏈少量提示,並以零樣本提示作為基準。結果顯示,所有 LLMs 在有 CPG 增強的情況下表現優於零樣本提示,特別是二元決策樹在自動評估中表現最佳。這顯示出帶有 CPG 的 LLMs 能提供更準確的治療建議,未來應用潛力廣泛。 PubMed DOI

這項研究探討大型語言模型(LLMs)在總結患者在網上論壇和健康社群分享經驗的有效性。研究評估了Flan-T5、GPT、GPT-3和GPT-3.5等模型,並測試不同的提示策略。結果顯示,GPT-3.5在零-shot提示中表現最佳,並在3-shot設置中結合方向性提示時達到最佳效果。手動評估也確認了其摘要的準確性。雖然研究顯示LLMs能提供有價值的質性見解,但也存在數據樣本小和手動摘要僅由一位標註者創建的限制。 PubMed DOI

這篇文章介紹了幾種常見的提示工程技巧,像是 zero-shot、few-shot 和 chain-of-thought,說明它們如何幫助提升 AI 在介入放射學領域的表現。內容也討論資料隱私、法規等挑戰,並展望未來像檢索增強生成、多模態模型等新方向。 PubMed DOI

這項研究發現,透過提示工程(prompt engineering)可以提升大型語言模型在心理治療(PST)初期階段的表現,尤其在症狀辨識和目標設定上更有效。雖然品質和同理心有所提升,但仍有侷限。整體來說,LLM 有潛力協助解決心理健康人力不足,推動 AI 治療服務發展。 PubMed

這項研究發現,用結構化提示雖然能讓八款大型語言模型產生更貼近臨床需求的摘要,但也更容易出現錯誤和偏誤。沒有任何模型能穩定產出臨床可用的摘要,因此各機構還是要自行把關,確保摘要內容正確無誤。 PubMed DOI

這項研究評估多種大型語言模型,利用提示工程從胃鏡和大腸鏡報告中擷取結構化資訊。結果顯示,大型且專業化的模型在基本資訊擷取表現最好,但遇到複雜推理時仍有限制。少樣本學習對部分模型有幫助,顯示LLMs自動化醫療文本分析有潛力,但還需改進。 PubMed DOI

這項研究比較GPT、Claude和Gemini三款AI在中風照護的表現,發現它們在正確性、同理心等方面都不夠穩定,沒有一款能全面達到臨床標準。不同提示方法各有優缺點,但整體來說,現階段AI還無法完全勝任中風照護需求。 PubMed DOI