Prompt engineering on leveraging large language models in generating response to InBasket messages.
利用大型語言模型生成 InBasket 訊息回應的提示工程。 J Am Med Inform Assoc 2024-07-19

這項研究探討大型語言模型（LLMs），特別是GPT-4，如何生成符合病人和醫師需求的醫療建議回應。研究團隊透過人員參與的迭代過程，優化提示，提升回應質量。經過三次迭代後，臨床醫師對草擬回應的接受度從62%提升至84%，且74%的回應被評為「有幫助」。病人也認為優化後的回應在語氣和質量上更佳，76%的病人無法分辨人類與LLM生成的回應。研究顯示，根據醫師和病人的反饋來精煉提示，能有效生成有用的醫療建議。 PubMed DOI

Evaluation and practical application of prompt-driven ChatGPTs for EMR generation.
基於提示驅動的 ChatGPT 在電子病歷生成中的評估與實際應用。 NPJ Digit Med 2025-02-02

這項研究探討如何透過提示工程提升ChatGPT在肺結節篩檢中生成電子病歷的能力。研究評估了ChatGPT在患者與醫療提供者口頭諮詢中創建電子病歷的表現，並將這技術整合到像微信小程序等實用工具中，方便患者就醫前使用。結果顯示，ChatGPT顯著提升了臨床環境中的工作流程效率和診斷過程。 PubMed DOI

[Optimized interaction with Large Language Models : A practical guide to Prompt Engineering and Retrieval-Augmented Generation].
與大型語言模型的最佳互動：提示工程與檢索增強生成的實用指南。 Radiologie (Heidelb) 2025-02-21

這篇文章探討大型語言模型（LLMs）在放射學的應用潛力，強調優化互動技術以獲得可靠結果的重要性。主要內容包括： 1. **提示工程**：設計精確的提示能提升LLMs的回應質量，讓其更符合放射學任務需求。 2. **零樣本與少樣本學習**：這些技術讓LLMs在不需大量再訓練的情況下，能適應特定放射學情境。 3. **檢索增強生成（RAG）**：將最新的領域資訊整合進LLMs，幫助生成更準確且具上下文的內容。文章建議放射科醫生採用這些技術，以提升病患護理和檢查效率。 PubMed DOI

Enhancing Large Language Models for Clinical Decision Support by Incorporating Clinical Practice Guidelines.
通過納入臨床實踐指導增強大型語言模型在臨床決策支持中的應用。 Proc (IEEE Int Conf Healthc Inform) 2025-03-17

這項研究探討如何利用臨床實踐指導（CPGs）來強化大型語言模型（LLMs），以改善針對 COVID-19 的門診治療決策。研究開發了三種整合 CPGs 的方法：二元決策樹、程式輔助圖形構建和思考鏈少量提示，並以零樣本提示作為基準。結果顯示，所有 LLMs 在有 CPG 增強的情況下表現優於零樣本提示，特別是二元決策樹在自動評估中表現最佳。這顯示出帶有 CPG 的 LLMs 能提供更準確的治療建議，未來應用潛力廣泛。 PubMed DOI

Summarizing Online Patient Conversations Using Generative Language Models: Experimental and Comparative Study.
使用生成語言模型總結線上病患對話：實驗性和比較研究。 JMIR Med Inform 2025-04-14

這項研究探討大型語言模型（LLMs）在總結患者在網上論壇和健康社群分享經驗的有效性。研究評估了Flan-T5、GPT、GPT-3和GPT-3.5等模型，並測試不同的提示策略。結果顯示，GPT-3.5在零-shot提示中表現最佳，並在3-shot設置中結合方向性提示時達到最佳效果。手動評估也確認了其摘要的準確性。雖然研究顯示LLMs能提供有價值的質性見解，但也存在數據樣本小和手動摘要僅由一位標註者創建的限制。 PubMed DOI

Prompt Engineering for Large Language Models in Interventional Radiology.
介入放射學中大型語言模型的提示工程 AJR Am J Roentgenol 2025-05-07

這篇文章介紹了幾種常見的提示工程技巧，像是 zero-shot、few-shot 和 chain-of-thought，說明它們如何幫助提升 AI 在介入放射學領域的表現。內容也討論資料隱私、法規等挑戰，並展望未來像檢索增強生成、多模態模型等新方向。 PubMed DOI

Toward Large Language Models as a Therapeutic Tool: Comparing Prompting Techniques to Improve GPT-Delivered Problem-Solving Therapy.
邁向將大型語言模型作為治療工具：比較提示技巧以提升GPT提供的問題解決治療效果 AMIA Annu Symp Proc 2025-05-26

這項研究發現，透過提示工程（prompt engineering）可以提升大型語言模型在心理治療（PST）初期階段的表現，尤其在症狀辨識和目標設定上更有效。雖然品質和同理心有所提升，但仍有侷限。整體來說，LLM 有潛力協助解決心理健康人力不足，推動 AI 治療服務發展。 PubMed

Prompting Pro Tips! Best Practices for Generating Clinical Narrative Summaries.
臨床敘述摘要撰寫技巧！產生臨床敘述摘要的最佳實務指南 Mil Med 2025-05-31

這項研究發現，用結構化提示雖然能讓八款大型語言模型產生更貼近臨床需求的摘要，但也更容易出現錯誤和偏誤。沒有任何模型能穩定產出臨床可用的摘要，因此各機構還是要自行把關，確保摘要內容正確無誤。 PubMed DOI

Evaluating large language models for information extraction from gastroscopy and colonoscopy reports through multi-strategy prompting.
透過多策略提示評估大型語言模型於胃鏡與大腸鏡報告資訊擷取的表現 J Biomed Inform 2025-06-12

這項研究評估多種大型語言模型，利用提示工程從胃鏡和大腸鏡報告中擷取結構化資訊。結果顯示，大型且專業化的模型在基本資訊擷取表現最好，但遇到複雜推理時仍有限制。少樣本學習對部分模型有幫助，顯示LLMs自動化醫療文本分析有潛力，但還需改進。 PubMed DOI

Evaluation of performance of generative large language models for stroke care.
生成式大型語言模型於中風照護表現之評估 NPJ Digit Med 2025-07-29

這項研究比較GPT、Claude和Gemini三款AI在中風照護的表現，發現它們在正確性、同理心等方面都不夠穩定，沒有一款能全面達到臨床標準。不同提示方法各有優缺點，但整體來說，現階段AI還無法完全勝任中風照護需求。 PubMed DOI

原始文章

站上相關主題文章列表