OpenMedLM: prompt engineering can out-perform fine-tuning in medical question-answering with open-source large language models.
OpenMedLM: 在醫學問答中，prompt engineering 可以優於對開源大型語言模型進行微調。 Sci Rep 2024-06-19

OpenMedLM是一個開源的醫學語言模型，在醫學基準測試中表現優異，且無需大量微調。透過提示策略，OpenMedLM在三個醫學語言模型基準測試中取得領先地位，超越其他模型。這顯示開源基礎模型在提升醫療任務表現方面具有潛力，同時也凸顯提示工程對於醫學應用中易用的語言模型的重要性。 PubMed DOI

Prompt engineering on leveraging large language models in generating response to InBasket messages.
利用大型語言模型生成 InBasket 訊息回應的提示工程。 J Am Med Inform Assoc 2024-07-19

這項研究探討大型語言模型（LLMs），特別是GPT-4，如何生成符合病人和醫師需求的醫療建議回應。研究團隊透過人員參與的迭代過程，優化提示，提升回應質量。經過三次迭代後，臨床醫師對草擬回應的接受度從62%提升至84%，且74%的回應被評為「有幫助」。病人也認為優化後的回應在語氣和質量上更佳，76%的病人無法分辨人類與LLM生成的回應。研究顯示，根據醫師和病人的反饋來精煉提示，能有效生成有用的醫療建議。 PubMed DOI

Leveraging large language models for knowledge-free weak supervision in clinical natural language processing.
利用大型語言模型在臨床自然語言處理中進行無知識的弱監督學習。 Sci Rep 2025-03-11

基於深度學習的自然語言處理系統在臨床領域常需大量標記數據，但這些數據難以獲得且成本高。雖然弱監督和上下文學習有助於大型語言模型，但效果仍不如傳統監督方法。我們提出一種新方法，結合LLMs的微調與弱監督，僅需少量領域知識即可提升表現。透過提示策略生成弱標記數據，並用少量金標準數據微調BERT模型。我們在i2b2/n2c2數據集上測試，結果顯示僅用10個金標準筆記，模型F1分數超越PubMedBERT，提升幅度達4.7-47.9%。使用50個金標準筆記時，性能可與完全微調系統相媲美。 PubMed DOI

Role of Model Size and Prompting Strategies in Extracting Labels from Free-Text Radiology Reports with Open-Source Large Language Models.
開源大型語言模型在從自由文本放射學報告中擷取標籤時，模型規模與提示策略的角色 J Imaging Inform Med 2025-05-05

開源大型語言模型（LLMs）在從放射科報告擷取標籤上，比傳統規則式工具（如 CheXpert）更準確。規模較大的 LLMs，特別在判讀困難異常（如肋骨骨折）時，敏感度更高。不同提示策略（如 chain-of-thought）效果不一。即使標籤有雜訊，用 LLM 擷取的標籤訓練影像分類器，表現仍不錯，但最終評估結果會受標註方法影響很大。因此，選對 LLM、提示方式和評估方法對醫療 AI 發展很重要。 PubMed DOI

Prompt Engineering for Large Language Models in Interventional Radiology.
介入放射學中大型語言模型的提示工程 AJR Am J Roentgenol 2025-05-07

這篇文章介紹了幾種常見的提示工程技巧，像是 zero-shot、few-shot 和 chain-of-thought，說明它們如何幫助提升 AI 在介入放射學領域的表現。內容也討論資料隱私、法規等挑戰，並展望未來像檢索增強生成、多模態模型等新方向。 PubMed DOI

LLMs-based Few-Shot Disease Predictions using EHR: A Novel Approach Combining Predictive Agent Reasoning and Critical Agent Instruction.
基於LLMs的少樣本疾病預測：結合預測代理推理與關鍵代理指導的電子健康紀錄新方法 AMIA Annu Symp Proc 2025-05-26

這項研究利用大型語言模型（LLMs）把電子健康紀錄（EHR）結構化資料轉成自然語言，並應用在疾病預測。LLMs分別扮演「預測者」和「評論者」兩種角色，負責預測結果和給予改進建議。結果顯示，在樣本數少的情況下，這種方法的預測表現不輸傳統監督式學習，對醫療應用很有發展潛力。 PubMed

Clinical Information Extraction with Large Language Models: A Case Study on Organ Procurement.
利用大型語言模型進行臨床資訊擷取：以器官摘取為案例研究 AMIA Annu Symp Proc 2025-05-26

這篇文章說明大型語言模型（LLMs）能準確從臨床文本抓取數值資料，像是檢驗數據和生命徵象。作者提出新提示策略和方法，能有效降低錯誤，並在標註病歷上驗證成果，也證明這方法適用於大量器官捐贈者資料分析，有助提升器官採集資料的研究可用性。 PubMed

Large language model discharge summary preparation using real-world electronic medical record data shows promise.
使用真實世界電子病歷資料進行大型語言模型出院摘要撰寫展現潛力 Intern Med J 2025-05-28

**重點摘要：** 這項研究測試了兩個大型語言模型（LLMs），用來從真實的臨床紀錄自動產生出院摘要，並用一個經過驗證的評分指標來評分他們的結果。兩個模型的表現差不多，顯示LLMs有潛力協助醫師準備出院摘要，進而減輕臨床醫師的行政工作負擔。 PubMed DOI

Prompting Pro Tips! Best Practices for Generating Clinical Narrative Summaries.
臨床敘述摘要撰寫技巧！產生臨床敘述摘要的最佳實務指南 Mil Med 2025-05-31

這項研究發現，用結構化提示雖然能讓八款大型語言模型產生更貼近臨床需求的摘要，但也更容易出現錯誤和偏誤。沒有任何模型能穩定產出臨床可用的摘要，因此各機構還是要自行把關，確保摘要內容正確無誤。 PubMed DOI

Evaluating large language models for information extraction from gastroscopy and colonoscopy reports through multi-strategy prompting.
透過多策略提示評估大型語言模型於胃鏡與大腸鏡報告資訊擷取的表現 J Biomed Inform 2025-06-12

這項研究評估多種大型語言模型，利用提示工程從胃鏡和大腸鏡報告中擷取結構化資訊。結果顯示，大型且專業化的模型在基本資訊擷取表現最好，但遇到複雜推理時仍有限制。少樣本學習對部分模型有幫助，顯示LLMs自動化醫療文本分析有潛力，但還需改進。 PubMed DOI

原始文章

站上相關主題文章列表