OpenMedLM: prompt engineering can out-perform fine-tuning in medical question-answering with open-source large language models.
OpenMedLM: 在醫學問答中，prompt engineering 可以優於對開源大型語言模型進行微調。 Sci Rep 2024-06-19

OpenMedLM是一個開源的醫學語言模型，在醫學基準測試中表現優異，且無需大量微調。透過提示策略，OpenMedLM在三個醫學語言模型基準測試中取得領先地位，超越其他模型。這顯示開源基礎模型在提升醫療任務表現方面具有潛力，同時也凸顯提示工程對於醫學應用中易用的語言模型的重要性。 PubMed DOI

On the development and validation of large language model-based classifiers for identifying social determinants of health.
基於大型語言模型的分類器在識別健康社會決定因素中的開發與驗證。 Proc Natl Acad Sci U S A 2024-09-16

這項研究強調在醫療照護中評估健康社會決定因素（SDoH）的重要性，以改善病患照護並縮小健康差距。研究探討了電子健康紀錄（EHRs）中SDoH數據不足的挑戰，主要因為缺乏標準化的診斷代碼。研究團隊使用大型語言模型（如BERT和RoBERTa）來分類無家可歸、食物不安全和家庭暴力等SDoH概念，並創建合成訓練數據集。結果顯示，這些模型能有效提取SDoH資訊，幫助醫療提供者識別高風險病患，進而實施針對性干預，支持減少健康差距的努力。 PubMed DOI

Scalable information extraction from free text electronic health records using large language models.
使用大型語言模型從自由文本電子健康紀錄中進行可擴展的信息提取。 BMC Med Res Methodol 2025-01-28

這項研究探討開源大型語言模型（LLMs）在從電子健康紀錄（EHRs）中提取社會健康決定因素（SDoH）數據的效果。研究隨機選取200名患者，並由兩位審查者手動標記九個SDoH方面，達成93%的高一致性。結果顯示，LLMs的表現明顯優於基準模型，特別是在識別明確提及的SDoH方面。最佳模型openchat_3.5在所有SDoH方面的準確率最高。研究強調進一步精煉和專業訓練的潛力，以提升LLMs在臨床研究中的應用，最終改善醫療結果。 PubMed DOI

Cross-Institutional Evaluation of Large Language Models for Radiology Diagnosis Extraction: A Prompt-Engineering Perspective.
跨機構評估大型語言模型於放射診斷萃取之表現：以提示工程觀點分析 J Imaging Inform Med 2025-05-09

這項研究用標準化、針對人類優化的提示語，讓大型語言模型標註六家醫院的放射科報告，結果 Llama 3.1 70b 在不同報告和機構間都很準確且一致。顯示只要設計好提示語，LLMs 在各種臨床環境下都能穩定標註。未來會再加強提示語的通用性和模型穩定性。 PubMed DOI

Social determinants of health extraction from clinical notes across institutions using large language models.
使用大型語言模型跨機構從臨床紀錄中擷取健康社會決定因素 NPJ Digit Med 2025-05-16

這篇研究針對電子病歷中難以提取健康社會決定因素（SDoH）問題，從四家醫院建立標註資料集，涵蓋21種SDoH，並用多種模型（包含大型語言模型）進行偵測。經過指令微調的LLMs表現最佳，F1值都很高，但模型跨醫院應用仍有困難。訓練好的模型已公開在GitHub。 PubMed DOI

Boosting Social Determinants of Health Extraction with Semantic Knowledge Augmented Large Language Model.
結合語意知識強化大型語言模型以提升社會健康決定因子的萃取 AMIA Annu Symp Proc 2025-05-26

從電子健康紀錄擷取健康社會決定因素很難，因為資料多是非結構化且類別不均。作者把UMLS語意知識結合進大型語言模型，來產生更多訓練資料，特別補足資料較少的類別。這方法能提升模型擷取SDoH資訊的效果，並已在MIMIC-SDoH資料集上驗證有效。 PubMed

SDoH-GPT: using large language models to extract social determinants of health.
SDoH-GPT：運用大型語言模型萃取健康社會決定因素 J Am Med Inform Assoc 2025-06-10

SDoH-GPT 是一套新方法，結合大型語言模型、少量範例學習和 XGBoost 分類器，能自動從醫療紀錄擷取健康社會決定因素。這大幅減少人工標註，省時又省錢，準確度也很高（Cohen’s kappa 0.92、AUROC 超過 0.90），已在三個資料集驗證，讓醫療界更容易運用 SDoH 資料。 PubMed DOI

Transfer Learning with Clinical Concept Embeddings from Large Language.
來自大型語言模型的臨床概念嵌入之遷移學習 AMIA Jt Summits Transl Sci Proc 2025-06-12

這項研究發現，像 Med-BERT 這種專為醫療設計的大型語言模型，比通用型模型更能處理不同醫院間的資料差異，提升知識轉移效果。通用模型如 OpenAI 需額外微調。未來建議持續研究如何在任務難度、資料量和微調之間取得最佳平衡。 PubMed

Automatic Summarization of Doctor-Patient Encounter Dialogues Using Large Language Model through Prompt Tuning.
利用提示微調大型語言模型自動摘要醫病對話紀錄 AMIA Jt Summits Transl Sci Proc 2025-06-12

**重點摘要：** 這項研究顯示，使用 prompt-tuning 搭配大型臨床語言模型（GatorTronGPT）可以有效地摘要醫師與病患之間的對話，不僅表現優於以往經過 fine-tune 的模型，而且更有效率，因為不需要更新模型的參數。 PubMed

Evaluating large language models for information extraction from gastroscopy and colonoscopy reports through multi-strategy prompting.
透過多策略提示評估大型語言模型於胃鏡與大腸鏡報告資訊擷取的表現 J Biomed Inform 2025-06-12

這項研究評估多種大型語言模型，利用提示工程從胃鏡和大腸鏡報告中擷取結構化資訊。結果顯示，大型且專業化的模型在基本資訊擷取表現最好，但遇到複雜推理時仍有限制。少樣本學習對部分模型有幫助，顯示LLMs自動化醫療文本分析有潛力，但還需改進。 PubMed DOI

原始文章

站上相關主題文章列表