Unlocking the potential of advanced large language models in medication review and reconciliation: A proof-of-concept investigation.
釋放先進大型語言模型在藥物審查和調解中的潛力：一項概念驗證研究。 Explor Res Clin Soc Pharm 2024-09-11

這項研究評估了大型語言模型（LLMs）在藥物審查中的表現，特別是劑量錯誤、藥物相互作用及基因組學建議的能力。研究測試了四個LLM，發現ChatGPT在劑量方案上表現良好，但對simvastatin的問題有例外。所有LLM都能識別warfarin的相互作用，但錯過metoprolol和verapamil的相互作用。Claude-Instant在治療監測上提供適當建議，而Gemini在基因組學上表現不錯。研究指出，LLM在藥物審查中有潛力，但整合進醫療系統對病人安全至關重要。 PubMed DOI

Mapping Drug Terms via Integration of a Retrieval-Augmented Generation Algorithm with a Large Language Model.
藥物術語的映射：通過將檢索增強生成算法與大型語言模型整合。 Healthc Inform Res 2024-11-17

這項研究探討結合檢索增強生成（RAG）模型與大型語言模型（LLM），以提升國際詞彙中藥物名稱對應的準確性。研究過程中，將藥物成分名稱翻譯成英文，並使用日本藥品名稱，從OHDSI標準詞彙中提取藥物概念。結果顯示，LLM + RAG的組合表現顯著優於傳統方法，命中率超過90%，而基準僅64%。此外，r-precision指標也從23%提升至41%至50%。整體而言，RAG與LLM的整合提供了更有效的全球藥物資訊對應方法。 PubMed DOI

Evaluating accuracy and reproducibility of large language model performance on critical care assessments in pharmacy education.
評估大型語言模型在藥學教育中對重症護理評估的準確性和可重複性。 Front Artif Intell 2025-01-24

這項評估針對五種大型語言模型（LLMs）在重症護理藥物治療問題上的表現進行測試，結果顯示ChatGPT-4的準確性最高，達71.6%。LLMs在知識回憶問題上表現較好，但在知識應用問題上則不及藥學博士學生（學生準確性81%）。使用思考鏈提示可提升ChatGPT-4的準確性至77.4%。這顯示LLMs在特定領域仍需進一步訓練，以改善其應用能力，對於全面藥物管理的使用應謹慎。 PubMed DOI

Automating pharmacovigilance evidence generation: using large language models to produce context-aware structured query language.
自動化藥物監測證據生成：使用大型語言模型產生具上下文意識的結構化查詢語言。 JAMIA Open 2025-02-10

這項研究探討大型語言模型（LLMs），特別是OpenAI的GPT-4，如何提升自然語言查詢（NLQs）轉換為藥物監測（PV）數據庫中的SQL查詢的準確性。研究分三個階段，變化查詢複雜度，並評估有無商業上下文文件的效果。結果顯示，NLQ轉換為SQL的準確性從8.3%提升至78.3%，在所有複雜度層級中均一致。排除高複雜度查詢時，準確率可達85%。這項研究對非技術用戶在數據密集型領域的信息可及性具有重要意義。 PubMed DOI

Artificial Intelligence for Patient Support: Assessing Retrieval-Augmented Generation for Answering Postoperative Rhinoplasty Questions.
人工智慧在病患支持中的應用：評估增強檢索生成技術以回答術後鼻整形問題。 Aesthet Surg J 2025-03-15

這項研究探討檢索增強生成（RAG）模型在術後鼻整形問題上的應用，目的是提升人工智慧在醫療中的準確性與可靠性。研究評估了四個RAG模型對30個常見病人詢問的回應，結果顯示雖然41.7%的回應完全準確，但非回應率高達30.8%，顯示理解上下文的挑戰。Gemini-1.0-Pro-002在全面性上表現佳，但可讀性和易懂性不足，而PaLM 2的可行性評分最低。這項研究強調了RAG在減輕醫師負擔和提升病人參與度的潛力，但也指出在臨床應用中需解決非回應和上下文理解的問題。 PubMed DOI

An adaptive language model-based intelligent medication assistant for the decision support of antidepressant prescriptions.
基於自適應語言模型的智能藥物助手，用於抗憂鬱藥物處方的決策支持。 Comput Biol Med 2025-03-27

這篇論文探討了一個智能藥物助手的開發，目的是透過個性化的藥物建議來改善抑鬱症治療。助手利用先進技術，如大型語言模型（LLMs），分析病人的病歷和健康狀況，提供更準確的建議。研究分析了40個需要精神科監測的案例，測試了十個LLMs，結果顯示商業模型GPT-4的表現優於開源模型Llama-3，顯示出在心理健康領域的顯著進步。 PubMed DOI

A scoping review on generative AI and large language models in mitigating medication related harm.
關於生成式人工智慧和大型語言模型在減輕藥物相關傷害中的範疇回顧。 NPJ Digit Med 2025-03-29

與藥物相關的傷害對全球醫療成本和病人結果影響深遠。生成式人工智慧（GenAI）和大型語言模型（LLM）在降低這些風險上展現潛力。本次回顧分析了2012年1月到2024年10月的文獻，找到3988篇文章，最終納入30篇。GenAI和LLM的應用可分為三個領域：識別藥物相互作用、提供臨床決策支持及增強藥物監測。雖然這些模型在早期識別不良藥物事件上有潛力，但尚缺乏前瞻性測試，需進一步研究其整合與實際應用。 PubMed DOI

Retrieval augmented generation for 10 large language models and its generalizability in assessing medical fitness.
10 種大型語言模型的檢索增強生成及其在評估醫療適應性中的普遍性。 NPJ Digit Med 2025-04-04

這項研究探討了基於GPT-4的檢索增強生成（RAG）模型在術前評估中的有效性。研究測試了十個大型語言模型，生成超過3,200個回應，並與近450個人類答案進行比較。結果顯示，使用國際指導的GPT-4 LLM-RAG模型準確率達96.4%，明顯高於人類的86.6%，且反應時間更快、不一致情況較少。這顯示LLM-RAG模型在醫療環境中提升術前評估的潛力。 PubMed DOI

Generative AI vs. human expertise: a comparative analysis of case-based rational pharmacotherapy question generation.
生成式人工智慧與人類專業知識：基於案例的合理藥物治療問題生成的比較分析。 Eur J Clin Pharmacol 2025-04-09

這項研究評估了三個生成式人工智慧模型—ChatGPT-4o、Gemini 1.5 Advanced Pro 和 Claude 3.5 Sonnet—在創建與高血壓和糖尿病相關的藥理學問題的有效性。使用一次性提示，這些模型生成了60個問題，並由多學科小組進行可用性評估。103名醫學生在考試中回答了AI生成的問題，結果顯示AI問題的正確率與專家問題相當，且AI生成問題的準備效率顯著提升。然而，仍有19個問題被認為無法使用，顯示專家審查的重要性。結合AI效率與專家驗證的方式，可能是改善醫學教育的最佳策略。 PubMed DOI

Identifying Deprescribing Opportunities With Large Language Models in Older Adults: Retrospective Cohort Study.
利用大型語言模型識別老年人減藥機會：回顧性隊列研究。 JMIR Aging 2025-04-11

多重用藥在老年人中很常見，可能引發不良事件如跌倒。減藥能降低這些風險，但在急診環境中實施面臨挑戰。本研究評估了一個大型語言模型（LLM）管道，利用三組標準來找出急診老年患者的減藥機會。結果顯示，LLM在篩選減藥標準上表現優於醫學生，但在提出具體建議時效果不佳。研究強調需更清晰的減藥指導及改善AI與臨床醫師的整合。 PubMed DOI

原始文章

站上相關主題文章列表