Unlocking the potential of advanced large language models in medication review and reconciliation: A proof-of-concept investigation.
釋放先進大型語言模型在藥物審查和調解中的潛力：一項概念驗證研究。 Explor Res Clin Soc Pharm 2024-09-11

這項研究評估了大型語言模型（LLMs）在藥物審查中的表現，特別是劑量錯誤、藥物相互作用及基因組學建議的能力。研究測試了四個LLM，發現ChatGPT在劑量方案上表現良好，但對simvastatin的問題有例外。所有LLM都能識別warfarin的相互作用，但錯過metoprolol和verapamil的相互作用。Claude-Instant在治療監測上提供適當建議，而Gemini在基因組學上表現不錯。研究指出，LLM在藥物審查中有潛力，但整合進醫療系統對病人安全至關重要。 PubMed DOI

Application of Large Language Models in Medical Training Evaluation-Using ChatGPT as a Standardized Patient: Multimetric Assessment.
大型語言模型在醫學訓練評估中的應用 - 使用 ChatGPT 作為標準化病人：多指標評估。 J Med Internet Res 2025-01-01

這項研究探討了使用ChatGPT作為醫學教育中的標準化病人，特別是在病史採集方面。研究分為兩個階段：第一階段評估其可行性，模擬炎症性腸病的對話並將回應分為好、中、差三類。第二階段則評估其擬人化、臨床準確性和適應性，並調整提示以增強回應。結果顯示，ChatGPT能有效區分不同質量的回應，經過修訂的提示使其準確性提高了4.926倍。整體而言，研究表明ChatGPT可作為模擬醫學評估的工具，並有潛力改善醫學訓練。 PubMed DOI

Evaluating accuracy and reproducibility of large language model performance on critical care assessments in pharmacy education.
評估大型語言模型在藥學教育中對重症護理評估的準確性和可重複性。 Front Artif Intell 2025-01-24

這項評估針對五種大型語言模型（LLMs）在重症護理藥物治療問題上的表現進行測試，結果顯示ChatGPT-4的準確性最高，達71.6%。LLMs在知識回憶問題上表現較好，但在知識應用問題上則不及藥學博士學生（學生準確性81%）。使用思考鏈提示可提升ChatGPT-4的準確性至77.4%。這顯示LLMs在特定領域仍需進一步訓練，以改善其應用能力，對於全面藥物管理的使用應謹慎。 PubMed DOI

Performance of ChatGPT-3.5 and ChatGPT-4 in the Taiwan National Pharmacist Licensing Examination: Comparative Evaluation Study.
ChatGPT-3.5 和 ChatGPT-4 在台灣國家藥師執照考試中的表現：比較評估研究。 JMIR Med Educ 2025-01-26

這項研究評估了OpenAI的ChatGPT-3.5和GPT-4在台灣國家藥師執照考試的表現。結果顯示，GPT-4的準確率為72.9%，明顯優於GPT-3.5的59.1%。在基礎科目中，GPT-4得分更高，顯示其在臨床藥學和教育上的潛力。不過，研究也提醒使用者需謹慎，因為模型仍有局限性。未來應著重改進模型的穩定性和問題設計，以更有效評估學生能力。 PubMed DOI

ChatGPT versus physician-derived answers to drug-related questions.
ChatGPT 與醫師提供的藥物相關問題答案的比較。 Dan Med J 2025-02-12

這項研究評估了ChatGPT 3.5和4.0在藥物諮詢服務中的表現。結果顯示，ChatGPT 3.5在80%的案例中提供了不錯的答案，而ChatGPT 4.0的表現更佳，98%的回應與醫生的回答相似或更好。不過，兩者的回應都缺乏參考文獻，有時也未能充分解決臨床相關問題。雖然ChatGPT 4.0的答案品質相當高，但在提供參考和臨床解釋方面的不足，顯示它不太適合成為臨床環境中的主要資訊來源。 PubMed DOI

The extent and type of use, opportunities and concerns of ChatGPT in community pharmacy: A survey of community pharmacy staff.
社區藥局中 ChatGPT 的使用範圍與類型、機會與顧慮：社區藥局員工的調查。 Explor Res Clin Soc Pharm 2025-03-03

這項研究探討了ChatGPT在荷蘭社區藥局的應用，指出其潛在好處與擔憂。研究中，106名藥學專業人士中有50.9%曾使用ChatGPT，38.7%是用於藥學任務。受訪者認為ChatGPT在寫作輔助和快速解答臨床問題上有潛力，但對其可靠性和答案準確性表示擔憂。結果顯示，雖然ChatGPT是有價值的工具，但因質量問題，目前在臨床查詢的使用仍有限，需與可靠來源交叉參考以確保藥物護理的準確性。 PubMed DOI

GP or ChatGPT? Ability of large language models (LLMs) to support general practitioners when prescribing antibiotics.
大型語言模型 (LLMs) 在支持全科醫生開立抗生素時的能力：GP 還是 ChatGPT？ J Antimicrob Chemother 2025-03-13

大型語言模型（LLMs）在醫療領域的應用日益增多，能協助診斷和治療感染。一項研究比較了全科醫生與六個LLMs（如ChatGPT、Gemini等）對24個臨床案例的反應。全科醫生在診斷和抗生素處方的準確率高達96%-100%，但在劑量和療程的準確性上較低（50%-75%）。LLMs的表現也不錯，但在參考指導方針的能力上不一致，特別是在挪威的表現不佳。研究指出LLMs有數據洩漏的風險，雖然它們在抗生素處方上有潛力，但全科醫生在臨床情境解釋和指導方針應用上仍更具優勢。 PubMed DOI

Comparing Large Language Models for antibiotic prescribing in different clinical scenarios: which perform better?
比較大型語言模型在不同臨床情境下的抗生素處方：哪一種表現更佳？ Clin Microbiol Infect 2025-03-20

這項研究評估了十四個大型語言模型（LLMs）在不同臨床情境中推薦抗生素的表現。研究使用標準化提示，針對60個案例的藥物選擇、劑量和治療持續時間進行評估。結果顯示，ChatGPT-o1的準確率最高，達71.7%，劑量正確性達96.7%。而在治療持續時間方面，Gemini表現最佳（75.0%）。不過，各模型在複雜案例中的表現差異明顯，顯示出在臨床應用前仍需謹慎驗證。 PubMed DOI

Comparison of a generative large language model to pharmacy student performance on therapeutics examinations.
生成式大型語言模型與藥學系學生在治療學考試表現之比較 Curr Pharm Teach Learn 2025-05-23

ChatGPT-3.5 在治療學考試的表現明顯不如藥學系學生，分數只有 53%，學生平均則有 82%。它在需要應用和案例分析的題目上特別吃力，只有在記憶型題目表現較好，顯示生成式 AI 在複雜醫學教育任務上還有不少限制。 PubMed DOI

Evaluating and leveraging large language models in clinical pharmacology and therapeutics assessment: From exam takers to exam shapers.
在臨床藥理學與治療學評估中評價與應用大型語言模型：從考生到考題設計者 Br J Clin Pharmacol 2025-06-10

最新研究發現，像 ChatGPT-4 Omni 這類大型語言模型，在 CPT 和歐洲處方考試的表現跟醫學生差不多，甚至更厲害，特別是在知識和開藥技巧上。這些 AI 還能揪出題目寫不清楚的地方，不只適合當教學工具，也有助於改進考題品質。 PubMed DOI

原始文章

站上相關主題文章列表