Clinical Management of Wasp Stings Using Large Language Models: Cross-Sectional Evaluation Study.
利用大型語言模型進行胡蜂螫傷的臨床管理:橫斷面評估研究
J Med Internet Res 2025-06-04
這項研究比較四款主流大型語言模型在處理胡蜂螫傷案例的表現,結果發現 Claude Pro 最優,ChatGPT 4.0 次之,兩者在複雜案例中都能提供準確且完整的協助。研究強調先進 AI 在急診與中毒醫學的潛力,建議臨床應依需求選擇合適模型。
PubMedDOI♡
站上相關主題文章列表
A comparative analysis of large language models on clinical questions for autoimmune diseases.
自體免疫疾病臨床問題的大型語言模型比較分析。
Front Digit Health 2025-03-18
Evaluating the Efficacy of Large Language Models in Generating Medical Documentation: A Comparative Study of ChatGPT-4, ChatGPT-4o, and Claude.
評估大型語言模型在生成醫療文檔中的效能:ChatGPT-4、ChatGPT-4o 和 Claude 的比較研究。
Aesthetic Plast Surg 2025-04-14
Assessing large language models as assistive tools in medical consultations for Kawasaki disease.
將「Assessing large language models as assistive tools in medical consultations for Kawasaki disease.」翻譯為:
「評估大型語言模型作為川崎病醫療諮詢輔助工具的可行性」
Front Artif Intell 2025-04-15
這項研究比較三款AI語言模型在回答川崎病問題時的表現。結果顯示,Claude 3.5 Sonnet 答案最準確,特別適合專業醫師提問;Gemini 1.5 Pro 則在家長提問時最容易理解。不過,所有模型都有可能出現錯誤資訊。建議家長查詢時優先選用 Claude 3.5 Sonnet 並用適合家長的提問方式。未來還需持續改進AI模型,確保醫療資訊正確可靠。
PubMedDOI
Evaluating Large Language Models in Cardiovascular Antithrombotic Care: Performance, Accuracy, and Implications for Clinical Practice.
心血管抗血栓治療中大型語言模型的評估:表現、準確性及其對臨床實務的影響
Can J Cardiol 2025-04-16
這項研究發現,Claude 3 Opus 在心血管抗凝治療案例的準確度勝過其他大型語言模型和臨床醫師,正確率達85%。部分LLMs表現媲美甚至超越有經驗醫師,但免費版模型有時會給出不佳或不安全的建議。所有LLMs在生活型態和飲食建議上表現穩定。研究提醒,醫療決策時應謹慎選用並驗證LLMs。
PubMedDOI
Harnessing advanced large language models in otolaryngology board examinations: an investigation using python and application programming interfaces.
在耳鼻喉科專科醫師考試中運用先進大型語言模型:以 Python 與應用程式介面進行的探討
Eur Arch Otorhinolaryngol 2025-04-25
Accuracy of Large Language Models When Answering Clinical Research Questions: Systematic Review and Network Meta-Analysis.
大型語言模型在回答臨床研究問題時的準確性:系統性回顧與網絡統合分析
J Med Internet Res 2025-04-30
A clinician-based comparative study of large language models in answering medical questions: the case of asthma.
以臨床醫師為基礎之大型語言模型在醫學問題回答上的比較研究:以氣喘為例
Front Pediatr 2025-05-12
Large language model evaluation in autoimmune disease clinical questions comparing ChatGPT 4o, Claude 3.5 Sonnet and Gemini 1.5 pro.
自體免疫疾病臨床問題中大型語言模型的評估:比較 ChatGPT 4o、Claude 3.5 Sonnet 與 Gemini 1.5 pro
Sci Rep 2025-05-21
Evaluating performance of large language models for atrial fibrillation management using different prompting strategies and languages.
使用不同提示策略與語言評估大型語言模型於心房顫動管理的表現
Sci Rep 2025-05-30