Evaluation of the performance of large language models in endoscopic lumbar surgery: a comparative analysis.
大型語言模型在內視鏡腰椎手術中的表現評估:比較性分析
Ann Med Surg (Lond) 2025-08-11
這項研究比較三款AI在回答內視鏡腰椎手術常見問題的表現。專業醫師認為 Claude 3.5 Sonnet 最專業、內容最優,但一般民眾覺得 ChatGPT o1-preview 最容易懂、最滿意。結果顯示,雖然 Claude 3.5 Sonnet 專業度高,ChatGPT o1-preview 更適合病人衛教,凸顯AI在醫療溝通上的優缺點。
相關文章PubMedDOI推理
Regulating the unseen hand: AI, authorship, and trust in medical science.
調控無形之手:AI、作者身份與醫學科學中的信任
Ann Med Surg (Lond) 2025-08-11
Emerging Brain-to-Content Technologies from Generative AI and Deep Representation Learning.
生成式 AI 與深度表徵學習推動的腦-內容新興技術
IEEE Signal Process Mag 2025-08-11
Assessing the adherence of large language models to clinical practice guidelines in Chinese medicine: a content analysis.
大型語言模型對中醫臨床實踐指引遵循度之評估:內容分析
Front Pharmacol 2025-08-11