Multiple large language models versus experienced physicians in diagnosing challenging cases with gastrointestinal symptoms.
多個大型語言模型與經驗豐富的醫生在診斷具有挑戰性的腸胃症狀病例中的比較。
NPJ Digit Med 2025-02-05
這項研究比較了大型語言模型(LLMs)與人類腸胃科醫生在挑戰性腸胃病例中的診斷能力。研究分析了67個病例,發現LLM Claude 3.5 Sonnet的準確率達76.1%,明顯高於腸胃科醫生的45.5%。這顯示先進的LLMs能成為腸胃科醫生的有力工具,提供高效且具成本效益的診斷支持。
相關文章PubMedDOI
GPT-4 assistance for improvement of physician performance on patient care tasks: a randomized controlled trial.
GPT-4 在改善醫師在病患照護任務上表現的隨機對照試驗。
Nat Med 2025-02-05
Efficacy of Fine-Tuned Large Language Model in CT Protocol Assignment as Clinical Decision-Supporting System.
微調大型語言模型在 CT 協議分配中的效能作為臨床決策支持系統。
J Imaging Inform Med 2025-02-05
Evaluation of the potential value of artificial intelligence (AI) in public health using fluoride intake as the example.
以氟攝取為例,評估人工智慧 (AI) 在公共衛生中的潛在價值。
Ecotoxicol Environ Saf 2025-02-05
Cellular morphometric biomarkers and large language model predict prognosis and treatment response in neuroblastoma patients: A retrospective and double-blind prospective single arm clinical study.
神經母細胞瘤患者的細胞形態計量生物標記與大型語言模型預測預後和治療反應:一項回顧性和雙盲前瞻性單臂臨床研究。
Eur J Cancer 2025-02-05
Performance Evaluation of Large Language Models in Cervical Cancer Management Based on a Standardized Questionnaire: Comparative Study.
基於標準化問卷的子宮頸癌管理中大型語言模型的性能評估:比較研究。
J Med Internet Res 2025-02-05