Evaluating the application of ChatGPT in China's residency training education: An exploratory study.
評估 ChatGPT 在中國住院醫師培訓教育中的應用：一項探索性研究。 Med Teach 2024-07-12

研究發現，在中國醫師教育中使用ChatGPT有正面效果。ChatGPT能回答45.1%考試問題，生成優質臨床案例，並受到醫師肯定。研究指出，ChatGPT在中國可望發揮個人化醫學教育的潛力。 PubMed DOI

A Clinical Evaluation of Cardiovascular Emergencies: A Comparison of Responses from ChatGPT, Emergency Physicians, and Cardiologists.
心血管急症的臨床評估：ChatGPT、急診醫師與心臟科醫師反應的比較。 Diagnostics (Basel) 2024-12-17

這項研究評估了ChatGPT-4o在急性心臟病案例中的表現，並與心臟科醫生和急診醫生進行比較。結果顯示，ChatGPT-4o和心臟科醫生的準確性均達100%，而急診醫生較低。ChatGPT-4o反應最快，且在準確性和完整性上得分最高。研究顯示，ChatGPT-4o的表現優於人類醫生，顯示其在臨床決策支持上的潛力，但人類監督仍然對安全整合AI進醫療至關重要。 PubMed DOI

Systematic review of ChatGPT accuracy and performance in Iran's medical licensing exams: A brief report.
伊朗醫學執照考試中 ChatGPT 準確性和表現的系統性回顧：簡要報告。 J Educ Health Promot 2025-01-15

這項研究評估了ChatGPT在伊朗醫學考試的表現，基礎科學考試準確率介於32%到72%之間，實習前考試為34%到68.5%，住院醫師考試則在32%到84%之間。英文輸入的表現優於波斯文。特別是在牙髓學考試中，準確率為40%。作者建議制定指導方針和檢查清單，以提升研究質量和一致性，目標是將ChatGPT打造成醫學教育和實踐中的有用輔助工具。 PubMed DOI

Advancements in AI Medical Education: Assessing ChatGPT's Performance on USMLE-Style Questions Across Topics and Difficulty Levels.
AI 醫學教育的進展：評估 ChatGPT 在各主題和難度級別的 USMLE 風格問題上的表現。 Cureus 2025-01-24

這項研究評估了兩個版本的ChatGPT在美國醫學執照考試（USMLE）風格問題上的表現，使用了900道選擇題。結果顯示，ChatGPT-4的準確率為71.33%，明顯高於AMBOSS用戶的54.38%和ChatGPT-3.5的46.23%。ChatGPT-4在準確率上比ChatGPT-3.5提升了25%，且在多次測試中的一致性也較高。雖然兩個模型在不同醫學主題上的表現有所不同，但問題的複雜性可能影響了表現變異性。總體而言，ChatGPT-4在醫學教育中展現出潛力，甚至在某些方面超越人類。 PubMed DOI

Assessing the performance of ChatGPT in medical ethical decision-making: a comparative study with USMLE-based scenarios.
評估 ChatGPT 在醫學倫理決策中的表現：與 USMLE 基於情境的比較研究。 J Med Ethics 2025-01-25

人工智慧（AI）在醫療領域的應用帶來了機會與挑戰，尤其在倫理和專業問題上。本研究評估了ChatGPT 3.5和4.0在處理醫療情境中的表現，使用了273道來自不同題庫的問題。結果顯示，GPT-3.5的正確回答率普遍低於醫學生的平均水平，而GPT-4在某些題庫中表現較佳。雖然GPT-4在倫理和人際互動方面顯示潛力，但人類的推理能力仍然優於AI，未來需持續發展AI系統以提升其在醫療中的有效性。 PubMed DOI

ChatGPT (GPT-4V) Performance on the Healthcare Information Technologist Examination in Japan.
ChatGPT (GPT-4V) 在日本醫療資訊技術人員考試中的表現。 Cureus 2025-02-03

本研究評估了ChatGPT（GPT-4V）在日本醫療資訊技術人員（HCIT）認證考試中的表現。經過三年，分析了476道考題，結果顯示ChatGPT的正確回答率達84%，成功通過考試。簡單選擇題的表現優於多選題，且帶圖片的問題和需要計算的題目正確率較低。總體而言，ChatGPT具備HCIT認證所需的基本知識和技能，顯示其在醫療資訊領域的潛力。 PubMed DOI

Can ChatGPT-4 perform as a competent physician based on the Chinese critical care examination?
ChatGPT-4 能否根據中國重症醫學考試表現出色的醫生能力？ J Crit Care 2025-03-01

這項研究評估了ChatGPT-4在重症醫學的表現，使用的數據來自中國的健康專業技術考試。ChatGPT-4回答了600個問題，成功率達73.5%，超過60%的及格標準，基礎知識的準確率最高，達81.94%。單選題表現（76.72%）優於多選題（51.32%）。雖然它在臨床決策和醫學教育上顯示潛力，但仍需醫療專業人員的監督，以確保準確性和病人安全。 PubMed DOI

Analyzing Question Characteristics Influencing ChatGPT's Performance in 3000 USMLE®-Style Questions.
分析影響 ChatGPT 在 3000 道 USMLE® 風格問題中表現的問題特徵。 Med Sci Educ 2025-03-27

這項研究評估了ChatGPT在回答美國醫學執照考試第二階段臨床知識問題的表現，分析了其在不同醫學專科、問題類型和難度上的準確性。總共評估了3,000道問題，結果顯示正確率為57.7%。在「男性生殖系統」類別中準確率最高（71.7%），而「免疫系統」最低（46.3%）。隨著問題難度和長度增加，表現下降，顯示較複雜問題更易錯誤。整體而言，ChatGPT的能力接近及格門檻，顯示其作為醫學生輔助學習工具的潛力，並強調了精煉AI模型和設計抗AI考題的重要性。 PubMed DOI

Can Artificial Intelligence Be Successful as an Anaesthesiology and Reanimation Resident?
人工智慧能否成功擔任麻醉與重症醫學住院醫師？ Turk J Anaesthesiol Reanim 2025-04-18

這項研究發現，ChatGPT在麻醉與重症醫學考試中，表現比初階住院醫師好，但比資深住院醫師差一點，整體成績和住院醫師差不多。未來有機會把ChatGPT應用在麻醉和重症醫學的教學上，當作輔助學習的工具。 PubMed DOI

ChatGPT's Performance on Iran's Medical Licensing Exams.
ChatGPT 在伊朗醫師執照考試的表現 Med J Islam Repub Iran 2025-06-09

這項研究發現，ChatGPT 3.5在伊朗醫師執照考試中，用英文作答的正確率（61.4%）明顯高於波斯語（35.7%），整體正確率為48.5%，一致性高達91%。在基礎醫學和實習前考試有及格表現，住院醫師前考試則僅達最低標準，顯示其在醫學教育上有潛力，但語言能力仍有限。 PubMed DOI

原始文章

站上相關主題文章列表