Performance of ChatGPT on the Chinese Postgraduate Examination for Clinical Medicine: Survey Study.
ChatGPT 在中國臨床醫學研究生考試中的表現：調查研究。 JMIR Med Educ 2024-02-27

研究發現ChatGPT在中文醫學考試中及格，但回答開放式問題準確度較低。儘管有多元見解，仍有改進空間。未來研究應探討ChatGPT在醫療領域的語言表現。 PubMed DOI

Exploring the proficiency of ChatGPT-4: An evaluation of its performance in the Taiwan advanced medical licensing examination.
探討 ChatGPT-4 的熟練度：評估其在台灣高級醫學執照考試中的表現。 Digit Health 2024-03-08

台灣醫療好，2022和2023年醫師考試數據顯示ChatGPT-4準確率介於63.75%到93.75%，最高93.75%在2022年2月。眼科、乳房外科、整形外科、骨科和普通外科表現較差。透過“思維鏈”方法，ChatGPT-4準確率提升至90%以上，在台灣醫師考試表現優異。 PubMed DOI

Performance of ChatGPT on Chinese Master's Degree Entrance Examination in Clinical Medicine.
ChatGPT 在臨床醫學碩士研究生入學考試中的表現。 PLoS One 2024-04-04

研究發現ChatGPT在中醫臨床醫學考試中表現良好，尤其在醫學人文學科方面。然而，在病理學問題上表現較差。ChatGPT在單選題方面表現較多選題更好。儘管有潛力幫助醫學知識，但仍需改進準確性和可靠性。有效運用ChatGPT於醫學教育需謹慎評估和積極採取措施。 PubMed DOI

Influence of Model Evolution and System Roles on ChatGPT's Performance in Chinese Medical Licensing Exams: Comparative Study.
模型演變與系統角色對 ChatGPT 在中國醫學執照考試中表現的影響：比較研究。 JMIR Med Educ 2024-08-14

這項研究評估了ChatGPT在中國國家醫學執照考試中的表現，特別是GPT-3.5和GPT-4.0版本。研究發現，GPT-4.0的及格率為72.7%，明顯高於GPT-3.5的54%。此外，GPT-4.0的回答變異性較低，且在15個醫學子專科中有14個超過準確性門檻，顯示其在醫學教育和臨床實踐中的潛在應用價值。總體而言，GPT-4.0在準確性和一致性上表現更佳，值得進一步探索。 PubMed DOI

The performance of AI in medical examinations: an exploration of ChatGPT in ultrasound medical education.
AI 在醫學考試中的表現：探索 ChatGPT 在超聲醫學教育中的應用。 Front Med (Lausanne) 2024-11-20

本研究評估了ChatGPT在回答中國超聲醫學中級專業技術資格考試問題的有效性，並探討其在超聲醫學教育中的應用潛力。共選取100道題目，包含70道單選題和30道多選題，涵蓋基礎知識、臨床知識、專業知識及實踐。測試結果顯示，ChatGPT 3.5版本在單選題準確率為35.7%，多選題30.0%；而4.0版本則提升至61.4%和50.0%。雖然4.0版本有明顯進步，但仍未達及格標準，且在專業實踐方面表現不佳。儘管如此，ChatGPT在基礎醫學知識上的表現顯示其作為醫學教育輔助工具的潛力。 PubMed DOI

Advancements in AI Medical Education: Assessing ChatGPT's Performance on USMLE-Style Questions Across Topics and Difficulty Levels.
AI 醫學教育的進展：評估 ChatGPT 在各主題和難度級別的 USMLE 風格問題上的表現。 Cureus 2025-01-24

這項研究評估了兩個版本的ChatGPT在美國醫學執照考試（USMLE）風格問題上的表現，使用了900道選擇題。結果顯示，ChatGPT-4的準確率為71.33%，明顯高於AMBOSS用戶的54.38%和ChatGPT-3.5的46.23%。ChatGPT-4在準確率上比ChatGPT-3.5提升了25%，且在多次測試中的一致性也較高。雖然兩個模型在不同醫學主題上的表現有所不同，但問題的複雜性可能影響了表現變異性。總體而言，ChatGPT-4在醫學教育中展現出潛力，甚至在某些方面超越人類。 PubMed DOI

ChatGPT (GPT-4V) Performance on the Healthcare Information Technologist Examination in Japan.
ChatGPT (GPT-4V) 在日本醫療資訊技術人員考試中的表現。 Cureus 2025-02-03

本研究評估了ChatGPT（GPT-4V）在日本醫療資訊技術人員（HCIT）認證考試中的表現。經過三年，分析了476道考題，結果顯示ChatGPT的正確回答率達84%，成功通過考試。簡單選擇題的表現優於多選題，且帶圖片的問題和需要計算的題目正確率較低。總體而言，ChatGPT具備HCIT認證所需的基本知識和技能，顯示其在醫療資訊領域的潛力。 PubMed DOI

While GPT-3.5 is unable to pass the Physician Licensing Exam in Taiwan, GPT-4 successfully meets the criteria.
雖然 GPT-3.5 無法通過台灣的醫師執照考試，但 GPT-4 成功符合標準。 J Chin Med Assoc 2025-03-14

這項研究評估了ChatGPT-3.5和ChatGPT-4在回答台灣醫師執照考試醫學問題的表現，特別關注繁體中文的能力。結果顯示，ChatGPT-3.5在基礎醫學科學的準確率為67.7%，臨床醫學為53.2%；而ChatGPT-4的表現明顯優於前者，準確率分別達到91.9%和90.7%。雖然問題類型對準確率影響不大，但ChatGPT-4在所有科目中均表現良好，顯示AI在醫學教育中的潛力，實施時仍需謹慎考量不同專業的變異性。 PubMed DOI

Performance of ChatGPT-4 on Taiwanese Traditional Chinese Medicine Licensing Examinations: Cross-Sectional Study.
ChatGPT-4 在台灣傳統中醫執照考試中的表現：橫斷面研究。 JMIR Med Educ 2025-03-19

本研究探討了ChatGPT（特別是GPT-4模型）在台灣傳統中醫執照考試中的表現。測試結果顯示，ChatGPT的準確率僅43.9%，遠低於兩位持證中醫師的70%和78.4%。大部分錯誤來自對中醫概念的誤解，顯示其在中醫知識和推理上的局限性。雖然ChatGPT在教育資源方面有潛力，但目前在TCM考試中的表現仍不理想。研究建議需改進專門的中醫AI模型，並對其在中醫教育中的應用保持謹慎，未來應專注於提升模型及開發專屬的學習工具。 PubMed DOI

Assessing ChatGPT 4.0's Capabilities in the United Kingdom Medical Licensing Examination (UKMLA): A Robust Categorical Analysis.
ChatGPT 4.0 在英國醫學執照考試（UKMLA）中的能力評估：一項嚴謹的類別分析 Sci Rep 2025-04-15

這項研究發現，ChatGPT-4在有選擇題選項時，答對率超過86%，但沒選項時最低只有61.5%。它在管理問題上比診斷問題更容易出錯。雖然GPT-4能處理臨床資訊，但不是真的懂臨床情境。未來如果和專業醫療人員搭配，有機會幫助臨床工作，但還需要更多測試來確保安全和有效。 PubMed DOI

原始文章

站上相關主題文章列表