Evaluating the performance of ChatGPT-4 on the United Kingdom Medical Licensing Assessment.
評估 ChatGPT-4 在英國醫學執照考試中的表現。
Front Med (Lausanne) 2023-10-06
Clinical Research With Large Language Models Generated Writing-Clinical Research with AI-assisted Writing (CRAW) Study.
大型語言模型生成寫作的臨床研究-具有AI輔助寫作的臨床研究(CRAW)研究。
Crit Care Explor 2023-10-30
Performance of large language models at the MRCS Part A: a tool for medical education?
大型語言模型在 MRCS Part A 考試的表現:醫學教育的工具?
Ann R Coll Surg Engl 2023-12-01
研究比較了ChatGPT和Bard兩個大型語言模型在MRCS Part A考試300題上的表現。結果顯示ChatGPT比Bard表現更優秀,回答更有深度。兩者一致性高,對醫學教育和評估有潛力。雖然LLMs能有效取得臨床知識,但需留意資訊可能不準確或過時。ChatGPT在考試中表現準確,在醫療領域有重要價值需受到監督。
PubMedDOI
Large Language Models in Medical Education: Comparing ChatGPT- to Human-Generated Exam Questions.
醫學教育中的大型語言模型:比較 ChatGPT 與人類生成的考試問題。
Acad Med 2024-01-02
Performance of generative pre-trained transformers (GPTs) in Certification Examination of the College of Family Physicians of Canada.
加拿大家庭醫師學院認證考試中生成式預訓練轉換器(GPTs)的表現。
Fam Med Community Health 2024-05-28
Assessing the Ability of a Large Language Model to Score Free-Text Medical Student Clinical Notes: Quantitative Study.
評估大型語言模型對醫學生自由文本臨床筆記進行評分的能力:定量研究。
JMIR Med Educ 2024-08-09
A Language Model-Powered Simulated Patient With Automated Feedback for History Taking: Prospective Study.
一個由語言模型驅動的模擬病人及自動反饋的病史採集:前瞻性研究。
JMIR Med Educ 2024-08-16
Evaluating the Capabilities of Generative AI Tools in Understanding Medical Papers: Qualitative Study.
評估生成式 AI 工具在理解醫學論文中的能力:質性研究。
JMIR Med Inform 2024-09-04