Performance of Generative Pre-trained Transformer (GPT)-4 and Gemini Advanced on the First-Class Radiation Protection Supervisor Examination in Japan.
GPT-4 和 Gemini Advanced 在日本一級輻射防護主管考試中的表現。
Cureus 2024-11-01
Performance of GPT-3.5 and GPT-4 on the Japanese Medical Licensing Examination: Comparison Study.
GPT-3.5和GPT-4在日本醫學執照考試中的表現:比較研究。
JMIR Med Educ 2023-07-26
Evaluating AI Proficiency in Nuclear Cardiology: Large Language Models take on the Board Preparation Exam.
評估人工智慧在核心臟學的能力:大型語言模型挑戰考試準備考試。
medRxiv 2024-07-29
How do large language models answer breast cancer quiz questions? A comparative study of GPT-3.5, GPT-4 and Google Gemini.
大型語言模型如何回答乳腺癌測驗問題?GPT-3.5、GPT-4 和 Google Gemini 的比較研究。
Radiol Med 2024-08-14
這項研究評估了三個大型語言模型(LLMs)—GPT-3.5、GPT-4 和 Google Gemini(Bard)在回答60道乳腺癌護理相關的多選題的表現。結果顯示,GPT-4的準確率最高,正確回答了95%的問題,接著是GPT-3.5的90%和Google Gemini的80%。研究還發現,來自公共數據庫的問題與乳腺放射科醫師新制定的問題在答案準確性上並無顯著差異,顯示LLMs在乳腺癌護理方面有良好的應用潛力,但仍需進一步訓練以提升表現。
PubMedDOI
Assessing knowledge about medical physics in language-generative AI with large language model: using the medical physicist exam.
使用大型語言模型評估語言生成 AI 在醫學物理學方面的知識:以醫學物理師考試為例。
Radiol Phys Technol 2024-09-10
Response accuracy of GPT-4 across languages: insights from an expert-level diagnostic radiology examination in Japan.
GPT-4 在各語言中的回應準確性:來自日本專家級診斷放射學考試的見解。
Jpn J Radiol 2024-10-28
Evaluating the Effectiveness of advanced large language models in medical Knowledge: A Comparative study using Japanese national medical examination.
評估先進大型語言模型在醫學知識中的有效性:使用日本國家醫學考試的比較研究。
Int J Med Inform 2024-10-29