Evaluating large language models on a highly-specialized topic, radiation oncology physics.
評估大型語言模型在高度專業的主題上的應用：放射腫瘤學物理。 Front Oncol 2023-11-06

研究發現大型語言模型（LLMs）在回答放射腫瘤學物理問題上有應用價值。ChatGPT（GPT-4）在演繹推理能力方面表現優異，但合作的醫學物理師團隊仍可超越其。LLMs有助於放射腫瘤學專家，值得進一步探討。 PubMed DOI

Performance evaluation of ChatGPT, GPT-4, and Bard on the official board examination of the Japan Radiology Society.
ChatGPT、GPT-4和Bard在日本放射學會官方考試中的表現評估。 Jpn J Radiol 2024-02-06

研究評估大型語言模型在臨床放射學問題上的表現，使用JRBE考題，發現GPT-4比其他模型表現更好。GPT-4在簡單問題、單一答案及核醫學方面表現優異，顯示在日本放射學領域有應用潛力。 PubMed DOI

Accuracy of ChatGPT on Medical Questions in the National Medical Licensing Examination in Japan: Evaluation Study.
ChatGPT 在日本國家醫學資格考試中對醫學問題的準確性：評估研究。 JMIR Form Res 2023-10-30

ChatGPT是OpenAI開發的AI，擅長自然直覺回答。雖然有時會出錯，但經過訓練改進。新版GPT-4預計比GPT-3.5多40%正確回答。在英文表現優秀，現正評估其他語言的醫學資訊。在日本醫學研究中，GPT-4比GPT-3.5表現更好，正確率達81.5%。有潛力成為醫師診斷輔助工具，符合日本醫學執照考試標準。透過持續學習，ChatGPT可成為醫學專業人士的決策支援系統。 PubMed DOI

Performance of ChatGPT incorporated chain-of-thought method in bilingual nuclear medicine physician board examinations.
ChatGPT在雙語核子醫學醫師考試中應用連貫思維方法的表現。 Digit Health 2024-01-09

研究發現ChatGPT在台灣核子醫學專業考試中表現優異，尤其在理論知識和臨床醫學方面。然而，在醫學法規問題上稍嫌不足。研究使用GPT-4和思維鏈方法提升人工智慧表現，建議問題適中且含較多英文單詞可提高準確性。人工智慧可協助評估考試難度，確保公平性，在醫療教育和多語環境中展現潛力，未來進步將提升其在醫學領域的實用性。 PubMed DOI

Performance of Generative Pretrained Transformer on the National Medical Licensing Examination in Japan.
在日本國家醫學資格考試中的生成式預訓練轉換器表現。 PLOS Digit Health 2024-01-27

ChatGPT是一個強大的語言模型，於2022年11月問世，對自然語言處理產生了重大影響。它啟發了全球臨床實踐和研究中使用大型語言模型。一項研究評估了GPT模型在日本國家醫學執照考試（NMLE）上的表現，並將其與通過率進行了比較。研究發現，經過優化提示的GPT-4在考試中取得了及格分數。分析確定了導致答錯的因素，例如缺乏醫學知識和日本特定信息的錯誤。總的來說，GPT模型可以成為醫學領域中有價值的工具，有助應對挑戰並改善醫療保健。 PubMed DOI

Exploring Capabilities of Large Language Models such as ChatGPT in Radiation Oncology.
探索 ChatGPT 等大型語言模型在放射腫瘤學中的應用能力。 Adv Radiat Oncol 2024-02-03

機器學習和自然語言處理技術進步，如ChatGPT，能提供自然語言回應和知識查詢。研究發現ChatGPT在放射線治療問題上表現良好，但仍有一致性挑戰。LLMs未來將對社會和臨床實踐產生更大影響，尤其在放射腫瘤學領域。 PubMed DOI

ChatGPT performance on radiation technologist and therapist entry to practice exams.
ChatGPT對放射技師和治療師入職考試的表現。 J Med Imaging Radiat Sci 2024-05-26

研究探討了ChatGPT（GPT-4）在加拿大醫學放射技術協會（CAMRT）的放射技術、MRI、核子醫學和輻射治療認證考試中的表現。ChatGPT每次參加考試都重複進行五次，並根據問題類型和學科對其表現進行了分析。ChatGPT通過了考試，但在不同類型的問題上表現不同，對知識問題的表現最佳，對批判性思考問題的表現最差。在多次嘗試中，ChatGPT的回答之間存在著相當高的一致性至幾乎完美的一致性。該研究顯示，ChatGPT能夠通過放射技術師和治療師的認證考試，但在不同學科之間表現有所不同。未來研究應考慮在評估ChatGPT在標準化測試中的表現時使用重複測量。 PubMed DOI

The Accuracy of Artificial Intelligence ChatGPT in Oncology Exam Questions.
人工智慧 ChatGPT 在腫瘤學考試問題中的準確性。 J Am Coll Radiol 2024-08-04

這項研究評估了ChatGPT在腫瘤學考試問題上的準確性，使用了單次學習的方法。研究中將600道來自國家放射腫瘤學在職考試的選擇題輸入到ChatGPT 4o和3.5中。結果顯示，ChatGPT 4o的正確率為72.2%，而3.5則為53.8%。在不同問題類別中，特別是關鍵研究和治療建議方面，ChatGPT的表現較弱。儘管有些限制，最新版本的ChatGPT顯示出顯著改進，未來在腫瘤學醫學訓練和決策中可能成為有價值的資源。 PubMed DOI

Evaluating Artificial Intelligence Competency in Education: Performance of ChatGPT-4 in the American Registry of Radiologic Technologists (ARRT) Radiography Certification Exam.
評估人工智慧在教育中的能力：ChatGPT-4 在美國放射技術人員註冊局 (ARRT) 放射攝影認證考試中的表現。 Acad Radiol 2024-08-17

這項研究評估了ChatGPT-4在類似ARRT認證考試的練習題上的表現，使用了200道選擇題，總共進行了3000次測試。整體準確率為80.56%，文字型問題表現較佳（86.3%），影像型問題則較差（45.6%），且影像問題的回答時間較長。不同領域的表現差異明顯，安全性72.6%、影像製作70.6%、病人護理67.3%、程序53.4%。研究顯示ChatGPT-4在ARRT題庫上表現不錯，但仍需進一步研究與實際考試結果的關聯，影像處理的進步對教育應用也很重要。 PubMed DOI

Analysis of Responses of GPT-4 V to the Japanese National Clinical Engineer Licensing Examination.
GPT-4 V 對日本國家臨床工程師執照考試反應的分析。 J Med Syst 2024-09-11

這項研究評估了GPT-4 V在日本國家臨床工程師執照考試的表現，分析了2012至2023年的2,155道題目。該模型的平均正確率為86.0%，在臨床醫學和基礎醫學領域特別高（≥ 90%）。不過，在醫療設備安全管理等領域的表現較差，正確率僅64.8%到76.5%。涉及圖形和計算的問題準確率更低，特別是需要了解日本工業標準的問題，正確率僅31.0%。研究指出ChatGPT在圖像識別和理解特定標準方面的局限性，使用時需謹慎。 PubMed DOI

原始文章

站上相關主題文章列表