Application of Large Language Models in Medical Training Evaluation-Using ChatGPT as a Standardized Patient: Multimetric Assessment.
大型語言模型在醫學訓練評估中的應用 - 使用 ChatGPT 作為標準化病人：多指標評估。 J Med Internet Res 2025-01-01

這項研究探討了使用ChatGPT作為醫學教育中的標準化病人，特別是在病史採集方面。研究分為兩個階段：第一階段評估其可行性，模擬炎症性腸病的對話並將回應分為好、中、差三類。第二階段則評估其擬人化、臨床準確性和適應性，並調整提示以增強回應。結果顯示，ChatGPT能有效區分不同質量的回應，經過修訂的提示使其準確性提高了4.926倍。整體而言，研究表明ChatGPT可作為模擬醫學評估的工具，並有潛力改善醫學訓練。 PubMed DOI

Evaluating the Performance of Large Language Models (LLMs) in Answering and Analysing the Chinese Dental Licensing Examination.
評估大型語言模型 (LLMs) 在回答和分析中國牙科執照考試中的表現。 Eur J Dent Educ 2025-01-31

這項研究評估了多種大型語言模型（LLMs）在中國醫學教育CDLE考試中的表現。研究人員選擇並修訂了200道考題，並在三種情境下測試七個高效能的LLMs。結果顯示，Doubao-pro 32k和Qwen2-72b的準確性最高，分別達到81%和98%的最佳一致性比率。雖然模型之間的教學效果有顯著差異，但都能提供有效的教學內容。研究建議未來應進一步探討LLM輸出的可解釋性及減少醫學教育中不準確性的策略。 PubMed DOI

Exploring the potential of LLM to enhance teaching plans through teaching simulation.
探索大型語言模型 (LLM) 在教學模擬中增強教學計劃的潛力。 NPJ Sci Learn 2025-02-05

大型語言模型（LLMs）有潛力改變高中數學的教學方式。雖然大部分研究專注於輔導學生，但對於如何幫助教師的探討仍然不足。本研究提出利用LLMs增強教學計畫，透過模擬教師與學生的互動並生成教學反思，進而指導LLM改善教學計畫。人類評估顯示，這種方法顯著提升了LLM生成的教學計畫質量，與人類教師創建的計畫相當。這不僅幫助教師排練模擬，還提供了完善教學計畫的見解，展現了LLMs在教學準備中的實際應用。 PubMed DOI

Attributional patterns toward students with and without learning disabilities: Artificial intelligence models vs. trainee teachers.
對於有學習障礙與沒有學習障礙學生的歸因模式：人工智慧模型與實習教師的比較。 Res Dev Disabil 2025-03-16

這項研究分析了四種人工智慧大型語言模型（LLMs）對有學習障礙和沒有學習障礙學生的反饋、挫折感、同情心及未來失敗期望的評估。結果顯示，LLMs對有學習障礙的學生表現出較低的挫折感和較高的同情心，且對未來失敗的期望也低於實習教師。特別是ChatGPT4對兩組學生提供了更多正面反饋。整體而言，LLMs可能促進對有學習障礙學生的包容態度，但仍需調整以增強文化和情感的敏感性。 PubMed DOI

Leveraging Large Language Models for Sentiment Analysis in Educational Contexts.
在教育環境中利用大型語言模型進行情感分析。 Stud Health Technol Inform 2025-04-09

這份報告探討了使用大型語言模型（LLMs）進行教育情感分析的初步結果。我們分析了學生報告中的質性描述，以評估他們對學業表現的情感狀態和態度。情感分析揭示了學生參與度的重要見解，並指出需要改進的地方。研究顯示，LLMs能有效分析文本數據，提供比傳統方法更深入的情感理解，顯示出在改善教育評估和干預方面的潛力。 PubMed DOI

Comparative performance analysis of global and chinese-domain large language models for myopia.
全球與中國域大型語言模型在近視方面的比較性能分析。 Eye (Lond) 2025-04-13

這項研究評估了全球大型語言模型（LLMs）和中文領域的LLMs在回答近視相關問題的表現。測試的模型包括ChatGPT-3.5、ChatGPT-4.0、Google Bard等，還有華佗GPT、MedGPT等中文模型。共評估39個問題，專家用3分制評分。結果顯示，ChatGPT-3.5、百度ERNIE 4.0和ChatGPT-4.0在準確性上表現最佳，且ChatGPT系列在全面性和同理心方面也表現不錯。整體來看，無論是全球還是中文模型，都能有效解決近視問題，特別是全球模型表現優異。 PubMed DOI

Pilot Study on Using Large Language Models for Educational Resource Development in Japanese Radiological Technologist Exams.
用於日本放射技師考試教育資源開發之大型語言模型的初步研究 Med Sci Educ 2025-05-12

這篇研究發現，大型語言模型在製作日本放射技術師國考教材時，對文字題表現不錯，但計算題和影像判讀較弱。建議搭配程式工具解計算題，影像題則用關鍵字輔助。老師要主動監督和驗證內容。隨著LLM進步，教學方法也要跟著調整，才能確保非英語環境下的教學品質。 PubMed DOI

Using large language models (LLMs) to apply analytic rubrics to score post-encounter notes.
使用大型語言模型（LLMs）應用分析性評分規準於後診紀錄評分 Med Teach 2025-05-17

這項研究發現，大型語言模型（LLMs）在有明確、結構化提示下，能準確且一致地評分醫學生臨床紀錄，但如果只給簡單指示，結果會不穩定。LLM有時會算錯總分，需要外部協助。整體來說，經過優化後，LLM有潛力成為醫學教育自動評分工具，但針對更複雜的評分系統還需進一步研究。 PubMed DOI

Bridging language gaps: The role of NLP and speech recognition in oral english instruction.
跨越語言鴻溝：NLP 與語音辨識在英語口說教學中的角色 MethodsX 2025-06-06

本研究開發了一套結合語音辨識、NLP文本分析和唇部動作偵測的即時英語口說學習系統，能針對發音和流暢度給予個人化回饋。系統準確率高達97.5%，明顯優於現有模型，並具備即時回饋和強大處理口音變異的能力，大幅提升英語口說學習的效果與個人化體驗。 PubMed DOI

Development and evaluation of a retrieval-augmented large language model framework for enhancing endodontic education.
用於提升牙髓病學教育的檢索增強大型語言模型架構之開發與評估 Int J Med Inform 2025-06-06

將專業知識整合進大型語言模型對醫學教育很有挑戰，尤其牙髓病學又需要文字和影像資源。一般LLM常缺乏臨床精確度和情境。研究團隊開發Endodontics-KB平台，結合實證文獻和操作影片，並用分層RAG架構。其聊天機器人EndoQ能用多模態資料進行臨床推理，專家評比在五大指標都勝過一般LLM，提升牙科教育，也可應用到其他醫學領域。 PubMed DOI

原始文章

站上相關主題文章列表