原始文章

這篇論文探討了一種新方法,透過檢索增強生成(RAG)框架來評估教師與學生的模擬教學。傳統方法需教師直接參與,增加工作負擔,限制學生獨立練習。研究使用開源工具,如FastChat和Whisper,搭配本地大型語言模型(LLM)分析教學音頻。評估了三個7B參數的開源中文LLM,結果顯示internlm2模型在分析教學音頻及提供反饋方面表現優異。研究還對10名參賽者的模擬教學進行系統分析,並由專家手動評分,驗證系統有效性,顯示先進語言技術在教育評估中的潛力。 PubMed DOI


站上相關主題文章列表

這項研究探討了使用ChatGPT作為醫學教育中的標準化病人,特別是在病史採集方面。研究分為兩個階段:第一階段評估其可行性,模擬炎症性腸病的對話並將回應分為好、中、差三類。第二階段則評估其擬人化、臨床準確性和適應性,並調整提示以增強回應。 結果顯示,ChatGPT能有效區分不同質量的回應,經過修訂的提示使其準確性提高了4.926倍。整體而言,研究表明ChatGPT可作為模擬醫學評估的工具,並有潛力改善醫學訓練。 PubMed DOI

這項研究評估了多種大型語言模型(LLMs)在中國醫學教育CDLE考試中的表現。研究人員選擇並修訂了200道考題,並在三種情境下測試七個高效能的LLMs。結果顯示,Doubao-pro 32k和Qwen2-72b的準確性最高,分別達到81%和98%的最佳一致性比率。雖然模型之間的教學效果有顯著差異,但都能提供有效的教學內容。研究建議未來應進一步探討LLM輸出的可解釋性及減少醫學教育中不準確性的策略。 PubMed DOI

大型語言模型(LLMs)有潛力改變高中數學的教學方式。雖然大部分研究專注於輔導學生,但對於如何幫助教師的探討仍然不足。本研究提出利用LLMs增強教學計畫,透過模擬教師與學生的互動並生成教學反思,進而指導LLM改善教學計畫。人類評估顯示,這種方法顯著提升了LLM生成的教學計畫質量,與人類教師創建的計畫相當。這不僅幫助教師排練模擬,還提供了完善教學計畫的見解,展現了LLMs在教學準備中的實際應用。 PubMed DOI

這項研究分析了四種人工智慧大型語言模型(LLMs)對有學習障礙和沒有學習障礙學生的反饋、挫折感、同情心及未來失敗期望的評估。結果顯示,LLMs對有學習障礙的學生表現出較低的挫折感和較高的同情心,且對未來失敗的期望也低於實習教師。特別是ChatGPT4對兩組學生提供了更多正面反饋。整體而言,LLMs可能促進對有學習障礙學生的包容態度,但仍需調整以增強文化和情感的敏感性。 PubMed DOI

這份報告探討了使用大型語言模型(LLMs)進行教育情感分析的初步結果。我們分析了學生報告中的質性描述,以評估他們對學業表現的情感狀態和態度。情感分析揭示了學生參與度的重要見解,並指出需要改進的地方。研究顯示,LLMs能有效分析文本數據,提供比傳統方法更深入的情感理解,顯示出在改善教育評估和干預方面的潛力。 PubMed DOI

這項研究評估了全球大型語言模型(LLMs)和中文領域的LLMs在回答近視相關問題的表現。測試的模型包括ChatGPT-3.5、ChatGPT-4.0、Google Bard等,還有華佗GPT、MedGPT等中文模型。共評估39個問題,專家用3分制評分。結果顯示,ChatGPT-3.5、百度ERNIE 4.0和ChatGPT-4.0在準確性上表現最佳,且ChatGPT系列在全面性和同理心方面也表現不錯。整體來看,無論是全球還是中文模型,都能有效解決近視問題,特別是全球模型表現優異。 PubMed DOI

這篇研究發現,大型語言模型在製作日本放射技術師國考教材時,對文字題表現不錯,但計算題和影像判讀較弱。建議搭配程式工具解計算題,影像題則用關鍵字輔助。老師要主動監督和驗證內容。隨著LLM進步,教學方法也要跟著調整,才能確保非英語環境下的教學品質。 PubMed DOI

這項研究發現,大型語言模型(LLMs)在有明確、結構化提示下,能準確且一致地評分醫學生臨床紀錄,但如果只給簡單指示,結果會不穩定。LLM有時會算錯總分,需要外部協助。整體來說,經過優化後,LLM有潛力成為醫學教育自動評分工具,但針對更複雜的評分系統還需進一步研究。 PubMed DOI

本研究開發了一套結合語音辨識、NLP文本分析和唇部動作偵測的即時英語口說學習系統,能針對發音和流暢度給予個人化回饋。系統準確率高達97.5%,明顯優於現有模型,並具備即時回饋和強大處理口音變異的能力,大幅提升英語口說學習的效果與個人化體驗。 PubMed DOI

將專業知識整合進大型語言模型對醫學教育很有挑戰,尤其牙髓病學又需要文字和影像資源。一般LLM常缺乏臨床精確度和情境。研究團隊開發Endodontics-KB平台,結合實證文獻和操作影片,並用分層RAG架構。其聊天機器人EndoQ能用多模態資料進行臨床推理,專家評比在五大指標都勝過一般LLM,提升牙科教育,也可應用到其他醫學領域。 PubMed DOI