Fine-Tuning Large Language Models to Enhance Programmatic Assessment in Graduate Medical Education.
微調大型語言模型以增強研究生醫學教育中的程式性評估。 J Educ Perioper Med 2024-10-02

這項研究探討了訓練大型語言模型（LLMs）來根據美國住院醫師教育認證委員會（ACGME）的標準分類受訓者的反饋。研究發現，雖然複雜的模型未必能提高分類準確率，但較小的模型如BERT-mini在性能上與FastText相當，且在個人設備上部署時更具優勢，能提升速度和數據隱私。這項研究有助於理解如何有效整合LLMs於醫學教育中。 PubMed DOI

Contextual Fine-Tuning of Language Models with Classifier-Driven Content Moderation for Text Generation.
以分類器驅動的內容審核進行語言模型的上下文微調以生成文本。 Entropy (Basel) 2025-01-08

在數位時代，確保兒童接觸適合他們發展的內容非常重要。隨著自動化文本生成技術的進步，對於有效過濾和分類兒童內容的需求也在增加。本研究透過微調語言模型Mistral和Zephyr，並使用BERT分類器來評估兒童故事的適宜性。結果顯示，微調後的模型在生成內容上達到了更高的評分，且BERT分類器在識別不當內容方面表現優異。這項研究對教育科技和家長控制系統具有重要意義，提供了一種確保兒童接觸安全且啟發性內容的方法。 PubMed DOI

Exploring the potential of LLM to enhance teaching plans through teaching simulation.
探索大型語言模型 (LLM) 在教學模擬中增強教學計劃的潛力。 NPJ Sci Learn 2025-02-05

大型語言模型（LLMs）有潛力改變高中數學的教學方式。雖然大部分研究專注於輔導學生，但對於如何幫助教師的探討仍然不足。本研究提出利用LLMs增強教學計畫，透過模擬教師與學生的互動並生成教學反思，進而指導LLM改善教學計畫。人類評估顯示，這種方法顯著提升了LLM生成的教學計畫質量，與人類教師創建的計畫相當。這不僅幫助教師排練模擬，還提供了完善教學計畫的見解，展現了LLMs在教學準備中的實際應用。 PubMed DOI

Behavioral Dynamics Analysis in Language Education: Generative State Transitions and Attention Mechanisms.
語言教育中的行為動態分析：生成狀態轉換與注意機制。 Behav Sci (Basel) 2025-03-28

這項研究提出了一種新方法，結合生成注意力機制與狀態轉換方程，分析中文教育中的學習行為。這種方法能即時調整注意力權重，模擬學生情感與行為變化，克服現有方法的限制。透過實證實驗，預測行為準確率達90.6%，學習滿意度得分89.2，超越BERT、GPT-3等基準模型。這些結果顯示該方法在個性化教學與動態行為建模上的實用性，為中文教育提供了結構化框架。 PubMed DOI

Evaluation of Large Language Models in Tailoring Educational Content for Cancer Survivors and Their Caregivers: Quality Analysis.
大型語言模型在為癌症倖存者及其照顧者量身定制教育內容中的評估：質量分析。 JMIR Cancer 2025-04-07

這項研究探討大型語言模型（LLMs）在為癌症倖存者及其照顧者創建教育材料的有效性，特別針對弱勢群體。研究比較了三個模型（GPT-3.5 Turbo、GPT-4 和 GPT-4 Turbo）在生成30個癌症護理主題內容的表現，目標是達到六年級的閱讀水平，並提供西班牙語和中文翻譯。主要發現包括：LLMs整體表現良好，74.2%符合字數限制，平均質量分數為8.933，但只有41.1%達到所需閱讀水平。翻譯準確率高，西班牙語96.7%、中文81.1%。常見問題有範圍模糊和缺乏可行建議。GPT-4表現優於GPT-3.5 Turbo，使用項目符號提示效果更佳。結論指出，LLMs在創建可及的教育資源方面潛力大，但需改善閱讀水平和內容全面性，未來研究應結合專家意見和更好數據以提升有效性。 PubMed DOI

Large Language Models: Pioneering New Educational Frontiers in Childhood Myopia.
大型語言模型：開創兒童近視教育新前沿 Ophthalmol Ther 2025-04-21

這項研究比較 ChatGPT-3.5、ChatGPT-4o 和 Google Gemini 在製作兒童近視衛教資料的表現。結果發現，三款 AI 都能產出正確、易懂的內容，但只有 ChatGPT-3.5 和 4o 能穩定達到國小六年級的閱讀程度。ChatGPT-4o 在內容品質和易讀性上表現最好，但三者都缺乏高度可執行的建議。整體來說，ChatGPT-4o 最有潛力用來優化兒童近視衛教資料。 PubMed DOI

An LLM-based hybrid approach for enhanced automated essay scoring.
基於LLM的混合式方法以提升自動作文評分效能 Sci Rep 2025-04-25

傳統自動作文評分系統只看單字和句子，無法掌握文章結構和語意。我們提出結合多層次語言特徵的混合模型，利用大型語言模型提升作文連貫性和品質評估。實驗證明，我們的方法比現有技術更準確，有助提升學生寫作評量的公正性與精確度。 PubMed DOI

Revealing teaching quality through lesson semantics: A GPT-assisted analysis of transcripts.
透過課程語意揭示教學品質：GPT 協助的課堂逐字稿分析 Br J Educ Psychol 2025-06-11

這項研究用GPT-4分析國中數學課的逐字稿，發現課堂互動的語意內容能解釋約20%教學品質評分的差異。研究團隊找出五種和教學品質有關的語意模式，像是認知參與和課堂對話。結果顯示，AI分析課堂內容有助於了解有效教學的關鍵。 PubMed DOI

Designing AI-powered translation education tools: a framework for parallel sentence generation using SauLTC and LLMs.
AI 驅動翻譯教育工具的設計：結合 SauLTC 與 LLMs 進行平行句生成的框架 PeerJ Comput Sci 2025-06-26

翻譯教學很花時間，但AI工具能自動化重複工作。現在缺乏阿拉伯語相關資料集，這項研究用GPT把SauLTC轉成平行語料庫，方便教學。用餘弦相似度和人工評估檢查品質，發現LaBSE加GPT的組合相似度最高，達85.2%，顯示AI很有潛力協助翻譯教學資源建置。 PubMed DOI

Implementing Generative AI to Enhance Patient Education on Retinopathy of Prematurity.
運用生成式 AI 提升早產兒視網膜病變患者教育 J Pediatr Ophthalmol Strabismus 2025-06-26

這項研究比較ChatGPT-3.5、ChatGPT-4和Gemini在產生早產兒視網膜病變衛教資料的表現。三款AI都能產出正確、易懂的內容，但ChatGPT-4在將資料改寫成國中一年級程度時，品質和可靠性最好。整體來說，ChatGPT-4特別適合協助家長取得高品質、易讀的衛教資訊。 PubMed DOI

原始文章

站上相關主題文章列表