原始文章

BegoniaGPT 是專為國小到高中英語教學打造的 AI,聚焦英語知識和教學需求,並用專業資料集訓練。它能針對學生、老師、家長提供精準又有同理心的教學和情感支持,表現比 10 款主流 LLM 更優異,經自動和專家評估認證。 PubMed DOI


站上相關主題文章列表

這篇文章探討大型語言模型(LLMs)在教育中的角色,指出其潛在好處與挑戰。雖然LLMs能生成超越人類的文本,但在教育中使用時需謹慎,因為可能存在透明度不足和偏見等問題。文章建議將專家資源如OpenLogos整合進語言生成工具,並強調制定清晰的指導方針和倫理標準的重要性。Multi3Generation COST Action(CA18231)被視為推動自然語言生成研究的關鍵倡議,呼籲教育工作者接受創新工具,增強學習環境,同時兼顧傳統教育價值。 PubMed DOI

生成式人工智慧,特別是大型語言模型(LLMs),在兒科教育和訓練上有很大潛力。這些模型能幫助教育者改善課程設計、制定個性化學習計畫,並提供即時反饋,還能協助醫生簡化資訊搜尋,提升診所效率。不過,LLMs也可能產生不準確資訊,並引發偏見和倫理問題。因此,專業人士需謹慎使用並審查其輸出。為確保安全有效的應用,相關方應建立明確的指導方針和政策。本文探討了LLMs在兒科教育中的歷史、應用及挑戰。 PubMed DOI

這項研究探討了訓練大型語言模型(LLMs)來根據美國住院醫師教育認證委員會(ACGME)的標準分類受訓者的反饋。研究發現,雖然複雜的模型未必能提高分類準確率,但較小的模型如BERT-mini在性能上與FastText相當,且在個人設備上部署時更具優勢,能提升速度和數據隱私。這項研究有助於理解如何有效整合LLMs於醫學教育中。 PubMed DOI

這項研究探討大型語言模型(LLMs),特別是GPT-4,如何應用於分析課堂對話,以評估教學品質和診斷教育需求。傳統質性分析方法耗時且需專業知識,研究旨在確認LLMs是否能簡化此過程。研究使用中學數學和中文課的數據,將專家手動編碼的結果與GPT-4生成的結果進行比較。結果顯示,GPT-4能顯著節省時間,且編碼一致性高,顯示LLMs在教學評估和教育改進上具潛力。 PubMed DOI

近年來,大型語言模型(LLMs)在教育領域的應用越來越普遍,然而創建個性化學習環境仍面臨挑戰。文章提到三大挑戰:首先是可解釋性,需增強對LLMs如何理解學習者的認識;其次是適應性,需開發技術提供個性化教學支持;最後是創作與評估,需建立基於LLM的教育代理。克服這些挑戰將有助於打造更符合學生需求的AI輔導員,進而提升學習成效。 PubMed DOI

在數位時代,確保兒童接觸適合他們發展的內容非常重要。隨著自動化文本生成技術的進步,對於有效過濾和分類兒童內容的需求也在增加。本研究透過微調語言模型Mistral和Zephyr,並使用BERT分類器來評估兒童故事的適宜性。結果顯示,微調後的模型在生成內容上達到了更高的評分,且BERT分類器在識別不當內容方面表現優異。這項研究對教育科技和家長控制系統具有重要意義,提供了一種確保兒童接觸安全且啟發性內容的方法。 PubMed DOI

大型語言模型(LLMs)有潛力改變高中數學的教學方式。雖然大部分研究專注於輔導學生,但對於如何幫助教師的探討仍然不足。本研究提出利用LLMs增強教學計畫,透過模擬教師與學生的互動並生成教學反思,進而指導LLM改善教學計畫。人類評估顯示,這種方法顯著提升了LLM生成的教學計畫質量,與人類教師創建的計畫相當。這不僅幫助教師排練模擬,還提供了完善教學計畫的見解,展現了LLMs在教學準備中的實際應用。 PubMed DOI

這項研究探討大型語言模型(LLMs)在為癌症倖存者及其照顧者創建教育材料的有效性,特別針對弱勢群體。研究比較了三個模型(GPT-3.5 Turbo、GPT-4 和 GPT-4 Turbo)在生成30個癌症護理主題內容的表現,目標是達到六年級的閱讀水平,並提供西班牙語和中文翻譯。 主要發現包括:LLMs整體表現良好,74.2%符合字數限制,平均質量分數為8.933,但只有41.1%達到所需閱讀水平。翻譯準確率高,西班牙語96.7%、中文81.1%。常見問題有範圍模糊和缺乏可行建議。GPT-4表現優於GPT-3.5 Turbo,使用項目符號提示效果更佳。 結論指出,LLMs在創建可及的教育資源方面潛力大,但需改善閱讀水平和內容全面性,未來研究應結合專家意見和更好數據以提升有效性。 PubMed DOI

這項研究比較 ChatGPT-3.5、ChatGPT-4o 和 Google Gemini 在製作兒童近視衛教資料的表現。結果發現,三款 AI 都能產出正確、易懂的內容,但只有 ChatGPT-3.5 和 4o 能穩定達到國小六年級的閱讀程度。ChatGPT-4o 在內容品質和易讀性上表現最好,但三者都缺乏高度可執行的建議。整體來說,ChatGPT-4o 最有潛力用來優化兒童近視衛教資料。 PubMed DOI

這項研究用GPT-4分析國中數學課的逐字稿,發現課堂互動的語意內容能解釋約20%教學品質評分的差異。研究團隊找出五種和教學品質有關的語意模式,像是認知參與和課堂對話。結果顯示,AI分析課堂內容有助於了解有效教學的關鍵。 PubMed DOI