原始文章

翻譯教學很花時間,但AI工具能自動化重複工作。現在缺乏阿拉伯語相關資料集,這項研究用GPT把SauLTC轉成平行語料庫,方便教學。用餘弦相似度和人工評估檢查品質,發現LaBSE加GPT的組合相似度最高,達85.2%,顯示AI很有潛力協助翻譯教學資源建置。 PubMed DOI


站上相關主題文章列表

這項研究探討了人工智慧,特別是ChatGPT,在心理語言學研究中生成句子刺激的應用,涵蓋英語和阿拉伯語的書面及聽覺句子。透過三個實驗評估AI生成句子的可接受性與有效性。結果顯示,英語的AI句子可接受性與人類創作相當,但阿拉伯語的AI句子評價較低。有效性方面,只有實驗2顯示出預期效果。整體來看,研究指出AI在心理語言學研究中可成為開發刺激的有用工具,提升研究的多樣性與效率,並對未來研究提供啟示。 PubMed DOI

這項研究探討大型語言模型(LLMs)在為癌症倖存者及其照顧者創建教育材料的有效性,特別針對弱勢群體。研究比較了三個模型(GPT-3.5 Turbo、GPT-4 和 GPT-4 Turbo)在生成30個癌症護理主題內容的表現,目標是達到六年級的閱讀水平,並提供西班牙語和中文翻譯。 主要發現包括:LLMs整體表現良好,74.2%符合字數限制,平均質量分數為8.933,但只有41.1%達到所需閱讀水平。翻譯準確率高,西班牙語96.7%、中文81.1%。常見問題有範圍模糊和缺乏可行建議。GPT-4表現優於GPT-3.5 Turbo,使用項目符號提示效果更佳。 結論指出,LLMs在創建可及的教育資源方面潛力大,但需改善閱讀水平和內容全面性,未來研究應結合專家意見和更好數據以提升有效性。 PubMed DOI

這項研究發現,AI聊天機器人產生的科學白話摘要比人類寫的更容易懂,對教育程度較低的人特別有幫助,品質也差不多。研究人員,尤其是非英語母語者,可以用AI來寫PLS,但還是要記得檢查內容有沒有錯。 PubMed DOI

傳統自動作文評分系統只看單字和句子,無法掌握文章結構和語意。我們提出結合多層次語言特徵的混合模型,利用大型語言模型提升作文連貫性和品質評估。實驗證明,我們的方法比現有技術更準確,有助提升學生寫作評量的公正性與精確度。 PubMed DOI

這項研究發現,ChatGPT-4o在阿拉伯語翻譯後編輯上效率高、流暢度也不輸專業人類,但遇到複雜語法、成語或專業術語時表現較弱。整體來說,ChatGPT-4o能提升翻譯生產力,是輔助人類翻譯者的好幫手。 PubMed DOI

這項歐盟 Interact-Europe 計畫,針對腫瘤學教育教材,開發並評估專為醫學領域設計的語音和機器翻譯系統,把英文訓練影片翻成法文、西班牙文、德文和斯洛維尼亞文。研究比較三種醫療機器翻譯模型,發現大型語言模型(LLMs)翻譯品質可比傳統系統。團隊也公開一個大型腫瘤學訓練影片資料集供大家研究。 PubMed DOI

這項研究用GPT-4分析國中數學課的逐字稿,發現課堂互動的語意內容能解釋約20%教學品質評分的差異。研究團隊找出五種和教學品質有關的語意模式,像是認知參與和課堂對話。結果顯示,AI分析課堂內容有助於了解有效教學的關鍵。 PubMed DOI

這篇研究發現,大型語言模型在沒經過特別訓練下,結合檢索增強生成(RAG)和提示工程,能有效自動摘要專業資訊,表現不錯。不過,還是會遇到像網頁爬蟲限制和偶爾誤解任務等問題,未來還需要進一步優化。 PubMed

這項研究用GPT-2模型微調葡萄牙語學習者的文本來辨識母語,準確率高達94.65%,比傳統和其他transformer模型更優秀。結果證明大型transformer模型在母語辨識上很有效,對個人化語言學習和AI教育應用有很大幫助。 PubMed DOI

這篇研究提出AraSum,一款專為阿拉伯語醫療摘要打造的輕量AI模型。AraSum運用知識蒸餾和合成醫療對話資料,不僅在自動評分和人工評估上都勝過大型模型JAIS-30B,還能大幅降低運算資源需求。證明小型高效模型也能有效支援資源較少語言的醫療應用,推動AI更永續與公平發展。 PubMed DOI