原始文章

這篇研究針對土耳其語拼字校正,建立了新資料集NoisyWikiTr,並比較BERT編碼器和T5編碼器-解碼器模型。結果顯示,能理解語境、針對語言設計的序列到序列模型,修正真實土耳其語拼字錯誤的效果,比傳統工具和一般模型都更好。 PubMed DOI


站上相關主題文章列表

這項研究探討了為低資源語言(特別是土耳其語)建立自然語言推理(NLI)數據集的挑戰,透過翻譯醫學NLI數據集來進行。研究中微調了Llama-3.1模型以處理醫學縮寫,並使用Facebook的No Language Left Behind (NLLB)模型進行翻譯。評估結果顯示,BERTurk在測試數據上達到75.17%準確率,BioBERTurk則為75.59%。醫學專家驗證翻譯,強調大型語言模型在適應專業數據集方面的潛力,為未來多語言生物醫學自然語言處理研究鋪路。 PubMed DOI

大數據與人工智慧在醫療保健中結合,特別是透過電子健康紀錄(EHR)的分析,能顯著提升診斷準確性。然而,處理大量非結構化數據是一大挑戰。本研究探討大型語言模型(LLMs)在分類含排版錯誤的EHR文本的有效性。研究以哈哲特佩大學的兒科急診室數據為例,經微調的GPT-3模型在識別呼吸道感染病例上達到99.88%準確率,顯著優於預訓練模型的78.54%。結果顯示,微調的LLMs能高效分類非結構化EHR數據,提升醫療數據處理的效率與可靠性。 PubMed DOI

傳統自動作文評分系統只看單字和句子,無法掌握文章結構和語意。我們提出結合多層次語言特徵的混合模型,利用大型語言模型提升作文連貫性和品質評估。實驗證明,我們的方法比現有技術更準確,有助提升學生寫作評量的公正性與精確度。 PubMed DOI

研究比較四款大型語言模型在2021年土耳其醫學專科考試的表現,ChatGPT 4正確率最高(88.75%),Llama 3 70B(79.17%)、Gemini 1.5 Pro(78.13%)次之,Command R+僅50%。ChatGPT 4在基礎和臨床醫學題目都很強,顯示它和Llama 3 70B有潛力協助土耳其語醫學教育與臨床應用,其他兩款則還需加強。 PubMed DOI

目前食品擠壓研究缺乏標準化資料集,影響進展。作者建立人工整理的資料集,並測試大型語言模型(LLMs)自動擷取文獻資料的能力。結果發現,LLMs 雖然偶有錯誤或遺漏,但能大幅減少人工整理時間,是輔助建立資料集、加速研究的有力工具。 PubMed DOI

這項研究比較多種大型語言模型在偵測胸腔放射科報告錯誤的表現,發現經過微調的 Llama-3-70B-Instruct 模型最準確,F1 分數約 0.75–0.83。實測也證實,這模型能有效協助醫師找出報告錯誤,顯示微調後的生成式語言模型有助提升放射科報告校對效率與準確度。 PubMed DOI

這篇研究比較專有和開源大型語言模型在臨床文本中做 token-level 罕見疾病命名實體識別的表現。研究發現,雖然用了多種技術,LLMs 在這類任務上還是有不少困難,並針對醫療應用提出改進建議。 PubMed

這項研究用GPT-2模型微調葡萄牙語學習者的文本來辨識母語,準確率高達94.65%,比傳統和其他transformer模型更優秀。結果證明大型transformer模型在母語辨識上很有效,對個人化語言學習和AI教育應用有很大幫助。 PubMed DOI

這項研究針對阿拉伯語文法錯誤修正資源不足的問題,建立了全新的Tibyan語料庫。研究團隊用ChatGPT自動產生有錯和正確的句子對,再由語言專家審查修正,確保品質。Tibyan語料庫約有60萬詞元,涵蓋七種錯誤類型,對阿拉伯語GEC研究很有幫助。 PubMed DOI

翻譯教學很花時間,但AI工具能自動化重複工作。現在缺乏阿拉伯語相關資料集,這項研究用GPT把SauLTC轉成平行語料庫,方便教學。用餘弦相似度和人工評估檢查品質,發現LaBSE加GPT的組合相似度最高,達85.2%,顯示AI很有潛力協助翻譯教學資源建置。 PubMed DOI