TurkMedNLI: a Turkish medical natural language inference dataset through large language model based translation.
TurkMedNLI：通過大型語言模型翻譯的土耳其醫學自然語言推斷數據集。 PeerJ Comput Sci 2025-03-10

這項研究探討了為低資源語言（特別是土耳其語）建立自然語言推理（NLI）數據集的挑戰，透過翻譯醫學NLI數據集來進行。研究中微調了Llama-3.1模型以處理醫學縮寫，並使用Facebook的No Language Left Behind (NLLB)模型進行翻譯。評估結果顯示，BERTurk在測試數據上達到75.17%準確率，BioBERTurk則為75.59%。醫學專家驗證翻譯，強調大型語言模型在適應專業數據集方面的潛力，為未來多語言生物醫學自然語言處理研究鋪路。 PubMed DOI

Leveraging large language models to mimic domain expert labeling in unstructured text-based electronic healthcare records in non-english languages.
利用大型語言模型模擬非英語語言中無結構文本電子健康紀錄的領域專家標註。 BMC Med Inform Decis Mak 2025-04-01

大數據與人工智慧在醫療保健中結合，特別是透過電子健康紀錄（EHR）的分析，能顯著提升診斷準確性。然而，處理大量非結構化數據是一大挑戰。本研究探討大型語言模型（LLMs）在分類含排版錯誤的EHR文本的有效性。研究以哈哲特佩大學的兒科急診室數據為例，經微調的GPT-3模型在識別呼吸道感染病例上達到99.88%準確率，顯著優於預訓練模型的78.54%。結果顯示，微調的LLMs能高效分類非結構化EHR數據，提升醫療數據處理的效率與可靠性。 PubMed DOI

An LLM-based hybrid approach for enhanced automated essay scoring.
基於LLM的混合式方法以提升自動作文評分效能 Sci Rep 2025-04-25

傳統自動作文評分系統只看單字和句子，無法掌握文章結構和語意。我們提出結合多層次語言特徵的混合模型，利用大型語言模型提升作文連貫性和品質評估。實驗證明，我們的方法比現有技術更準確，有助提升學生寫作評量的公正性與精確度。 PubMed DOI

The role of artificial intelligence in medical education: an evaluation of Large Language Models (LLMs) on the Turkish Medical Specialty Training Entrance Exam.
人工智慧在醫學教育中的角色：大型語言模型（LLMs）於土耳其醫學專科訓練入學考試的評估 BMC Med Educ 2025-04-25

研究比較四款大型語言模型在2021年土耳其醫學專科考試的表現，ChatGPT 4正確率最高（88.75%），Llama 3 70B（79.17%）、Gemini 1.5 Pro（78.13%）次之，Command R+僅50%。ChatGPT 4在基礎和臨床醫學題目都很強，顯示它和Llama 3 70B有潛力協助土耳其語醫學教育與臨床應用，其他兩款則還需加強。 PubMed DOI

An Evaluation of Large Language Models for Supplementing a Food Extrusion Dataset.
用於補充食品擠壓數據集之大型語言模型的評估 Foods 2025-04-26

目前食品擠壓研究缺乏標準化資料集，影響進展。作者建立人工整理的資料集，並測試大型語言模型（LLMs）自動擷取文獻資料的能力。結果發現，LLMs 雖然偶有錯誤或遺漏，但能大幅減少人工整理時間，是輔助建立資料集、加速研究的有力工具。 PubMed DOI

Generative Large Language Models Trained for Detecting Errors in Radiology Reports.
用於偵測放射科報告錯誤的生成式大型語言模型 Radiology 2025-05-20

這項研究比較多種大型語言模型在偵測胸腔放射科報告錯誤的表現，發現經過微調的 Llama-3-70B-Instruct 模型最準確，F1 分數約 0.75–0.83。實測也證實，這模型能有效協助醫師找出報告錯誤，顯示微調後的生成式語言模型有助提升放射科報告校對效率與準確度。 PubMed DOI

Large Language Models Struggle in Token-Level Clinical Named Entity Recognition.
大型語言模型在臨床命名實體識別的詞元層級表現不佳 AMIA Annu Symp Proc 2025-05-26

這篇研究比較專有和開源大型語言模型在臨床文本中做 token-level 罕見疾病命名實體識別的表現。研究發現，雖然用了多種技術，LLMs 在這類任務上還是有不少困難，並針對醫療應用提出改進建議。 PubMed

Native language identification from text using a fine-tuned GPT-2 model.
使用微調 GPT-2 模型進行文本母語識別 PeerJ Comput Sci 2025-06-26

這項研究用GPT-2模型微調葡萄牙語學習者的文本來辨識母語，準確率高達94.65%，比傳統和其他transformer模型更優秀。結果證明大型transformer模型在母語辨識上很有效，對個人化語言學習和AI教育應用有很大幫助。 PubMed DOI

Tibyan corpus: balanced and comprehensive error coverage corpus using ChatGPT for Arabic grammatical error correction.
Tibyan 語料庫：使用 ChatGPT 進行阿拉伯語文法錯誤修正的平衡且全面錯誤覆蓋語料庫 PeerJ Comput Sci 2025-06-26

這項研究針對阿拉伯語文法錯誤修正資源不足的問題，建立了全新的Tibyan語料庫。研究團隊用ChatGPT自動產生有錯和正確的句子對，再由語言專家審查修正，確保品質。Tibyan語料庫約有60萬詞元，涵蓋七種錯誤類型，對阿拉伯語GEC研究很有幫助。 PubMed DOI

Designing AI-powered translation education tools: a framework for parallel sentence generation using SauLTC and LLMs.
AI 驅動翻譯教育工具的設計：結合 SauLTC 與 LLMs 進行平行句生成的框架 PeerJ Comput Sci 2025-06-26

翻譯教學很花時間，但AI工具能自動化重複工作。現在缺乏阿拉伯語相關資料集，這項研究用GPT把SauLTC轉成平行語料庫，方便教學。用餘弦相似度和人工評估檢查品質，發現LaBSE加GPT的組合相似度最高，達85.2%，顯示AI很有潛力協助翻譯教學資源建置。 PubMed DOI

原始文章

站上相關主題文章列表