Fruits of the Professional Educator Appreciation and Recognition (PEAR) Awards: Learning what Students Value in Their Medical Educators.
專業教育者表揚與肯定（PEAR）獎項的成果：了解醫學生重視其醫學教育者的哪些特質 Med Sci Educ 2025-05-12

PEAR獎是由貝勒醫學院學生發起，專門表揚優秀的教育者，得獎者多為不同科別的近身師長。學生最重視老師的教學能力、親切態度和建設性回饋。得獎者普遍表示這個獎項帶來正面影響。這個低成本計畫不只突顯好老師的特質，也有助提升教育者的幸福感和教學動力。相關文章 PubMed DOI 推理

Can ChatGPT-4o Really Pass Medical Science Exams? A Pragmatic Analysis Using Novel Questions.
ChatGPT-4o 真的能通過醫學科學考試嗎？以新穎試題進行的實用性分析 Med Sci Educ 2025-05-12

ChatGPT-4o 在英美醫師執照考試表現亮眼，即使遇到全新題目也能高分，證明不是只靠背題庫。不過，遇到圖片型選項時表現就變差。這說明單靠出新題或圖片題，無法完全防堵 AI 作弊，還是得有嚴格監考和安全措施，才能確保考試公平。相關文章 PubMed DOI 推理

Large language models for intelligent RDF knowledge graph construction: results from medical ontology mapping.
用於智慧型 RDF 知識圖譜建構的大型語言模型：醫學本體映射的研究結果 Front Artif Intell 2025-05-12

這篇論文提出用大型語言模型（像 GPT-4o）自動化醫療術語對應 SNOMED CT 等本體，建立 RDF 知識圖譜。研究比較六種系統，發現 GPT-4o 等現代 LLMs 在準確度和語意理解上都比傳統方法好很多，能大幅提升醫療知識圖譜的準確性和資料整合效率。相關文章 PubMed DOI 推理

Advancing emergency upper extremity care: A pilot study of ChatGPT's potential role in diagnosing and managing hand and wrist trauma.
提升急診上肢照護：ChatGPT 在診斷與處理手部及腕部創傷潛在角色的初步研究 J Hand Microsurg 2025-05-12

這項研究發現，ChatGPT-4 在診斷和處理常見手部、手腕創傷時，表現和整形外科住院醫師差不多，甚至在急診處置上更優秀。AI 有潛力成為急診室醫師的好幫手，但還是建議當作輔助工具，不能完全取代專業醫師的判斷。相關文章 PubMed DOI 推理

A clinician-based comparative study of large language models in answering medical questions: the case of asthma.
以臨床醫師為基礎之大型語言模型在醫學問題回答上的比較研究：以氣喘為例 Front Pediatr 2025-05-12

這項研究比較四種大型語言模型在回答兒童氣喘問題時的表現，結果 GPT-4.0 最優，YouChat 最差，GPT-3.5 和 GPT-4.0 都比其他兩款好，但兩者差異不大。雖然這些模型能提供準確醫療資訊，醫師還是要批判性判斷，不能全然相信。未來隨技術進步，這些模型有望成為可靠的醫療工具。相關文章 PubMed DOI 推理

Safeguarding human values: rethinking US law for generative AI's societal impacts.
守護人類價值：重新思考美國法律以因應生成式AI的社會影響 AI Ethics 2025-05-12

美國現行法律無法有效處理生成式AI帶來的隱私、公平和福祉等風險，對AI公司責任的規範也不夠明確。作者建議建立新的「負責任AI法律框架」，納入基本價值觀、訂定安全標準，並針對AI特性設計專屬責任規則，以更主動地保障民眾權益。相關文章 PubMed DOI 推理

Chinese generative AI models (DeepSeek and Qwen) rival ChatGPT-4 in ophthalmology queries with excellent performance in Arabic and English.
中文生成式 AI 模型（DeepSeek 與 Qwen）在眼科問題中，以阿拉伯語和英語展現出色表現，媲美 ChatGPT-4。 Narra J 2025-05-12

這項研究發現，中國的生成式AI模型 Qwen-2.5 在回答眼科問題時，不論用英文還是阿拉伯文，表現都比 DeepSeek-R1 和 ChatGPT-40 更好。所有AI都展現出不錯的多語言能力，顛覆了AI只偏好英文的看法。中國AI在醫療諮詢領域已經能和 ChatGPT-40 一較高下，甚至更勝一籌。相關文章 PubMed DOI 推理

Confirming SPSS Results With ChatGPT-4 and o3-mini Models.
使用 ChatGPT-4 與 o3-mini 模型驗證 SPSS 結果 Cureus 2025-05-12

這項研究發現，ChatGPT-4 在基礎統計分析上表現接近 SPSS，但在進階統計（如 MANOVA）會出錯；而 ChatGPT o3-mini 在相關分析和多變量檢定時，結果常不準確或誇大。整體來說，AI 工具雖有潛力，但目前還無法完全取代傳統統計軟體，特別是在複雜分析上。相關文章 PubMed DOI 推理

Evaluating the reference accuracy of large language models in radiology: a comparative study across subspecialties.
放射科大型語言模型參考文獻準確性的評估：跨次專科的比較研究 Diagn Interv Radiol 2025-05-12

這項研究發現，Claude 3.5 Sonnet 在產生放射科參考文獻時最準確，正確率高達 80.8%，捏造比例僅 3.1%，明顯勝過其他模型。相較之下，ChatGPT 和 Google Gemini 1.5 Pro 的正確率較低，捏造比例甚至高達 60.6%。不同放射科次專科的正確率也有差異。整體來說，Claude 3.5 Sonnet 學術可靠度高，其他模型則有誤導風險，引用功能還需加強。相關文章 PubMed DOI 推理

Empowering Generalist Material Intelligence with Large Language Models.
以大型語言模型賦能通用材料智能 Adv Mater 2025-05-12

大型語言模型正帶動材料科學革新，讓自動化材料發現成真，像是資料擷取、性質預測都更有效率。不過，目前還有專業知識整合不夠、資源消耗大等問題。未來要加強LLM的適應性、效率和可信度，才能讓這些技術在實際應用上更可靠、更公平。相關文章 PubMed DOI 推理

LLM 相關三個月內文章 / 第 104 頁

可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

LLM 相關三個月內文章 / 第 104 頁

可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

可選擇其它分類: 一週新進文章腎臟科一般醫學 SGLT2i GLP1