Dedicated AI Expert System vs Generative AI With Large Language Model for Clinical Diagnoses.
專用 AI 專家系統與大型語言模型生成式 AI 在臨床診斷上的比較 JAMA Netw Open 2025-05-29

這項研究比較 ChatGPT-4、Gemini 1.5 和傳統診斷系統 DXplain，在36個臨床案例中測試有無檢驗數據的表現。沒檢驗數據時，DXplain雖然正確診斷次數較多，但差異不顯著。有檢驗數據後，三者表現都提升。研究建議結合 LLMs 的語言理解和 DDSS 的推理能力，有望提升診斷支援效果。相關文章 PubMed DOI 推理

GPT-4 versus human authors in clinically complex MCQ creation: A blinded analysis of item quality.
GPT-4 與人類作者在臨床複雜選擇題命題上的比較：題目品質的盲性分析 Med Teach 2025-05-29

研究發現，GPT-4產生的醫學選擇題品質大致接近專家水準，但錯誤率較高，像是答案標示錯或選項排列不當。雖然AI能寫出高品質題目，仍需專家審核把關，確保正確性與品質。相關文章 PubMed DOI 推理

From text to traits: exploring the role of large language models in plant breeding.
從文本到性狀：探討大型語言模型在植物育種中的角色 Front Plant Sci 2025-05-29

大型語言模型（LLMs）在自然語言處理很強，但在植物育種的應用還有很大發展空間。這篇綜述說明LLMs能協助分析複雜生物資料、預測重要性狀，並整合基因體和環境等多元資料，有助於提升基因發現和決策效率。文章也討論目前進展、挑戰及未來展望，期望推動永續農業與糧食安全。相關文章 PubMed DOI 推理

Using large language models to facilitate academic work in the psychological sciences.
運用大型語言模型促進心理科學的學術工作 Curr Psychol 2025-05-29

大型語言模型在心理科學等學術領域越來越重要，能協助教學、寫作和模擬人類行為。雖然帶來不少好處，但也有倫理和實務上的挑戰。這份摘要整理了最新進展、最佳做法，並提出未來發展方向，幫助學界更負責任且有效地運用LLMs。相關文章 PubMed DOI 推理

Validation of a Mobile App for Remote Autism Screening in Toddlers.
幼兒遠端自閉症篩檢行動應用程式之驗證 NEJM AI 2025-05-29

SenseToKnow 是一款手機 App，家長只要用手機或平板錄下小孩玩遊戲的影片，App 就能用 AI 技術分析行為，協助篩檢自閉症。研究顯示，這個方法準確度高，跟專業診斷差不多，有機會讓自閉症早期發現更普及，讓孩子能及早接受幫助。相關文章 PubMed DOI 推理

Enhancing treatment decision-making for low back pain: a novel framework integrating large language models with retrieval-augmented generation technology.
提升下背痛治療決策：結合大型語言模型與檢索增強生成技術的新穎架構 Front Med (Lausanne) 2025-05-29

這項研究打造了專為慢性下背痛設計的臨床決策支援系統，結合大型語言模型、RAG和LtM提示，讓AI更貼近專家思考。客製化的CLBP-GPT在準確性、相關性等表現都勝過現有主流模型，能提供更精確、完整的診斷與治療建議，有助提升患者的個人化照護品質。相關文章 PubMed DOI 推理

Comparison of medical history documentation efficiency and quality based on GPT-4o: a study on the comparison between residents and artificial intelligence.
基於 GPT-4o 的病史紀錄效率與品質比較：住院醫師與人工智慧之比較研究 Front Med (Lausanne) 2025-05-29

這項研究發現，ChatGPT-4o寫病史的品質跟住院醫師差不多，但速度快很多（只要40秒，醫師要15分鐘）。雖然AI有助提升效率和品質，但資料安全和隱私問題還沒解決，實際應用前還需要更多研究，特別是在複雜病例和不同臨床環境下的表現。相關文章 PubMed DOI 推理

Machine Learning Achieves Pathologist-Level Coeliac Disease Diagnosis.
機器學習達到病理醫師水準的Coeliac Disease診斷 NEJM AI 2025-05-29

研究團隊開發出一套機器學習模型，能透過十二指腸切片影像診斷乳糜瀉。這個模型在超過3,000張切片訓練，測試時準確率、敏感度和特異性都超過95%，AUC更高於99%，表現媲美專家病理醫師。未來有望大幅提升臨床診斷乳糜瀉的效率與速度。相關文章 PubMed DOI 推理

Performance evaluation of large language models for the national nursing examination in Japan.
日本國家護理考試中大型語言模型的表現評估 Digit Health 2025-05-29

這項研究發現，ChatGPT-4 和 Copilot 在日本護理師國考題目上表現及格，ChatGPT-3.5 則沒過關。三款模型在涉及日本特有法律和社會保障制度的題目上表現最差，顯示需要在地知識時，LLMs 容易出錯。整體來說，較新版本的 LLMs 準確度較高。相關文章 PubMed DOI 推理

Leveraging Large Language Models to Enhance Patient Educational Resources in Rhinology.
運用大型語言模型提升鼻科病患教育資源 Ann Otol Rhinol Laryngol 2025-05-29

這項研究發現，美國鼻科醫學會的衛教資料平均需要10年級閱讀程度，但用ChatGPT、Gemini和Copilot等AI重寫後，平均只要8.6年級，Gemini甚至只要7.5年級。AI能讓醫療資訊更容易理解，但內容還是要由醫師和病患一起確認。相關文章 PubMed DOI 推理

LLM 相關三個月內文章 / 第 62 頁

可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

LLM 相關三個月內文章 / 第 62 頁

可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

可選擇其它分類: 一週新進文章腎臟科一般醫學 SGLT2i GLP1