LLM 相關三個月內文章 / 第 41 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

「MathOdyssey」是一套全新、由專家整理的數學題庫,收錄387題高中到奧林匹亞等級的挑戰題,附詳細解答。這資料集專為測試大型語言模型的數學推理能力設計,內容標準化且經同儕審查。作者也公開評估多個LLM的表現,並釋出資料集,促進數學AI研究發展。 相關文章 PubMed DOI 推理

這項研究比較三款大型語言模型在小兒外科考試的表現,結果 DeepSeek(2025年版)正確率高達85%,明顯勝過 Copilot(55.4%)、Bard(48%)和人類受訓醫師(60.1%)。顯示新一代 AI 進步很快,但臨床應用前還是要持續評估安全性與可靠性。 相關文章 PubMed DOI 推理

這項研究比較GPT-4和DeepSeek兩種AI模型,把乳癌患者的放射科自由書寫報告自動轉成結構化格式。兩者在萃取臨床重點和TNM分期的準確率都超過91%,醫師也很滿意。GPT-4在偵測胸膜病灶較強,DeepSeek則在腸繫膜轉移辨識上表現較好。未來若導入臨床,有助提升報告標準化和醫師效率。 相關文章 PubMed DOI 推理

大型語言模型在精神科應用上有潛在風險,因為它們多半根據一般人資料訓練,對思考模式特殊的病人可能產生不適當甚至有害的回應。傳統修正方法效果有限。作者建議採用「動態情境認證」流程,持續評估與調整模型,優先確保病人安全,積極管理相關風險。 相關文章 PubMed DOI 推理

這項初步研究發現,ChatGPT-3.5在語言治療相關問題上,雖然能快速給出大致正確的答案,但不到一半完全正確或完整。它對一般問題表現較好,遇到複雜或需證據支持的問題則較弱。建議學生或新手臨床人員使用時要小心,不能完全依賴其回答。 相關文章 PubMed DOI 推理

研究團隊開發了AIDUS這款專為慢性蕁麻疹設計的聊天機器人,能提供病患和醫師正確且高品質的資訊。AIDUS的回答比一般AI機器人更準確、一致又可靠,但還是不能取代專業醫師的診斷與建議。 相關文章 PubMed DOI 推理

這項研究發現,多數有經驗的審稿人無法分辨出由 ChatGPT-4o 完全撰寫的科學論文,顯示 AI 生成的學術寫作很容易被忽略。結果提醒學界需加強辨識 AI 文章的意識與工具,以避免錯誤資訊或學術不端。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT-4o在醫學放射科教育中能幫助結構化反思內容,但缺乏情感深度和真實人性。AI適合當輔助工具,無法完全取代老師帶領的反思討論。建議採用人機合作的方式,才能發揮最大學習效益。 相關文章 PubMed DOI 推理

這份計畫書要回顧2023到2025年間,醫療人員在臨床紀錄上用生成式AI和環境抄寫工具的經驗與看法。會系統性搜尋文獻,整理醫療人員怎麼用、為什麼用或不用這些工具,並分析他們覺得的好處和風險。最後會找出研究缺口,提供醫療人員使用生成式AI的完整現況總結。 相關文章 PubMed DOI 推理

醫學知識爆炸,傳統純文字教學已經讓學生吃不消。認知科學建議結合文字和圖像(雙重編碼)能提升學習效果,但現有教材很少這樣做。現在有像 ChatGPT、Gemini 等 AI 工具,能輕鬆製作圖像、音訊、互動地圖和影片,讓學習更有趣又有效,對 Gen Z 特別有幫助。這些工具操作簡單,但還是需要學校支持和訓練。只要善用 AI 多模態內容,就能有效解決醫學教育的資訊爆炸問題。 相關文章 PubMed DOI 推理