LLM 相關三個月內文章 / 第 61 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究比較四款AI聊天機器人回答牙科相關問題的表現,發現Dental GPT最準確,DeepSeek-R1最容易閱讀,但整體在品質和易懂度上差異不大。研究提醒,AI在醫療領域應謹慎使用,避免錯誤資訊影響病人。 相關文章 PubMed DOI 推理

研究團隊開發了 AI 聊天機器人 Dental Trauma Evo,協助牙醫依國際指引處理牙科外傷。經 384 種情境測試,建議準確率達 100%,回覆完整性也幾乎全達標。這工具有助推動牙科外傷照護標準化。 相關文章 PubMed DOI 推理

研究分析10萬多則Reddit癌症貼文,發現約19%有醫療不信任,主要針對醫護人員。原因包括病患覺得被忽略、照護不專業和溝通不良,這些貼文常帶有焦慮或沮喪情緒。加強傾聽、提升照護品質和溝通,有助改善癌症醫療信任。 相關文章 PubMed DOI 推理

這項研究發現,用結構化提示雖然能讓八款大型語言模型產生更貼近臨床需求的摘要,但也更容易出現錯誤和偏誤。沒有任何模型能穩定產出臨床可用的摘要,因此各機構還是要自行把關,確保摘要內容正確無誤。 相關文章 PubMed DOI 推理

這篇研究回顧2021到2024年間ChatGPT和生成式AI在災害管理的應用,分析它們在減災、準備、應變和復原各階段的角色。重點包括AI在資料蒐集、資訊傳遞及災害前中後的支援,同時也討論現有限制,並建議未來研究方向,以提升AI減災效益。 相關文章 PubMed DOI 推理

年長者常有聽懂語音的困難,但現有測驗不夠貼近生活情境,也多只用單一語言。這項研究用大型語言模型自動產生和評分故事型語音理解測驗,涵蓋11種語言,並能準確反映記憶表現。這種方法更貼近真實生活,未來在臨床上很有幫助。 相關文章 PubMed DOI 推理

這項研究發現,AI聊天機器人在醫療互動相關回顧的表現和人類一樣準確,內容更完整、脈絡解釋也更好,但回答較長。人類則較少加入新內容。ZenoChat表現最佳,顯示大型語言模型能有效協助質性研究,加快整理證據的速度。 相關文章 PubMed DOI 推理

這項研究發現,GPT-4在口腔顎面外科專科考題的整體正確率為62%,對藥理學和解剖學表現較好,但在牙科植體和正顎手術等專業題目較弱。顯示GPT-4對一般醫學教育有幫助,但在專業領域還有待加強,未來應持續改進才能應用於進階醫療。 相關文章 PubMed DOI 推理

這項研究針對2024年ESC心房顫動指引,測試三款大型語言模型(ChatGPT-4o、Claude 3.5 Sonnet、Gemini 1.5 Pro),發現它們在指引一致性上表現中等到高,Claude 3.5 Sonnet用思路鏈提問法時最好(60.3%)。中英文表現差不多,但LLM常建議比指引更積極的治療。建議臨床使用時多問幾次、用不同問法,並持續評估模型表現。 相關文章 PubMed DOI 推理

用開源大型語言模型自動產生PICOS摘要,可以大幅提升系統性文獻回顧的篩選效率和準確度。審查者有PICOS摘要輔助,篩選速度快75%,敏感度和準確性也更高。即使經驗較少,只要有PICOS摘要,表現也優於沒用PICOS摘要的資深審查者。建議未來可在其他領域推廣應用。 相關文章 PubMed DOI 推理