LLM 相關三個月內文章 / 第 181 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究發現,用結構化提示雖然能讓八款大型語言模型產生更貼近臨床需求的摘要,但也更容易出現錯誤和偏誤。沒有任何模型能穩定產出臨床可用的摘要,因此各機構還是要自行把關,確保摘要內容正確無誤。 相關文章 PubMed DOI 推理

這篇研究回顧2021到2024年間ChatGPT和生成式AI在災害管理的應用,分析它們在減災、準備、應變和復原各階段的角色。重點包括AI在資料蒐集、資訊傳遞及災害前中後的支援,同時也討論現有限制,並建議未來研究方向,以提升AI減災效益。 相關文章 PubMed DOI 推理

年長者常有聽懂語音的困難,但現有測驗不夠貼近生活情境,也多只用單一語言。這項研究用大型語言模型自動產生和評分故事型語音理解測驗,涵蓋11種語言,並能準確反映記憶表現。這種方法更貼近真實生活,未來在臨床上很有幫助。 相關文章 PubMed DOI 推理

這項研究發現,AI聊天機器人在醫療互動相關回顧的表現和人類一樣準確,內容更完整、脈絡解釋也更好,但回答較長。人類則較少加入新內容。ZenoChat表現最佳,顯示大型語言模型能有效協助質性研究,加快整理證據的速度。 相關文章 PubMed DOI 推理

這項研究發現,GPT-4在口腔顎面外科專科考題的整體正確率為62%,對藥理學和解剖學表現較好,但在牙科植體和正顎手術等專業題目較弱。顯示GPT-4對一般醫學教育有幫助,但在專業領域還有待加強,未來應持續改進才能應用於進階醫療。 相關文章 PubMed DOI 推理

這項研究針對2024年ESC心房顫動指引,測試三款大型語言模型(ChatGPT-4o、Claude 3.5 Sonnet、Gemini 1.5 Pro),發現它們在指引一致性上表現中等到高,Claude 3.5 Sonnet用思路鏈提問法時最好(60.3%)。中英文表現差不多,但LLM常建議比指引更積極的治療。建議臨床使用時多問幾次、用不同問法,並持續評估模型表現。 相關文章 PubMed DOI 推理

用開源大型語言模型自動產生PICOS摘要,可以大幅提升系統性文獻回顧的篩選效率和準確度。審查者有PICOS摘要輔助,篩選速度快75%,敏感度和準確性也更高。即使經驗較少,只要有PICOS摘要,表現也優於沒用PICOS摘要的資深審查者。建議未來可在其他領域推廣應用。 相關文章 PubMed DOI 推理

這項研究比較多款AI聊天機器人在手外科考試的表現,發現大多數都能通過考試,其中以ChatGPT-4o1最優秀。雖然AI在專科醫學領域展現不錯的專業能力,但不同AI的準確度和可靠性還是有落差。 相關文章 PubMed DOI 推理

Welzijn.AI 是專為年長者設計的心理健康監測工具,開發時廣納病患、醫師、研究人員等意見。研究發現它能減少孤獨、分析語言,但也有隱私疑慮和操作難度。設計重點包括同理心、多元互動和用戶支援。這些成果有助於打造更負責任、貼近需求的 AI 工具,提升年長者福祉。 相關文章 PubMed DOI 推理

這項研究發現,不同AI聊天機器人在幫醫學生出單一最佳答案題目時,品質和一致性都有差異,沒有哪一個特別突出。所有AI產生的題目都還是需要專家審查,無法完全取代人類。AI出題也對傳統的認知能力分級方式帶來挑戰。 相關文章 PubMed DOI 推理