Comparative evaluation of responses from DeepSeek-R1, ChatGPT-o1, ChatGPT-4, and dental GPT chatbots to patient inquiries about dental and maxillofacial prostheses.
DeepSeek-R1、ChatGPT-o1、ChatGPT-4 及牙科 GPT 聊天機器人對於患者有關牙科與顎面修復體詢問之回應的比較評估 BMC Oral Health 2025-05-31

這項研究比較四款AI聊天機器人回答牙科相關問題的表現，發現Dental GPT最準確，DeepSeek-R1最容易閱讀，但整體在品質和易懂度上差異不大。研究提醒，AI在醫療領域應謹慎使用，避免錯誤資訊影響病人。相關文章 PubMed DOI 推理

Dental Trauma Evo - Development of an Artificial Intelligence-Powered Chatbot to Support Professional Management of Dental Trauma.
Dental Trauma Evo－開發人工智慧驅動的聊天機器人以支援牙科外傷的專業處理 J Endod 2025-05-31

研究團隊開發了 AI 聊天機器人 Dental Trauma Evo，協助牙醫依國際指引處理牙科外傷。經 384 種情境測試，建議準確率達 100%，回覆完整性也幾乎全達標。這工具有助推動牙科外傷照護標準化。相關文章 PubMed DOI 推理

Medical Mistrust in Online Cancer Communities: A Large-Scale Analysis Across 10 Cancer Entities.
線上癌症社群中的醫療不信任：涵蓋10種癌症類型的大規模分析 Psychooncology 2025-05-31

研究分析10萬多則Reddit癌症貼文，發現約19%有醫療不信任，主要針對醫護人員。原因包括病患覺得被忽略、照護不專業和溝通不良，這些貼文常帶有焦慮或沮喪情緒。加強傾聽、提升照護品質和溝通，有助改善癌症醫療信任。相關文章 PubMed DOI 推理

Prompting Pro Tips! Best Practices for Generating Clinical Narrative Summaries.
臨床敘述摘要撰寫技巧！產生臨床敘述摘要的最佳實務指南 Mil Med 2025-05-31

這項研究發現，用結構化提示雖然能讓八款大型語言模型產生更貼近臨床需求的摘要，但也更容易出現錯誤和偏誤。沒有任何模型能穩定產出臨床可用的摘要，因此各機構還是要自行把關，確保摘要內容正確無誤。相關文章 PubMed DOI 推理

Revolutionizing the future: unleashing the potential of generative AI ChatGPT in disaster management.
革新未來：釋放生成式 AI ChatGPT 在災害管理中的潛力 Environ Sci Pollut Res Int 2025-05-31

這篇研究回顧2021到2024年間ChatGPT和生成式AI在災害管理的應用，分析它們在減災、準備、應變和復原各階段的角色。重點包括AI在資料蒐集、資訊傳遞及災害前中後的支援，同時也討論現有限制，並建議未來研究方向，以提升AI減災效益。相關文章 PubMed DOI 推理

Language-agnostic, Automated Assessment of Listeners' Speech Recall Using Large Language Models.
使用大型語言模型進行語言無關的自動化聽者語音回憶評估 Trends Hear 2025-05-31

年長者常有聽懂語音的困難，但現有測驗不夠貼近生活情境，也多只用單一語言。這項研究用大型語言模型自動產生和評分故事型語音理解測驗，涵蓋11種語言，並能準確反映記憶表現。這種方法更貼近真實生活，未來在臨床上很有幫助。相關文章 PubMed DOI 推理

Evaluating the performance of artificial intelligence in summarizing pre-coded text to support evidence synthesis: a comparison between chatbots and humans.
人工智慧在摘要預先編碼文本以支援實證綜合之表現評估：聊天機器人與人類的比較 BMC Med Res Methodol 2025-05-30

這項研究發現，AI聊天機器人在醫療互動相關回顧的表現和人類一樣準確，內容更完整、脈絡解釋也更好，但回答較長。人類則較少加入新內容。ZenoChat表現最佳，顯示大型語言模型能有效協助質性研究，加快整理證據的速度。相關文章 PubMed DOI 推理

Performance of GPT-4 in oral and maxillofacial surgery board exams: challenges in specialized questions.
GPT-4 在口腔顎面外科專科醫師考試中的表現：專業題目面臨的挑戰 Oral Maxillofac Surg 2025-05-30

這項研究發現，GPT-4在口腔顎面外科專科考題的整體正確率為62%，對藥理學和解剖學表現較好，但在牙科植體和正顎手術等專業題目較弱。顯示GPT-4對一般醫學教育有幫助，但在專業領域還有待加強，未來應持續改進才能應用於進階醫療。相關文章 PubMed DOI 推理

Evaluating performance of large language models for atrial fibrillation management using different prompting strategies and languages.
使用不同提示策略與語言評估大型語言模型於心房顫動管理的表現 Sci Rep 2025-05-30

這項研究針對2024年ESC心房顫動指引，測試三款大型語言模型（ChatGPT-4o、Claude 3.5 Sonnet、Gemini 1.5 Pro），發現它們在指引一致性上表現中等到高，Claude 3.5 Sonnet用思路鏈提問法時最好（60.3%）。中英文表現差不多，但LLM常建議比指引更積極的治療。建議臨床使用時多問幾次、用不同問法，並持續評估模型表現。相關文章 PubMed DOI 推理

Do it faster with PICOS: Generative AI-Assisted systematic review screening.
用 PICOS 更快完成：Generative AI 協助的系統性文獻篩選 J Biomed Inform 2025-05-30

用開源大型語言模型自動產生PICOS摘要，可以大幅提升系統性文獻回顧的篩選效率和準確度。審查者有PICOS摘要輔助，篩選速度快75%，敏感度和準確性也更高。即使經驗較少，只要有PICOS摘要，表現也優於沒用PICOS摘要的資深審查者。建議未來可在其他領域推廣應用。相關文章 PubMed DOI 推理

LLM 相關三個月內文章 / 第 61 頁

可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

LLM 相關三個月內文章 / 第 61 頁

可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

可選擇其它分類: 一週新進文章腎臟科一般醫學 SGLT2i GLP1