LLM 相關三個月內文章 / 第 49 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

目前主流大型語言模型在眼科診斷和治療規劃上表現有限,因為缺乏專業整合能力。本研究提出ReasonAgent,結合影像分析、知識檢索與診斷推理。實測顯示,ReasonAgent診斷表現與住院醫師相當,治療規劃則明顯勝過GPT-4o和住院醫師,特別適用於罕見疾病,展現專業AI在臨床應用的潛力。 相關文章 PubMed DOI 推理

這項研究用大型語言模型分析2020到2021年COVID-19疫苗相關社群貼文,發現經微調的GPT-4o-mini在分類貼文內容上表現最好。約10%貼文提到個人接種行為,超過70%則是資訊分享。這些分類結果和實際疫苗接種率高度相關,顯示LLM能有效推估真實健康行為,對行為研究有實務價值。 相關文章 PubMed DOI 推理

生成式AI和大型語言模型越來越多人用來查醫療資訊,雖然有助提升健康知識,但也可能出現錯誤、過度簡化或隱私等問題。現有研究多著重正確性,較少納入病人實際經驗。未來應加強透明度、監督,並讓醫療人員和使用者參與回饋,同時加強大眾教育。 相關文章 PubMed DOI 推理

研究團隊開發出ECGFounder這個心電圖AI模型,利用超過一千萬筆資料訓練,能處理多種心電圖格式,並針對不同任務微調。它在80種診斷上表現媲美專家(AUROC超過0.95),外部測試也很穩定,整體表現優於現有模型。這項技術有助提升心臟疾病診斷效率,未來也能應用在穿戴式裝置上,推動智慧醫療發展。 相關文章 PubMed DOI 推理

這項研究用混合式機器學習方法,結合優化過的 LightGBM 和 transformer 語言模型,分析年輕人和年長者在記憶上的差異。結果發現,年輕人會利用閱讀時間減少錯誤記憶,年長者則容易被語意相似性影響,產生更多錯誤記憶。這方法不只提升對年齡相關記憶衰退的了解,模型表現也很優秀(F1-score 0.82,召回率 0.88)。 相關文章 PubMed DOI 推理

這項研究比較 DeepSeek 和 ChatGPT-4.0 回答尿失禁相關問題的表現。兩者可靠性差不多,但都很少附上資料來源。DeepSeek 在回答品質和可讀性上略勝一籌。雖然大致遵循臨床指引,偶爾還是會有偏差。這些 AI 工具還需改進,才能廣泛應用在臨床泌尿科。 相關文章 PubMed DOI 推理

Prompt engineering對舊版語言模型提升醫學考試表現很有幫助,但對新版(如GPT-4o)幾乎沒影響,因為新模型本來就很強。未來重點應該放在選對模型和如何把AI聰明地融入醫學教育,而不是只調整prompt。 相關文章 PubMed DOI 推理

這項研究用AI結合ChatGPT、WhatsApp和CRM,幫助腎臟和肝臟移植病人及捐贈者衛教。AI回答1,281個問題,準確度和安全性都很高,病患滿意度也高達99.5%。系統在手術相關問題表現特別好,但還需要進一步研究來提升準確性、處理倫理問題,並擴大AI在臨床的應用。 相關文章 PubMed DOI 推理

在兒科知情同意上,LLMs能用孩子聽得懂的方式解釋醫療資訊,也能幫助家長了解細節,提升病童自主權並促進家庭討論。但LLMs是否真能支持自主性、避免誤導,還有倫理疑慮。建議LLMs僅作為輔助,不能取代醫護人員的人性關懷與專業判斷。 相關文章 PubMed DOI 推理

2025年英國調查發現,多數家庭醫師對生成式AI經驗有限,普遍缺乏相關訓練,對AI有疑慮也感到焦慮。大家認為AI適合做文件紀錄,但不適合臨床判斷。雖然不少醫師看好AI潛力,但知識和訓練不足是最大障礙。研究也提醒,基層醫療很需要更多AI教育和研究。 相關文章 PubMed DOI 推理