LLM 相關三個月內文章 / 第 123 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究比較三款 AI 解釋大腸癌篩檢指引的表現。DeepSeek 在在地化和邏輯細節上最好,但標準正確性待加強;ChatGPT-4o 用了舊標準,對高風險族群說明太簡略;Claude3.5 解釋詳盡但漏掉實務細節。整體來說,AI 有助提升醫療指引的易懂度,但內容仍需專家把關與倫理監督。 相關文章 PubMed DOI 推理

CAS 是專為生醫關係抽取等有嚴格結構限制任務設計的資料增強框架,利用大型語言模型產生多樣且合規的資料,並用自我評估過濾器(SemQ)確保品質與一致性。CAS 能維持資料完整性,提升模型表現,適用於多種有約束的 NLP 任務。程式碼連結:https://github.com/ngogiahan149/CAS 相關文章 PubMed DOI 推理

這項研究用GPT-3.5分析Reddit三大IBD社群5萬多則貼文,分類情緒、主題、人口資料及是否提到COVID-19。AI分類結果和人工高度一致,貼文多討論藥物和症狀,情緒偏中性。公開年齡多為20、30歲,性別分布和一般IBD患者不同。COVID-19討論初期多,後來減少。證明AI能有效分析醫療社群資料,對未來研究很有幫助。 相關文章 PubMed DOI 推理

這項研究比較GPT-3.5和GPT-4.0在巴西醫學進階測驗的表現,發現GPT-4.0平均得分(87.2%)明顯高於GPT-3.5(68.4%),提升了27.4%。特別是在基礎醫學和婦產科領域,GPT-4.0表現更突出。這顯示AI像GPT-4.0,已經對醫學教育和評量帶來明顯影響。 相關文章 PubMed DOI 推理

這篇論文評估 DeepSeek R1 在 100 個 MedQA 臨床案例的表現,診斷準確率高達 93%,展現接近專家的醫學推理能力。常見錯誤有定勢偏誤、處理矛盾資料困難、選項有限、過度思考、知識不全及跳步。研究發現,回答越簡潔(少於 5,000 字元)準確率越高。雖然還有改進空間,DeepSeek R1 已展現協助醫療決策的潛力。 相關文章 PubMed DOI 推理

大型語言模型(LLMs)已能協助篩檢、診斷及治療慢性致盲眼疾,表現媲美專家,並提升醫療可近性。但目前仍面臨泛用性不足、演算法透明度及倫理問題、缺乏標準驗證等挑戰。未來需加強專業訓練、多元資料整合、國際驗證及倫理規範,LLMs有望成為慢性眼疾管理的重要工具。 相關文章 PubMed DOI 推理

這篇論文提出FAST評估框架,專門用來監控AI健康教練在協助肥胖治療患者時的互動品質與安全性。透過系統化審查訊息和對話,確保AI支援符合標準並保障病患安全,還有明確的臨床風險處理流程,讓醫療機構導入AI更安心可靠。 相關文章 PubMed DOI 推理

**重點整理:** 這篇文章是第一篇全面性回顧大型語言模型(LLMs)在自動疾病診斷上的應用。內容分析了現有研究,從疾病類型、臨床資料、LLM技術到評估方法都有涵蓋。這篇回顧也提供了實務建議,點出了目前的限制,並針對這個快速發展的領域提出未來的研究方向。 相關文章 PubMed DOI 推理

這項研究發現,GPT-4o能用不同語言回答人格問卷,展現出明顯且會隨設定變化的人格特質,也能反映部分現實差異。不過,和真人數據還是有落差,要穩定用來產生研究樣本還有困難,需要再深入研究。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT在回答網球肘相關問題時,標準版比六年級閱讀程度版更準確,但都不如OrthoInfo正確。標準版的用詞也太艱深,不適合病患閱讀。總結來說,ChatGPT不適合當唯一醫療資訊來源,建議搭配專業醫師意見一起參考。 相關文章 PubMed 推理