LLM 相關三個月內文章 / 第 101 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

研究用GPT-4分析醫院出院摘要,預測逾1.1萬名病患的自殺或意外死亡風險。模型能有效分層風險,最高風險群死亡時間明顯較早,且預測表現優於傳統方法。不過,模型對黑人和西班牙裔給的風險分數偏高。整體來說,LLM有助於找出出院後高風險病患。 相關文章 PubMed DOI 推理

研究發現,GPT-4聊天機器人在解讀血液培養結果上表現不錯,但在治療建議上,出現不當或有害建議的比例較高(13%,專家僅4%),尤其是在抗生素選擇和感染源控制方面。雖然AI可輔助抗生素管理,但還是無法取代感染科專家的專業判斷。 相關文章 PubMed DOI 推理

GPT-4o在感染症診斷和處置上,簡單題目表現跟專科醫師差不多,甚至比住院醫師更好;但遇到複雜或案例型題目,還是專科醫師勝出。不過,GPT-4o的答案比住院醫師更完整。總結來說,GPT-4o能當輔助工具,但複雜情況還是得靠專家醫師判斷,人類監督很重要。 相關文章 PubMed DOI 推理

這篇系統性回顧分析發現,利用聊天機器人的運動介入能有效提升身體活動量,尤其是中高強度運動,但對運動習慣和減少久坐行為的影響不明顯。短期內運動習慣有些微進步。未來還需要更多大規模、多元族群及長期追蹤的研究來驗證成效。 相關文章 PubMed DOI 推理

這項研究比較GPT-4和GPT-4o在放射性碘治療病人衛教上的表現,發現兩者都能給出有幫助的答案,但參考資料常有錯誤或遺漏。同理心表現約佔一半到三分之二,兩模型差異不大,醫師評分也不太一致。總結來說,ChatGPT可輔助衛教,但參考資料準確度有限,仍需醫師把關。 相關文章 PubMed DOI 推理

這項研究發現,很多人把ChatGPT當成心理治療的輔助工具,像是尋求建議、情緒支持或陪伴。大家覺得它隨時可用、不會批評人,但也擔心隱私和情感深度不足。研究提醒,AI有助於心理健康,但也要注意風險和倫理問題,提升AI素養很重要。 相關文章 PubMed DOI 推理

這項研究比較了ChatGPT-3.5、4.0和4 Turbo在口腔顎面病理學與放射學選擇題的表現,發現4 Turbo正確率最高(90%),4.0次之(85%),3.5最低(78%)。免費版十個月後進步明顯,付費版則一直很穩定。雖然ChatGPT對牙醫教育有幫助,但在複雜推理和圖像判讀上還有待加強。 相關文章 PubMed DOI 推理

這項研究比較GPT-3.5和GPT-4在英文和中文回答呼吸道吸入問題的表現,發現兩者在正確性、完整性和一致性上都很優秀,且不同模型和語言間沒有明顯差異。結果顯示大型語言模型能有效提供相關知識,有潛力成為訓練工具,但使用時要注意其限制。 相關文章 PubMed DOI 推理

這項研究首次用GPT-4來篩選公共政策文獻,主要負責排除不相關的鴉片類藥物政策文章。GPT-4能排除96%的文章,誤刪率極低,但在挑選應納入的文章時表現較差。雖然能大幅減輕人工負擔,但正式用於系統性回顧前,還需謹慎評估其準確性。 相關文章 PubMed DOI 推理

這項研究發現,Google Gemini AI 在神經放射學診斷上,僅靠病史時正確率很低(3.5%),加入影像後提升到 45.7%,尤其在脊椎案例表現最好。雖然 Gemini 展現潛力,但目前正確率還不夠高,臨床應用前還需要更多驗證和審慎評估。 相關文章 PubMed DOI 推理