LLM 相關三個月內文章 / 第 107 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究發現,牙醫系學生在牙齒解剖學選擇題考試的表現優於ChatGPT,學生平均分數74.28%,ChatGPT則為60%。雖然ChatGPT有基本理解力,能及格,但準確度和可靠性還是不夠,所以不建議單靠它來學牙齒解剖學。 相關文章 PubMed DOI 推理

最新研究發現,OpenAI 的 o1 LLM 在急診臨床決策上表現跟醫師差不多,診斷和收治判斷準確率都超過九成,甚至在異常檢驗判讀上還拿到滿分。相比之下,Claude-3.5-Sonnet 和 Llama-3.2-70B 在治療計畫上表現較弱。整體來說,o1 有機會成為急診醫療現場的專業決策輔助工具。 相關文章 PubMed DOI 推理

重點整理: 雖然AI正在改變醫學領域,但在小兒科方面的研究還很少。這項研究發現,一個免費、未經專門訓練的大型語言模型,針對13種常見小兒感染情境,能夠提供可靠的抗生素處方建議。 相關文章 PubMed DOI 推理

這項研究評估ChatGPT在診斷急性闌尾炎、膽囊炎和憩室炎的表現,發現它雖然整體表現不錯,但在膽囊炎和憩室炎的診斷準確度還是比不上臨床醫師。有些症狀會讓AI搞混,導致誤判。總結來說,ChatGPT在資源有限的情況下可以當作輔助工具,但遇到複雜病例還需要再加強。 相關文章 PubMed DOI 推理

這篇研究發現,用GPT-4o這類大型語言模型,只要給很少範例,就能準確從科學文獻中擷取材料性質資料,還能用資料增強法提升傳統模型表現。研究也分析了錯誤和資料品質,幫助了解實際應用時會遇到的問題。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT-4在建議原發性喉癌治療時,有72%和多專科腫瘤團隊(MDT)決策完全一致,且沒有明顯錯誤。其準確度和病人特徵無明顯關聯。未來若再優化,ChatGPT-4有機會成為醫師管理喉癌的好幫手。 相關文章 PubMed DOI 推理

這項研究比較SCAI大型語言模型和傳統網路搜尋的資訊查詢效果。參與者分別用兩種方式完成任務並給予回饋。結果顯示,SCAI在資訊完整性、效率和易用性上表現更佳。研究也透過操作流程和使用者評分,評估SCAI作為新型資訊工具的實用價值。 相關文章 PubMed DOI 推理

重點摘要: SCAI 給醫師用的聊天機器人用十個問題來測試回覆速度和使用者滿意度。雖然回覆速度偏慢,不過參與者整體上對這個聊天機器人還算滿意。 相關文章 PubMed DOI 推理

快速整理10篇2022年後生成式AI在數位健康領域的研究,發現系統類型分為ChatGPT、客製化和專屬開發三種。各研究的使用者體驗、評估方式和結果都不太一樣。未來還需要更多研究,才能確保生成式AI在醫療上真的好用、值得信任,並有效提升醫療品質。 相關文章 PubMed DOI 推理

這篇研究說明,透過RAG技術給大型語言模型補充相關背景資訊,可以明顯提升醫療問答的準確度。作者也分享了實驗心得和優化建議,對想提升LLM醫療應用表現的研究人員很有幫助。 相關文章 PubMed DOI 推理