LLM 相關三個月內文章 / 第 69 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究發現,ChatGPT-4o在回答子宮內膜癌相關問題時,無論是準確性、同理心還是完整性都比婦科腫瘤科醫師表現更好,但回答內容偏長且不易閱讀。未來若能讓AI回覆更簡潔明瞭,會更適合用在醫療現場輔助衛教。 相關文章 PubMed DOI 推理

這項研究比較ChatGPT-4.0和4omni在用中文回答甲狀腺問題的表現。結果顯示,4omni回答更快、更長、也更準確,無論病人或醫護人員都覺得4omni的答案更正確、內容更完整、同理心更好,也更滿意。不過,全面應用在臨床前,還需要更多研究確認。 相關文章 PubMed DOI 推理

這項研究比較四款大型語言模型在乳癌PET/CT報告擷取TNM和UICC分期的表現,發現Claude 3.5 Sonnet最接近專家水準。結果顯示,LLMs有機會協助癌症分期並優化臨床流程,但在全面應用前,還需要更多實際驗證。 相關文章 PubMed DOI 推理

這篇論文提出DP2Unlearning方法,能有效從大型語言模型中移除特定資料,不用重新訓練。它利用差分隱私訓練模型,達到資料移除的正式保證,效果接近完全重訓,但計算成本只要一半,表現也比現有方法更好。 相關文章 PubMed DOI 推理

這篇研究比較兩種AI方法,把巴西醫療用語對應到國際標準。方法一結合語意相似度和大型語言模型,方法二用LLM代理人動態優化查詢。兩者準確度差不多,但代理人方法召回率較高。結果顯示,LLM能大幅減少專家整合醫療詞彙的人工負擔。 相關文章 PubMed DOI 推理

這項研究用十種中文大型語言模型來分類中藥方劑,並用集成學習提升準確率。最佳單一模型準確率為75.32%,而集成前三名模型後提升到77.15%。結果顯示,結合多個模型能更有效管理和分類中藥方劑,有助於推動中醫現代化。 相關文章 PubMed DOI 推理

**中文重點摘要:** 有同事請Claude(Anthropic的AI)幫忙收集並整理網站資料。Claude產生了一個程式並提供了結果,但它給的資料完全是捏造的,並不是網站上的真實資料。 相關文章 PubMed DOI 推理

這項研究用大型語言模型(LLM)和集成學習來自動對應生醫資料集的變數,協助資料標準化。以兩個阿茲海默症資料集為例,LLM模型(E5)表現比傳統方法好,集成隨機森林模型更是準確率最高。主要困難在於變數定義不夠清楚。整體來說,LLM和集成學習有助於提升生醫資料自動比對的效率和準確度。 相關文章 PubMed DOI 推理

研究發現,GPT-4在解讀心電圖和急診處置上,約有一半案例出現重大錯誤。當有心電圖時,處置計畫錯誤率也高達50%。雖然GPT-4有潛力,但目前準確度還不夠,臨床應用前還需要大幅改進和更多驗證。 相關文章 PubMed DOI 推理

這項研究用AI聊天機器人收集臨床試驗中病人的自述結果,並用貝式中介分析來拆解治療效果,了解副作用和個人特質如何影響結果。模擬對話證明這方法能精確分辨治療的直接和間接影響,數據偏誤低、可靠性高,有助提升臨床資料品質,讓決策更個人化、更有依據。 相關文章 PubMed DOI 推理