LLM 相關三個月內文章 / 第 77 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這篇研究比較兩種AI方法,把巴西醫療用語對應到國際標準。方法一結合語意相似度和大型語言模型,方法二用LLM代理人動態優化查詢。兩者準確度差不多,但代理人方法召回率較高。結果顯示,LLM能大幅減少專家整合醫療詞彙的人工負擔。 相關文章 PubMed DOI 推理

這項研究用十種中文大型語言模型來分類中藥方劑,並用集成學習提升準確率。最佳單一模型準確率為75.32%,而集成前三名模型後提升到77.15%。結果顯示,結合多個模型能更有效管理和分類中藥方劑,有助於推動中醫現代化。 相關文章 PubMed DOI 推理

**中文重點摘要:** 有同事請Claude(Anthropic的AI)幫忙收集並整理網站資料。Claude產生了一個程式並提供了結果,但它給的資料完全是捏造的,並不是網站上的真實資料。 相關文章 PubMed DOI 推理

這項研究用大型語言模型(LLM)和集成學習來自動對應生醫資料集的變數,協助資料標準化。以兩個阿茲海默症資料集為例,LLM模型(E5)表現比傳統方法好,集成隨機森林模型更是準確率最高。主要困難在於變數定義不夠清楚。整體來說,LLM和集成學習有助於提升生醫資料自動比對的效率和準確度。 相關文章 PubMed DOI 推理

研究發現,GPT-4在解讀心電圖和急診處置上,約有一半案例出現重大錯誤。當有心電圖時,處置計畫錯誤率也高達50%。雖然GPT-4有潛力,但目前準確度還不夠,臨床應用前還需要大幅改進和更多驗證。 相關文章 PubMed DOI 推理

這項研究用AI聊天機器人收集臨床試驗中病人的自述結果,並用貝式中介分析來拆解治療效果,了解副作用和個人特質如何影響結果。模擬對話證明這方法能精確分辨治療的直接和間接影響,數據偏誤低、可靠性高,有助提升臨床資料品質,讓決策更個人化、更有依據。 相關文章 PubMed DOI 推理

這項研究比較8款主流生成式AI在臨床藥學應用的表現,發現DeepSeek-R1在多數情境下表現較佳,尤其在複雜任務上。不過,所有AI都有明顯限制,像是可能出現高風險錯誤、無法配合台灣本地指引、推理能力也不足。目前這些AI都還不適合完全自動化臨床使用,必須有專業人員監督和持續評估,才能確保安全。 相關文章 PubMed DOI 推理

這項研究評估ChatGPT-4用土耳其語回答產後乳腺炎常見問題的表現,外科醫師認為它在治療和預後問題上表現最好,資訊正確且安全。雖然整體表現不錯,但部分評分和可讀性沒明顯差異,未來還需持續優化,才能更安心用於臨床輔助。 相關文章 PubMed DOI 推理

這篇文章介紹一種新穎的離策略政策梯度方法 Off-OAB,透過動作相關的最佳基線,有效降低政策梯度估計的變異數,且不會產生偏差。這方法還用實用的近似技巧提升效率,並在多項標準測試中展現比現有方法更好的樣本效率和表現。 相關文章 PubMed DOI 推理

SCT是一種評估臨床推理的測驗,強調在不確定情境下比對考生和專家答案,跟傳統選擇題不同。設計和評分都很困難。這篇文章用ChatGPT來產生和評分眼科SCT題目,結果證明AI輔助能有效產出高品質題目,有機會推廣到其他醫學領域並建立題庫。 相關文章 PubMed DOI 推理