LLM 相關三個月內文章 / 第 87 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

大型語言模型在放射科報告生成等語言任務上很有潛力,隨著RAG和多步推理技術進步,應用前景更佳。不過,目前還有幻覺、可重現性、隱私和倫理等挑戰待解決。RAG和雲端方案有望協助突破這些障礙,加速臨床導入。 相關文章 PubMed DOI 推理

PT-BitNet 是一種新型後訓練量化技術,能把大型語言模型的權重壓縮成三元值(+1、0、-1),不需重新訓練。它用兩階段演算法,先調整權重再分區塊最佳化,大幅減少模型大小和推論時間,且準確率損失很低。以 700 億參數模型為例,平均準確率可達 61%,比傳統 BitNet 更優。 相關文章 PubMed DOI 推理

這篇論文提出 DemoGraph,一種利用大型語言模型(LLM)從文字提示生成情境知識圖譜,再和原始圖形資料結合的新方法。它不用存取 LLM 內部結構,能有效利用情境資訊。實驗證明,DemoGraph 在電子健康紀錄(EHR)上表現特別好,不只提升預測準確率,也讓模型更容易解釋。 相關文章 PubMed DOI 推理

ICE 是一種新方法,讓多個大型語言模型互相審查和修正答案,直到大家都同意為止。這樣做能大幅提升像醫學問答這類困難題目的準確率,最高可提升 27%。ICE 不用特別訓練或複雜整合,效果比單一模型好,也能跟高成本系統媲美,證明 LLMs 合作推理很有用。 相關文章 PubMed DOI 推理

**重點整理:** 我們打造了一個結合專業神經皮膚疾病知識庫的GPT助理,發現它能有效回答病人常見的問題,也證明了檢索增強型GPT即使沒有特別指示要簡化語言,也能讓病人教育資料變得更容易閱讀。 相關文章 PubMed DOI 推理

MenstLLaMA 是專為印度設計的 AI 語言模型,專注於提供正確又貼近當地文化的月經健康教育。它用大量印度在地資料訓練,無論準確度、同理心還是用戶滿意度,都比 GPT-4o、Claude-3 這些主流模型更優秀。未來也會持續擴大功能,幫助更多人提升月經健康知識。 相關文章 PubMed DOI 推理

這項研究分析2010至2025年《Journal of Clinical Oncology》腫瘤臨床試驗作者與生技製藥公司的利益衝突,發現約73%涉及醫療產品的試驗有作者與公司有利益關係,美國主導及第一、最後作者的COI比例更高。COI盛行率2010至2020年逐年上升,之後略降。研究也證明大型語言模型能有效監控COI,提升臨床研究透明度。 相關文章 PubMed DOI 推理

這項研究針對257位義大利暈厥患者,驗證了多種機器學習模型預測暈厥後不良結果的準確度。雖然gradient boosting表現最好(AUC 0.78),但所有模型的預測力都比過去研究低,可能跟這族群不良事件發生率較高有關。整體來說,gradient boosting只比傳統邏輯回歸好一點點。 相關文章 PubMed DOI 推理

這篇研究發現,單靠大型語言模型(LLM)做急診分診效果有限,表現不如把LLM產生的知識結合進傳統機器學習(ML)模型。雖然LLM偶爾能勝過傳統ML,但混合模型效果最好。不過,所有模型的平均F1-score都不到0.60,代表準確度還有很大進步空間。 相關文章 PubMed DOI 推理

這項研究發現,主流AI生成皮膚科影像時,膚色多樣性嚴重不足,尤其深色皮膚比例被低估,只有Adobe Firefly較貼近美國實際分布。診斷準確率也很低,僅15%影像正確顯示疾病。若不改善資料和指引,AI恐加劇皮膚科健康不平等。 相關文章 PubMed DOI 推理