LLM 相關三個月內文章 / 第 95 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

**重點整理:** 我們打造了一個結合專業神經皮膚疾病知識庫的GPT助理,發現它能有效回答病人常見的問題,也證明了檢索增強型GPT即使沒有特別指示要簡化語言,也能讓病人教育資料變得更容易閱讀。 相關文章 PubMed DOI 推理

MenstLLaMA 是專為印度設計的 AI 語言模型,專注於提供正確又貼近當地文化的月經健康教育。它用大量印度在地資料訓練,無論準確度、同理心還是用戶滿意度,都比 GPT-4o、Claude-3 這些主流模型更優秀。未來也會持續擴大功能,幫助更多人提升月經健康知識。 相關文章 PubMed DOI 推理

這項研究分析2010至2025年《Journal of Clinical Oncology》腫瘤臨床試驗作者與生技製藥公司的利益衝突,發現約73%涉及醫療產品的試驗有作者與公司有利益關係,美國主導及第一、最後作者的COI比例更高。COI盛行率2010至2020年逐年上升,之後略降。研究也證明大型語言模型能有效監控COI,提升臨床研究透明度。 相關文章 PubMed DOI 推理

這項研究針對257位義大利暈厥患者,驗證了多種機器學習模型預測暈厥後不良結果的準確度。雖然gradient boosting表現最好(AUC 0.78),但所有模型的預測力都比過去研究低,可能跟這族群不良事件發生率較高有關。整體來說,gradient boosting只比傳統邏輯回歸好一點點。 相關文章 PubMed DOI 推理

這篇研究發現,單靠大型語言模型(LLM)做急診分診效果有限,表現不如把LLM產生的知識結合進傳統機器學習(ML)模型。雖然LLM偶爾能勝過傳統ML,但混合模型效果最好。不過,所有模型的平均F1-score都不到0.60,代表準確度還有很大進步空間。 相關文章 PubMed DOI 推理

這項研究發現,主流AI生成皮膚科影像時,膚色多樣性嚴重不足,尤其深色皮膚比例被低估,只有Adobe Firefly較貼近美國實際分布。診斷準確率也很低,僅15%影像正確顯示疾病。若不改善資料和指引,AI恐加劇皮膚科健康不平等。 相關文章 PubMed DOI 推理

這項研究比較多種大型語言模型在回答眼瞼下垂相關問題的表現,發現GPT-4o在英文回答最優,Qwen2.5則在中文表現突出。雖然AI有助於病人衛教和醫師諮詢,但臨床應用前還需更多驗證和調整,顯示AI有提升多語言醫療溝通的潛力。 相關文章 PubMed DOI 推理

最新研究發現,人類大腦在理解語意時,會把單字和周圍單字的神經反應結合起來,這跟transformer語言模型的自我注意力機制很像。大腦也會編碼單字在句子裡的位置,類似模型的「位置編碼」。而且,大腦加權上下文單字的方式,跟語言模型的self-attention權重也很接近,顯示兩者語言處理策略可能相似。 相關文章 PubMed DOI 推理

作者提出 cxt 深度學習模型,採用 transformer 架構,能從基因體資料推斷共祖時間。不同於傳統機率模型,cxt 直接從模擬資料學習,將突變「翻譯」成祖先重組圖。其準確度與現有方法相當甚至更佳,泛化能力強、易於擴展,還能提供預測不確定性,為族群遺傳推論帶來更靈活且大規模的應用新方向。 相關文章 PubMed DOI 推理

大型語言模型如 ChatGPT、Claude、Gemini,正逐步改變肝胰膽外科手術,包括自動化文件、輔助決策、手術規劃及病患監測。不過,資料隱私、AI 錯誤、倫理、教育及醫療不平等等問題仍待解決。未來需發展專業化模型、強化醫師與 AI 合作,並建立完善倫理規範,才能安全有效地應用於臨床。 相關文章 PubMed DOI 推理