LLM 相關三個月內文章 / 第 15 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究提出的醫療問答系統,結合知識嵌入和transformers,並分成理解和答案生成兩層。它在MedQA資料集上正確率達82.92%,比GPT-4高出許多。系統回應更快、更準確,也更符合醫療倫理。未來會加強精確度、互動性,並整合多種資料型態。 相關文章 PubMed DOI 推理

這篇論文提出「後思考」訓練法,讓小型語言模型先給答案再解釋推理過程,減少答案被推理錯誤影響。作者還設計自適應系統,讓模型遇到難題時能選擇先推理或先回答。實驗證明這方法能提升模型表現和效率。 相關文章 PubMed DOI 推理

這篇文章整理了目前針對大型視覺-語言模型(LVLMs)的攻擊手法,像是對抗攻擊、jailbreak、提示注入和資料投毒等,並分析這些模型獨有的弱點與挑戰。作者也提出未來研究方向,希望提升大家對LVLMs安全性的重視,促進更多改進。 相關文章 PubMed DOI 推理

研究比較 ChatGPT、Gemini 和 Copilot 回答圓錐角膜及隱形眼鏡相關問題,發現 ChatGPT 的答案最準確完整。三者資訊大致可靠,但內容偏難懂,語言程度較高。這說明 LLMs 雖能協助病人衛教,仍需醫師把關,確保資訊清楚易懂。 相關文章 PubMed DOI 推理

這項研究發現,像 ChatGPT-4o、Gemini 2.0 和 DeepSeek-R1 這類大型語言模型,能有效簡化多語言兒童白內障衛教資料,讓內容更容易閱讀和理解。特別是 DeepSeek-R1 和進階提示效果最好,轉換成簡體中文或其他語言時也很優秀。整體來說,LLMs 能大幅提升線上健康資訊的易讀性與親民度,對病患更友善。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT在回答脊柱側彎相關問題時,答案比Google更正確、清楚,且多引用學術文獻;反觀Google常引用商業或非學術網站,可靠度較低。整體來說,查詢脊柱側彎健康資訊時,ChatGPT更值得信賴。 相關文章 PubMed DOI 推理

Stanford Data Ocean (SDO) 精準醫療訓練計畫運用 AI 導師和資料視覺化工具,讓不同背景的人都能輕鬆學習生醫資料分析。SDO 不只提升學習效果,也促進跨領域合作,特別幫助弱勢族群。平台採用雲端架構,讓資料管理和個人化學習更方便,解決精準醫療的關鍵問題。 相關文章 PubMed DOI 推理

這篇論文提出一個開源的 MultiLLM-Chatbot 評測框架,能在五大專業領域下,針對五種主流大型語言模型進行多面向評估,包括語意、情感、TF-IDF 和幻覺偵測等。結果發現 LLAMA-3.3-70B 整體表現最佳。這個工具方便用戶依需求挑選最適合的 LLM,且容易擴充與重現。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT-4o在回答口腔顎面外傷問題時,完整和充分的正確率分別只有38%和58%,可靠性屬中等,但內部一致性很高。雖然它在教學和決策輔助上有潛力,但目前表現還有待加強,未來還需要更多改進和研究。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT-4o對聽損青少年的心理社會問題回應,整體表現不錯,尤其在同理心和理解力上獲得好評。不過,針對情緒健康的建議,和醫學共識的契合度較低。整體來說,ChatGPT有潛力成為聽損青少年的輔助工具,特別是在缺乏專業或同儕支援時。 相關文章 PubMed DOI 推理