LLM 相關三個月內文章 / 第 81 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

DeepInnovationAI 是全球性的 AI 創新資料集,收錄超過 230 萬筆 AI 專利、350 萬篇論文,以及 350 萬組論文-專利配對。透過語言模型和超圖分析,能協助研究 AI 創新趨勢、合作網絡與國際競爭,對學術和產業都很有幫助。 相關文章 PubMed DOI 推理

作者發現,用 PVI 指標把難度相近的任務分組來微調語言模型,可以讓多任務學習效果更好,不只提升 NLP 任務表現,還能省參數,甚至超越單一任務和大型模型。這種方法對專業領域任務特別有幫助,能優化微調策略。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT(GPT-4o)能針對不同病人情境,準確且高度個人化地回答ACL重建手術常見問題,準確性和個人化程度分數都很高。顯示ChatGPT有潛力協助個人化醫療,但仍需更多研究及注意倫理問題。 相關文章 PubMed DOI 推理

FairMed 是一套專門針對大型語言模型在醫療建議中減少性別和種族偏見的框架,透過微調和提示工程來提升公平性。實驗證明,FairMed 在多個資料集上都比傳統方法更公平,能讓不同族群獲得更公正、可靠的醫療建議。 相關文章 PubMed DOI 推理

這篇論文介紹把大型語言模型結合強化學習,來自動化網路攻防的戰術規劃。研究團隊還公開了一個模擬環境,並開發了基於LLM的戰術代理人。實驗結果證明,這些代理人能有效提升網路攻防的自動化和靈活度,對資安領域未來發展很有幫助。 相關文章 PubMed DOI 推理

這項研究提出一套結構化治理框架,協助AI安全、有效、公平且值得信賴地融入醫療。經190位專家討論,針對臨床決策、真實世界證據及消費者健康三領域,分別設計治理模式。建議成立健康AI消費者聯盟、推動自願認證及依風險分級管理,強調透明、包容與彈性,為醫療AI應用提供明確指引。 相關文章 PubMed DOI 推理

這項研究比較了四款大型語言模型(ChatGPT、Gemini、DeepSeek、QWEN)在用 ROBIS 和 AMSTAR 2 工具評估系統性回顧時的表現。結果發現,Gemini 跟人類專家的評分最接近,準確率分別是 58% 和 70%。ChatGPT 和 QWEN 表現也不錯。有些機器人會低估偏誤風險或高估可信度。這是少數針對多款 LLM 自動化分析能力的比較研究。 相關文章 PubMed DOI 推理

這項研究評估「Future Me」聊天機器人,發現它能幫助研究生用科學方法規劃未來,方便又不帶批判,對自我反思很有幫助。不過,有些人覺得它回應太制式、情感不夠。這工具適合用來討論未來規劃,不適合處理緊急危機,建議當作輔助真人心理協助的工具,未來可加強情感回應。 相關文章 PubMed DOI 推理

這項研究比較 GPT-4o 和 Gemini-1.5-pro 兩款大型視覺-語言模型在自動化手術影片分析的表現。兩者在辨識手術器械和分類手術類型上表現不錯,但在病理分級和描述手術步驟方面較弱。利用情境學習可稍微提升結果。整體來看,這類模型未來有機會協助手術紀錄,若結合醫療專業知識,應用潛力更大。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT對家長常問的早產兒照護問題,回答大多正確、易懂,也符合兒科指引。不過,部分專業名詞解釋不夠清楚,像長期追蹤和感染風險等議題說明也較少。總結來說,ChatGPT可當家長輔助工具,但還是要配合醫師建議,未來建議多從家長實際使用經驗來評估成效。 相關文章 PubMed DOI 推理