LLM 相關三個月內文章 / 第 64 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究發現,大家普遍把AI和社會上有權勢的族群(像男性、年輕人、有錢人、白人)及高地位職業聯想在一起,覺得AI很厲害,但親和力感受不一。這種看法可能讓社會不平等更嚴重,甚至出現新的「AI鴻溝」。 相關文章 PubMed DOI 推理

PCORI 正積極推動 40 多項專案,運用 AI 改善以病人為核心的臨床研究,強調透明、嚴謹和病人參與。他們發展符合倫理、可互通的 AI 技術(如大型語言模型),提升醫療比較效益,打造以病人為中心的 AI 標竿。 相關文章 PubMed DOI 推理

瑞典醫學大型語言模型基準(SMLB)是一套專為瑞典醫療情境設計的開源評測工具,能評比多種LLM在臨床應用的表現。研究發現,GPT-4-turbo、Claude-3.5和o3model表現最優,尤其結合RAG技術時更突出。SMLB強調,隨著LLM在非英語醫療領域普及,針對語言特性的嚴謹評估非常重要。 相關文章 PubMed DOI 推理

德國2022-2023年新聞報導分析發現,媒體在報導激進氣候團體如「Last Generation」時,常忽略氣候風險與解方,語氣也比報導「Fridays for Future」更負面。偏右媒體尤其負面,且氣候資訊最少。這樣的報導方式,可能影響民眾對氣候行動的觀感與氣候運動的推動成效。 相關文章 PubMed DOI 推理

這項研究依AAMC指引,提出五步驟策略,協助Quillen醫學院負責任地把生成式AI納入課程,包括調查學生AI使用、訂定專業規範、提供公平機會、結構化學習活動及AI倫理訓練。結果顯示,學生使用AI明顯增加,多數認為有助學習,但部分人質疑其正確性。這做法有助於兼顧學術誠信與AI應用推廣。 相關文章 PubMed DOI 推理

這篇研究發現,傳統文字比對方法在標準化腫瘤名稱時表現不佳,而用LLM/transformer的文字嵌入模型,準確率大幅提升到約69%。如果把表現最好的模型結合起來,效果還會更好。這證明嵌入模型很適合處理生醫術語標準化,CANTOS框架也讓這類評測更容易重現。 相關文章 PubMed DOI 推理

這項研究用台灣2018到2022年急診專科醫師考題測試GPT-4,發現它答對率約60%,圖片判讀還不錯,但遇到診斷和臨床決策時表現就變差。沒有特定題型特別影響結果。雖然GPT-4有潛力,但目前還不適合直接用在急診決策,未來還需要再改進才能安全協助醫師。 相關文章 PubMed DOI 推理

基因組註解結合自動化工具和人工校訂,但人工速度慢、難擴展。作者提出「人機協作基因組註解(HAICoGA)」框架,融合專家知識與AI(如大型語言模型),提升準確率和效率,並討論推動這種協作時的挑戰與待解決問題。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT-4o在回答精索靜脈曲張相關問題時,整體表現不錯,約有九成回答達到良好或高品質,特別是在一般資訊和指引問題上較為可靠。不過,針對治療相關問題,回答內容有時不夠一致或深入,建議查詢時仍需搭配專業醫師意見。 相關文章 PubMed DOI 推理

生成式 AI 像 ChatGPT 雖能提供個人化健康資訊,但也容易加深「確認偏誤」,讓使用者只相信自己原本的想法,甚至傳播錯誤訊息。研究指出,AI 的設定和使用方式都會影響偏誤程度,光靠技術修正不夠,還要加強數位素養、批判思考教育和法規,才能保障大家獲得正確健康資訊。 相關文章 PubMed DOI 推理