LLM 相關三個月內文章 / 第 74 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究發現,ChatGPT-4o在建議自我監測聽力變化者何時該看醫師時,和專家判斷高度一致(一致性最高達0.99),也能處理長期數據。未來若整合進聽力監測App,有望提升決策支援,幫助用戶及時就醫,補足現有App的不足。 相關文章 PubMed DOI 推理

這篇論文把減害原則用在醫療領域的AI應用,提出管理大型語言模型風險的實用框架。建議包括:強制人工審查、提升病患健康素養、臨床醫師注意偏誤、制定機構政策、依風險分級部署,以及病患端加註免責聲明。目標是在創新、病患安全、信任和責任間取得平衡。 相關文章 PubMed DOI 推理

這篇論文提出一套不用事先列出偏見清單,就能自動偵測、量化和解釋文字轉圖像模型偏見的方法。它先用大型語言模型找出說明文字裡的潛在偏見,再生成圖片,最後用視覺問答來評估。提出的OpenBias和GradBias方法,不只能抓到已知偏見,也能發現新偏見,效果和人工判斷差不多。程式碼已公開在GitHub。 相關文章 PubMed DOI 推理

一款專為藥物難治型癲癇設計的VNS知識AI測驗系統,表現比神經外科醫師更優秀,分數更高,精確度和特異性都滿分,完全沒出現幻覺。AI在技術和解剖題目特別強,但臨床醫師在實際判斷題較有優勢。這顯示AI結合醫師專業,有助提升臨床決策和教育效果。 相關文章 PubMed DOI 推理

這項研究發現,像 GPT-4 這類 AI 翻譯工具在多國語言的病人回報量表翻譯上表現不錯,有時甚至比人工翻譯還好。不過,翻譯品質還是會因語言和工具不同而有差異,目前 AI 還不能完全取代人工翻譯,只能當作輔助工具使用。 相關文章 PubMed DOI 推理

Elena Sblendorio 原本沒被列為作者,這次是發通知來補上她的名字,讓她的貢獻被正式承認。 相關文章 PubMed DOI 推理

這項研究發現,評審和創作者的文化背景及身份(人類或AI)會影響對創造力的評分。人類偏好人類作品,AI則偏好AI作品,大家也都比較喜歡自己文化背景的故事。這顯示只用人類評審來評估AI創造力,可能會有偏見,未來應重新思考評估方式。 相關文章 PubMed DOI 推理

藥物基因體學能讓用藥更個人化,但臨床應用還有困難,像是檢測項目不夠精準、難和電子病歷整合、醫師對相關知識不熟等。論文建議聚焦重要基因、把提醒工具整合進EMR、加強醫師訓練、增加多元研究族群,並簡化保險流程,來推動臨床應用。 相關文章 PubMed DOI 推理

Medway NHS Foundation Trust 推出生成式 AI 聊天機器人,幫助臨床醫師撰寫研究計畫書,特別適合沒經驗的醫師。初步結果顯示,使用者滿意度高、自信心提升,參與研究的人也變多。不過,平台本身還有限制,未來需要加強 NHS 各單位的整合與存取。 相關文章 PubMed DOI 推理

這項研究比較GPT-4.0、Claude-2和Llama-2三款AI在牙科選擇題上的表現。結果顯示,GPT-4.0答對率最高(65.4%),解釋也最清楚,明顯優於另外兩款。整體來說,GPT-4.0目前在牙科專業知識上最值得信賴。 相關文章 PubMed DOI 推理