LLM 相關三個月內文章 / 第 66 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究開發並測試ARAG框架,結合開源大型語言模型,提升阿拉伯語病患衛教資料的生成品質。12款模型中,專為阿拉伯語設計的AceGPT-v2-32B表現最佳。ARAG能明顯提升內容品質,但只有參數數較大的模型才能穩定辨識有害內容。自動化評分結果也與專家評價一致。 相關文章 PubMed DOI 推理

這項研究比較三種AI方法從頭部CT報告中找出外傷性顱內出血,結果大型語言模型DECIPHER-LLM表現最佳,敏感度100%、特異性也很高。用10%機率門檻時,人工審查量可減少約86%,但仍能抓到所有陽性個案,顯示LLM在急診篩選CT報告上又快又準。 相關文章 PubMed DOI 推理

這篇綜述介紹醫療知識圖譜(HKGs)的建構方法、應用情境(如生醫研究、藥物開發、臨床決策等),並探討與大型語言模型(LLMs)的整合現況與挑戰。文章強調HKGs有助於組織龐大醫療知識、強化AI應用,對未來醫療發展有很大潛力,也為後續研究提供方向。 相關文章 PubMed DOI 推理

2024年一項針對38位戒除物質使用障礙者的研究發現,大家在情緒調節和飲食上常遇到困難,像是容易情緒性飲食或把成癮轉移到食物上。多數人覺得設立界線不容易,但在團體分享時比較放鬆。正念營養介入有機會幫助他們同時照顧身心需求,促進復原。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT-4o在建議自我監測聽力變化者何時該看醫師時,和專家判斷高度一致(一致性最高達0.99),也能處理長期數據。未來若整合進聽力監測App,有望提升決策支援,幫助用戶及時就醫,補足現有App的不足。 相關文章 PubMed DOI 推理

這篇論文把減害原則用在醫療領域的AI應用,提出管理大型語言模型風險的實用框架。建議包括:強制人工審查、提升病患健康素養、臨床醫師注意偏誤、制定機構政策、依風險分級部署,以及病患端加註免責聲明。目標是在創新、病患安全、信任和責任間取得平衡。 相關文章 PubMed DOI 推理

這篇論文提出一套不用事先列出偏見清單,就能自動偵測、量化和解釋文字轉圖像模型偏見的方法。它先用大型語言模型找出說明文字裡的潛在偏見,再生成圖片,最後用視覺問答來評估。提出的OpenBias和GradBias方法,不只能抓到已知偏見,也能發現新偏見,效果和人工判斷差不多。程式碼已公開在GitHub。 相關文章 PubMed DOI 推理

一款專為藥物難治型癲癇設計的VNS知識AI測驗系統,表現比神經外科醫師更優秀,分數更高,精確度和特異性都滿分,完全沒出現幻覺。AI在技術和解剖題目特別強,但臨床醫師在實際判斷題較有優勢。這顯示AI結合醫師專業,有助提升臨床決策和教育效果。 相關文章 PubMed DOI 推理

這項研究發現,像 GPT-4 這類 AI 翻譯工具在多國語言的病人回報量表翻譯上表現不錯,有時甚至比人工翻譯還好。不過,翻譯品質還是會因語言和工具不同而有差異,目前 AI 還不能完全取代人工翻譯,只能當作輔助工具使用。 相關文章 PubMed DOI 推理

Elena Sblendorio 原本沒被列為作者,這次是發通知來補上她的名字,讓她的貢獻被正式承認。 相關文章 PubMed DOI 推理