LLM 相關三個月內文章 / 第 73 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究測試599個基因-藥物案例,發現一般大型語言模型常給出不完整或不安全的藥物基因體建議,但經過專業微調的模型表現最好(分數0.92),而且速度更快。結果顯示,微調和結構化提示比模型大小更重要,證明AI有機會實現更安全、個人化的醫療。 相關文章 PubMed DOI 推理

這項研究比較四款熱門AI語言模型在正畸學考題的表現,發現Microsoft CoPilot最穩定,ChatGPT-4.0最準確,但所有模型的答案都有不一致的情況,且新一代不一定比舊一代好。總結來說,這些AI工具可輔助學習,但目前還不適合單獨用於正畸學教育。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT-4.5在診斷貓眼疾病的準確率高達90%,表現幾乎和資深獸醫眼科醫師一樣好,也明顯勝過新手醫師。AI模型之間診斷結果也很一致,顯示先進AI有潛力協助臨床決策,尤其在專科醫師不足時特別有幫助。 相關文章 PubMed DOI 推理

這項研究發現,GPT-4o等大型語言模型能自動分析加州自駕車脫離自動駕駛的報告,準確率高達87%,速度和可靠性都比人工分析好。不過,因為車廠報告內容不一致、細節不足,還是有些挑戰。整體來說,LLM有助於提升自駕車安全分析效率,對未來自駕車發展和基礎建設規劃很有幫助。 相關文章 PubMed DOI 推理

這項研究開發了RAG-CPMF智慧中成藥推薦系統,結合大型語言模型、RAG技術和最大規模中成藥資料庫。透過多模型驗證,能有效建立並更新資料庫。整合後,RAG-CPMF在中成藥推薦準確度上明顯優於一般LLM,並經臨床指引驗證,有助西醫師更有效開立中成藥。 相關文章 PubMed DOI 推理

近期認知神經科學進展讓我們更懂情節記憶如何幫助理解現實事件,但目前還缺乏能精準預測其在複雜自然情境下運作的模型。雖然大型語言模型加外部記憶很有潛力,但和人類記憶仍有差異。這篇綜述強調這些差異,並提出更貼近人類記憶的評測標準,也討論用神經影像驗證模型預測的方法。 相關文章 PubMed DOI 推理

這項研究開發並測試ARAG框架,結合開源大型語言模型,提升阿拉伯語病患衛教資料的生成品質。12款模型中,專為阿拉伯語設計的AceGPT-v2-32B表現最佳。ARAG能明顯提升內容品質,但只有參數數較大的模型才能穩定辨識有害內容。自動化評分結果也與專家評價一致。 相關文章 PubMed DOI 推理

這項研究比較三種AI方法從頭部CT報告中找出外傷性顱內出血,結果大型語言模型DECIPHER-LLM表現最佳,敏感度100%、特異性也很高。用10%機率門檻時,人工審查量可減少約86%,但仍能抓到所有陽性個案,顯示LLM在急診篩選CT報告上又快又準。 相關文章 PubMed DOI 推理

這篇綜述介紹醫療知識圖譜(HKGs)的建構方法、應用情境(如生醫研究、藥物開發、臨床決策等),並探討與大型語言模型(LLMs)的整合現況與挑戰。文章強調HKGs有助於組織龐大醫療知識、強化AI應用,對未來醫療發展有很大潛力,也為後續研究提供方向。 相關文章 PubMed DOI 推理

2024年一項針對38位戒除物質使用障礙者的研究發現,大家在情緒調節和飲食上常遇到困難,像是容易情緒性飲食或把成癮轉移到食物上。多數人覺得設立界線不容易,但在團體分享時比較放鬆。正念營養介入有機會幫助他們同時照顧身心需求,促進復原。 相關文章 PubMed DOI 推理