LLM 相關三個月內文章 / 第 95 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究比較三款AI聊天機器人回答All-on-Four植牙常見問題的準確性,發現MediSearch在技術問題上表現最好。雖然三者表現有差異,但都能提供病人和專業人員實用資訊,顯示AI聊天機器人在植牙臨床決策和衛教上越來越重要。 相關文章 PubMed DOI 推理

這項研究推出CMedRAGBot中文臨床醫學問答系統,結合RAG和醫學知識圖譜,有效減少LLM幻覺和知識過時問題。系統包含知識圖譜、強化NER模型(用Chinese-RoBERTa+BiGRU+資料增強)及意圖辨識。實測在五種主流LLM和醫學考題上,答案正確率最高提升10%。資料增強和意圖辨識對NER和複雜問題理解特別有幫助。原始碼已開源。 相關文章 PubMed DOI 推理

這項研究發現,LLM像ChatGPT-4o能快速抓到結構和後勤主題,但人類分析師更能掌握情感和心理細節。結合兩者分析,有助提升健康研究的廣度和深度。作者建議未來可採用這種混合方式。 相關文章 PubMed DOI 推理

這項研究發現,GPT只能用人們寫下的負面事件解釋來預測憂鬱症狀變化,效果有限,表現也不比傳統問卷好。主要原因是,GPT難以抓到人們對壞事是否能改變的看法,而這正是影響憂鬱風險的關鍵。 相關文章 PubMed DOI 推理

這篇文章介紹 MedRoBERTa.nl,是首個專為荷蘭語電子健康紀錄(EHR)訓練的大型語言模型。作者用匿名化的 EHR 資料預訓練模型,讓它更懂醫療用語。文中說明模型開發、資料匿名化流程,並和其他語言模型做比較。結果顯示,MedRoBERTa.nl 能提升醫療文本分析效果,有助於治療和病患康復相關研究。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT-4在MRI測量足底筋膜厚度時,準確度和穩定性都遠不如有經驗的臨床醫師,尤其在筋膜較薄時誤差更大。AI模型的可靠度明顯較低,目前還不適合用於臨床醫學影像分析。 相關文章 PubMed DOI 推理

這篇論文提出 SeeUnsafe 架構,運用多模態大型語言模型自動化交通監視器事故偵測,不需人工後處理,還能互動式分析影片。系統可彈性調整分析任務,並有新指標 IMS 評估回應品質。實驗證明,SeeUnsafe 在事故分類和證據定位上表現優異。 相關文章 PubMed DOI 推理

作者提出一套新方法,結合半監督神經網路(Seq2Fitness)和創新最佳化演算法(BADASS),能更準確預測蛋白質適應度,並有效率產生多樣且高適應度的蛋白質序列。這方法比現有技術更省資源、效果更好,未來也有機會應用在 DNA、RNA 等其他生物序列上。 相關文章 PubMed DOI 推理

這項研究推出 GENIE 聊天機器人 app,專為有遺傳性乳癌或卵巢癌風險的人設計,能用對話方式提供專家審核的個人化資訊。小規模試驗顯示,使用者覺得好用又可信,但介面還有進步空間。多數人願意每天用,也會推薦給他人。未來會優化設計並擴大測試。 相關文章 PubMed DOI 推理

細粒度實體辨識很難做,因為缺乏標註資料。這篇論文提出 FGER-GPT,利用 GPT 等大型語言模型,搭配階層式、多步驟推理,不用標註資料也能辨識細粒度實體。這方法能減少 LLM 產生幻覺的問題,在標準資料集上表現也很好,特別適合資源有限的實際應用。 相關文章 PubMed DOI 推理