LLM 相關三個月內文章 / 第 138 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究提出「precision grounding」技術,把大型語言模型(LLM)連接到專門查詢工具CATT,利用獨特識別碼從可信資料庫抓取特定基因變異資訊。這方法讓GPT-4o在基因變異摘要上更正確、完整,也大幅減少臨床錯誤。CATT是開源工具,有助於精準醫療應用。 相關文章 PubMed DOI 推理

這項研究發現,GPT-4.0在回答創傷性腦損傷相關問題時,比GPT-3.5更可靠,但兩者在易讀性上都不如官方衛教單張。AI生成的內容雖然越來越準確,但在讓人容易看懂這方面,還有很大的進步空間。 相關文章 PubMed DOI 推理

全球實驗醫學網路研討會調查發現,參與者最需要品質管理、臨床化學、新技術、特殊檢驗、醫療領導、病例討論、公共衛生及創新等主題。這些結果可作為未來課程設計和資源規劃的參考,也有助於與IFCC合作提升全球實驗室標準。 相關文章 PubMed 推理

這項研究發現,人類專家在將護理紀錄對應到標準化分類上,表現明顯優於機器學習模型。雖然GPT-4o mini等模型在常見分類上還算可以,但遇到需要情境判斷的複雜案例就明顯落後。機器學習雖有潛力,但目前還無法完全取代專家,未來還需加強對臨床情境和專業術語的處理。 相關文章 PubMed DOI 推理

這項研究用AI和NLP技術,從牙科紀錄中自動抓出牙周病診斷資訊。團隊用GPT-4生成的資料來訓練RoBERTa模型,辨識牙周病細節的準確率高達0.97–0.98,連自由書寫的紀錄也能精準判讀。這大幅減少人工標註,且不同醫院都適用,有助於臨床資料再利用。不過,模型對語境的理解還有進步空間。 相關文章 PubMed DOI 推理

這篇論文比較人類專家和AI(ChatGPT 4.0、ChatGPT Scholar)在帕金森氏症神經功能評估文獻回顧的表現。結果發現,人類能找出24篇相關文獻,但AI工具常出現結果不完整或不一致。結論是,目前AI還無法取代人類專家做系統性文獻回顧,但未來仍有發展潛力,尤其在神經功能評估工具的應用上。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT-4針對慢性蕁麻疹照護問題的回答,雖然部分內容品質還可以,但整體可靠性偏低、可讀性也不佳。專家建議,AI產生的醫療資訊應謹慎看待,最好還是經過專業醫師確認再採用。 相關文章 PubMed DOI 推理

這項研究比較15款大型語言模型在骨關節感染臨床案例的表現,OpenEvidence 和 Microsoft Copilot 答對率最高(94.4%),ChatGPT-4o 和 Gemini 2.5 Pro 也有92.8%。不同感染類型下,各模型表現不一。結果顯示先進 LLMs 有潛力協助臨床決策,但在正式醫療應用前,還需要更多驗證和優化。 相關文章 PubMed DOI 推理

這項研究發現,無論怎麼問,ChatGPT 4.0針對精索靜脈曲張的回答品質和可讀性都差不多,資訊算是一致。不過,內容對一般人來說還是太難懂,品質和可靠性也有待加強,顯示AI醫療資訊還需要再改進,才能更準確又好懂。 相關文章 PubMed DOI 推理

大型語言模型正加速中醫現代化,提升文獻分析、知識管理和臨床決策效率。不過,資料標準化、異質資料整合和模型可解釋性仍是挑戰。未來應聚焦標準化資料、多元資料整合及即時更新,才能讓LLMs在中醫領域發揮更大效益。 相關文章 PubMed DOI 推理