A framework to assess clinical safety and hallucination rates of LLMs for medical text summarisation.
用於醫學文本摘要之大型語言模型(LLMs)臨床安全性與幻覺率評估框架
NPJ Digit Med 2025-05-13
A pilot feasibility study comparing large language models in extracting key information from ICU patient text records from an Irish population.
一項針對愛爾蘭人群 ICU 患者文本記錄中提取關鍵信息的大型語言模型比較的初步可行性研究。
Intensive Care Med Exp 2024-08-15
Evaluation Framework of Large Language Models in Medical Documentation: Development and Usability Study.
大型語言模型在醫療文檔中的評估框架:開發與可用性研究。
J Med Internet Res 2024-11-20
這項研究旨在開發和驗證一個框架,以評估大型語言模型(LLM)生成的急診室記錄的準確性和臨床適用性。研究中,52名參與者使用HyperCLOVA X LLM創建了33份記錄,並採用雙重評估方法進行分析。臨床評估顯示評估者之間的可靠性高,而定量評估則識別出七種主要錯誤類型,其中無效生成錯誤最為常見。研究結果顯示該框架在臨床可接受性上具備潛力,為未來的研究和應用提供了方向。
PubMedDOI
Developing and Evaluating Large Language Model-Generated Emergency Medicine Handoff Notes.
開發與評估大型語言模型生成的急診醫學交接筆記。
JAMA Netw Open 2024-12-03
The Clinicians' Guide to Large Language Models: A General Perspective With a Focus on Hallucinations.
大型語言模型的臨床醫師指南:一般觀點與聚焦於幻覺的探討。
Interact J Med Res 2025-01-28
Large Language Models in Medicine: Clinical Applications, Technical Challenges, and Ethical Considerations.
醫學中的大型語言模型:臨床應用、技術挑戰與倫理考量
Healthc Inform Res 2025-05-19
Performance evaluation of large language models in pediatric nephrology clinical decision support: a comprehensive assessment.
大型語言模型於兒童腎臟科臨床決策支援之表現評估:全面性評估
Pediatr Nephrol 2025-06-03