這項研究評估了OpenAI最新的語言模型Chat Generative Pre-trained Transformer-4o在成人臨床心臟病自我評估計畫(ACCSAP)的表現。經過測試後,該模型對594個問題的正確回答率為69.2%。在純文本問題上表現較佳(73.9%),但在影像解讀上則較差(55.3%),尤其是心電圖問題得分僅56.5%。雖然模型在醫學影像解讀上顯示出一定能力,但準確性不穩定,特別是沒有文本輔助的影像。總體來看,該模型在醫學教育和臨床決策中仍有潛力,但影像解讀方面的限制明顯。
PubMed
DOI
♡