這項研究評估了生成式人工智慧模型在預測小兒急診病人緊急嚴重指數(ESI)等級的表現,發現幾個關鍵見解: 1. **模型表現**:Claude-3 Opus 在未經訓練的模型中表現最佳,敏感度80.6%、特異度91.3%。 2. **微調影響**:微調後的 GPT-4.0 顯示顯著改善,敏感度77.1%、特異度92.5%。 3. **可靠性評估**:Claude-3 Opus 的一致性最高(κ: 0.85),顯示出強烈的評分者間可靠性。 4. **統計分析**:微調前後的比較顯示 GPT 模型有顯著改善。 5. **結論**:生成式人工智慧模型能準確預測小兒 ESI 等級,微調後表現更佳,成為急診分診的有價值工具。 PubMed DOI