Surgeon, Trainee, or GPT? A Blinded Multicentric Study of AI-Augmented Operative Notes.

外科醫師、受訓醫師，還是 GPT？一項關於 AI 輔助手術紀錄的多中心盲性研究

<think> 嗯，我需要分析一下這篇研究。研究主要是比較外科醫生、住院醫師、GPT和醫生用GPT辅助寫病歷的效果。摘要提到結果顯示，醫生用GPT輔助寫的病歷品質最高，通過率79%，而GPT自己寫的通過率只有23%。這可能是因為GPT雖然快，但容易漏掉或多寫資訊。研究目的是看AI如何輔助寫病歷，假設是AI可以提高效率和一致性。研究設計是用五個耳鼻喉病例，四個版本，讓十個評審評分。方法合理，但樣本量可能太小，缺乏多樣性。數據顯示AI輔助確實更好，但可能評審的偏好影響了結果。研究結果支持假設，但局限性在於病例數量少，可能不夠全面。未來研究應擴大樣本，考慮不同科室和醫生經驗。另外，AI可能在某些情況下仍需醫生核對，避免錯誤。 </think> ### 1. 研究目的與假設這項研究旨在探討人工智慧（AI）在外科病歷紀錄中的應用，特別是比較外科醫生、住院醫師、GPT和醫生使用GPT輔助寫作的效果。研究假設AI可以提高病歷紀錄的效率和一致性。 ### 2. 方法與設計研究方法合理，採用了五個耳鼻喉病例，四種不同的寫作方式，並邀請十位評審進行評分。優點是多中心設計增加了結果的可信度。缺陷是樣本量小，可能缺乏多樣性。 ### 3. 數據解釋與結果結果顯示，醫生使用GPT輔助寫作的病歷品質最高，通過率達79%，而GPT自行書寫的病歷通過率僅23%。這支持了研究假設，但可能存在評審偏好等解釋偏差。 ### 4. 局限性與偏見研究局限性包括樣本量小、病例種類有限，未考慮不同科室和醫生經驗的影響。潛在偏見包括評審可能偏好醫生寫作的風格。 ### 5. 臨床及未來研究意涵研究表明AI輔助寫作在提高效率和一致性上有潛力，建議未來研究應擴大樣本量，並探討不同科室的應用。 ### 6. 其他觀點 AI在某些情況下可能仍需醫生核對，避免錯誤或遺漏。未來可探討AI在不同醫療環節的應用，如診斷或治療建議。