這項研究評估了四種自然語言處理(NLP)模型——ChatGPT 3.5、ChatGPT 4、Bard 和 Claude 2.0——在腹股溝疝氣管理方面的回應準確性與質量。六位疝氣外科醫生使用李克特量表評分,結果顯示相關性高(4.76),但完整性(4.11)和準確性(4.14)較低。ChatGPT 4 在準確性上表現最佳。可讀性評估顯示,無一文件符合美國醫學會標準,ACS 文件在可讀性和教育質量上得分最高。總體而言,雖然NLP提供了相關資訊,但可讀性和教育質量仍需改善,外科醫生應注意這些工具的優缺點。
PubMed
DOI
♡