Performance of ChatGPT-4 on Taiwanese Traditional Chinese Medicine Licensing Examinations: Cross-Sectional Study.

ChatGPT-4 在台灣傳統中醫執照考試中的表現：橫斷面研究。

<think> 嗯，首先我要理解这个研究的目的。他们想评估ChatGPT-4在台湾传统中医执照考试中的表现，还有它在回答中医问题时的可解释性，这样才能知道它是否适合作为学习工具。研究的方法是用GPT-4模型回答了480道2022年的中医考试题，然后和两位有执照的中医师比较，一个是直接选择答案，另一个是先给出解释再选答案。他们分析了模型回答的准确性和一致性，还把题目分成不同的特征，比如认知水平、知识深度、题目类型、情景风格和问题极性。结果显示，ChatGPT的整体准确率是43.9%，比两位中医师的70%和78.4%低很多。还发现模型回答的准确性和题目特征没有显著的相关性。进一步分析错误，发现55.3%的错误是因为对中医概念的误解，这说明模型在中医知识和推理能力上有很大局限。这样看来，虽然ChatGPT在某些医疗领域表现不错，但在中医考试上还有很大提升空间。研究结果支持了他们的假设，即模型在中医领域的表现可能不佳，但也揭示了更深层次的问题，比如知识基础不扎实和推理能力不足。研究的局限性可能包括题目数量和样本的局限性，可能需要更多样化的题目和更多参与者。另外，模型的训练数据可能没有涵盖足够的中医知识，这也是一个潜在的偏见。未来研究可能需要在模型训练上下更多功夫，特别是在中医领域，可能还需要结合专家的反馈来改进模型的表现。总的来说，这个研究提醒我们，虽然AI在医疗教育中有潜力，但在中医这样的传统领域，仍然需要更多的研究和改进。未来的研究应该专注于提升模型在中医知识和推理能力上的表现，并开发更适合的学习工具。 </think> ### 研究目的與假設 1. **研究目的**：本研究旨在評估ChatGPT-4在台灣傳統中醫師執照考試中的表現，並評估其在回答中醫相關問題時的可解釋性，以確定其是否適合作為中醫學習工具。 2. **研究假設**：研究假設ChatGPT-4可能在中醫考試中表現不佳，可能需要進一步的訓練和改進才能成為有效的中醫學習工具。 ### 方法與設計 1. **研究方法**：研究使用GPT-4模型回答480道2022年的中醫執照考試題目，並與兩名具有執照的中醫師的表現進行比較。評估方法包括直接答案選擇和在選擇答案前提供解釋。研究還分析了AI生成回答的準確性和一致性，並根據題目特徵（如認知水平、知識深度、題目類型、情景風格和問題極性）進行分解。 2. **方法合理性**：研究方法合理，因為它系統地評估了ChatGPT-4在中醫考試中的表現，並與人類專家的表現進行了比較。此外，研究還分析了錯誤的原因，提供了有價值的洞見。 3. **優點與潛在缺陷**：優點包括系統地評估了AI模型在專業領域的表現，並提供了錯誤分析。潛在缺陷可能包括樣本量小（僅兩名中醫師）和題目特徵的分解可能不夠全面。 ### 數據解釋與結果 1. **研究結果**：ChatGPT-4的整體準確率為43.9%，低於兩名中醫師的70%和78.4%。研究未發現模型準確性與題目特徵之間的顯著相關性。錯誤主要來自於對中醫概念的誤解（55.3%），表明模型在中醫知識基礎和推理能力上的限制。 2. **結果支持或挑戰假設**：結果支持了研究假設，即ChatGPT-4在中醫考試中的表現不佳，需要進一步改進。 3. **解釋上的偏差**：研究結果可能受到樣本量小和題目特徵分解不夠全面的影響，可能存在解釋上的偏差。 ### 局限性與偏見 1. **局限性**：研究可能受到樣本量小、題目特徵分解不夠全面的影響。此外，模型的訓練數據可能不夠全面，特別是在中醫領域。 2. **未考慮到的偏見或變項**：研究可能未考慮到模型訓練數據中的偏見或中醫領域的特殊需求。 ### 臨床及未來研究意涵 1. **臨床意涵**：研究結果表明，ChatGPT-4在中醫考試中的表現尚不理想，需要進一步改進才能在臨床應用中發揮作用。 2. **未來研究建議**：未來研究應專注於提升AI模型在中醫知識基礎和推理能力上的表現，並開發更適合的中醫學習工具。 ### 其他觀點 1. **其他可能的解釋或觀點**：ChatGPT-4的表現可能受到其訓練數據的影響，特別是在中醫領域的訓練數據可能不夠全面。此外，模型的推理能力可能不夠強大，無法處理複雜的中醫概念和推理。 2. **推理過程**：研究結果表明，ChatGPT-4在中醫考試中的表現不佳，主要是由於對中醫概念的誤解和推理能力的不足。這表明，AI模型在處理專業領域（如中醫）時，需要更專業的訓練數據和更強大的推理能力。未來研究應專注於這些方面，以提升AI模型在中醫領域的表現。