這項研究比較了OpenAI的ChatGPT-3.5與傳統網路搜尋引擎在提供Randleman標準資訊的準確性。23名醫學生各花10分鐘使用ChatGPT-3.5,結果顯示只有26.1%的學生獲得正確定義,而100%的學生在網路搜尋中找到準確資訊。ChatGPT-3.5還有17.4%的學生錯誤識別標準,4.3%創造了虛構的「Randleman症候群」,52.2%則完全沒有定義。研究結論指出,對於這個醫學問題,網路搜尋引擎的可靠性明顯高於ChatGPT-3.5,提醒使用AI工具時需謹慎。
PubMed
DOI
♡