這篇論文評估了 ChatGPT 3.5 Turbo 和 ChatGPT 4 在根據姓名進行性別分類的效果,並與兩個流行的性別檢測工具 Namsor 和 Gender-API 進行比較。研究使用了 5,779 條記錄的數據集,結果顯示 ChatGPT 的準確率超過 96%,比 GDTs 高出約 3%。此外,ChatGPT 在未分類方面表現也很優秀,成為性別推斷的強大替代方案。雖然 ChatGPT 在多個指標上超越了傳統工具,但 Namsor 和 Gender-API 仍具研究價值,顯示生成語言模型在性別檢測中的潛力。
PubMed
DOI