Shadows of wisdom: Classifying meta-cognitive and morally grounded narrative content via large language models.
智慧的陰影:透過大型語言模型將元認知和道德基礎敘事內容進行分類。
Behav Res Methods 2024-05-29
Large Language Models and the Wisdom of Small Crowds.
大型語言模型與小眾智慧。
Open Mind (Camb) 2024-06-03
研究指出,使用大型語言模型(LLMs)取代人類受試者進行數據收集,引入了新方法「number needed to beat」(NNB),用來評估人類數據質量與頂尖LLM如GPT-4相比的差距。實驗結果顯示,在英語任務中,NNB大於1,但各任務有所不同。結合LLM和人類數據的「centaur」方法被證實比單獨使用更有效。研究考量了數據成本和質量的權衡,建議此框架可協助判斷何時以及如何運用LLM生成的數據。
PubMedDOI
Benchmarking Human-AI Collaboration for Common Evidence Appraisal Tools.
人類與人工智慧合作的基準測試:針對常見證據評估工具。
J Clin Epidemiol 2024-09-14