The plausibility machine commonsense (PMC) dataset: A massively crowdsourced human-annotated dataset for studying plausibility in large language models.
可行性機器常識 (PMC) 數據集:一個大規模眾包的人類標註數據集,用於研究大型語言模型中的可行性。
Data Brief 2024-09-19
Crowdsourcing with Enhanced Data Quality Assurance: An Efficient Approach to Mitigate Resource Scarcity Challenges in Training Large Language Models for Healthcare.
透過增強資料品質保證的眾包:在醫療保健領域訓練大型語言模型以緩解資源稀缺挑戰的有效方法。
AMIA Jt Summits Transl Sci Proc 2024-06-03
Large Language Models and the Wisdom of Small Crowds.
大型語言模型與小眾智慧。
Open Mind (Camb) 2024-06-03
研究指出,使用大型語言模型(LLMs)取代人類受試者進行數據收集,引入了新方法「number needed to beat」(NNB),用來評估人類數據質量與頂尖LLM如GPT-4相比的差距。實驗結果顯示,在英語任務中,NNB大於1,但各任務有所不同。結合LLM和人類數據的「centaur」方法被證實比單獨使用更有效。研究考量了數據成本和質量的權衡,建議此框架可協助判斷何時以及如何運用LLM生成的數據。
PubMedDOI
Assessing novelty, feasibility and value of creative ideas with an unsupervised approach using GPT-4.
使用 GPT-4 的無監督方法評估創意的創新性、可行性和價值。
Br J Psychol 2024-07-22