AI Psychometrics: Assessing the Psychological Profiles of Large Language Models Through Psychometric Inventories.
AI心理測量學:透過心理測量庫評估大型語言模型的心理特徵。
Perspect Psychol Sci 2024-01-02
Beyond rating scales: With targeted evaluation, large language models are poised for psychological assessment.
超越評分量表:透過有針對性的評估,大型語言模型準備好進行心理評估。
Psychiatry Res 2024-02-19
A comprehensive evaluation of large Language models on benchmark biomedical text processing tasks.
大型語言模型在基準生物醫學文本處理任務上的全面評估。
Comput Biol Med 2024-03-21
Assessing the Efficacy of Large Language Models in Health Literacy: A Comprehensive Cross-Sectional Study.
評估大型語言模型在健康識字能力中的功效:一項全面的橫斷面研究。
Yale J Biol Med 2024-04-03
Integrating human expertise & automated methods for a dynamic and multi-parametric evaluation of large language models' feasibility in clinical decision-making.
將人類專業知識與自動化方法整合,以動態和多參數評估大型語言模型在臨床決策中的可行性。
Int J Med Inform 2024-05-29
Expansive data, extensive model: Investigating discussion topics around LLM through unsupervised machine learning in academic papers and news.
廣泛的數據,龐大的模型:通過非監督式機器學習在學術論文和新聞中探討 LLM 的討論主題。
PLoS One 2024-05-31
研究探討2020年6月1日至2023年12月31日期間,針對大型語言模型(LLMs)的主題建模方法。使用Web of Science和LexisNexis數據,聚焦於"Large language model"、"LLM"和"ChatGPT"等LLMs。評估LDA、NMF、CTM和BERTopic等方法,發現BERTopic表現最佳。新聞報導著重LLM應用,學術論文則更專業。研究提供LLMs未來挑戰見解,對LLM服務業者有幫助。
PubMedDOI
The political preferences of LLMs.
LLMs 的政治偏好。
PLoS One 2024-07-31
Harnessing LLMs for multi-dimensional writing assessment: Reliability and alignment with human judgments.
利用大型語言模型進行多維寫作評估:可靠性及與人類評價的一致性。
Heliyon 2024-08-08
Large Language Models, scientific knowledge and factuality: A framework to streamline human expert evaluation.
大型語言模型、科學知識與事實性:一個簡化人類專家評估的框架。
J Biomed Inform 2024-09-14