Semantic search helper: A tool based on the use of embeddings in multi-item questionnaires as a harmonization opportunity for merging large datasets - A feasibility study.
基於多項問卷中嵌入技術的語義搜尋助手：作為合併大型數據集的協調機會的可行性研究。 Eur Psychiatry 2025-01-20

最近，自然語言處理（NLP）在語意數據分析上有了顯著進展，特別是在問卷研究中。研究者開發了一個「語意搜尋助手」的原型，能有效協調不同工具測量相同構念，並探索新構念組合。透過案例研究，該應用成功識別潛在的協調配對，減少了手動評估的需求。專家評估顯示，模型生成的配對與專家意見高度一致，證實了這種方法的有效性，顯示出嵌入模型在協調複雜數據集中的潛力。 PubMed DOI

Human-interpretable clustering of short text using large language models.
使用大型語言模型進行短文本的人類可解釋聚類。 R Soc Open Sci 2025-01-23

短文本聚類面臨詞彙共現的挑戰，但研究顯示大型語言模型（LLMs）能有效生成嵌入，捕捉語義細微差異，改善聚類結果。透過高斯混合模型，聚類效果比傳統方法如doc2vec和潛在狄利克雷分配更明顯且易解釋。人類評審和生成型LLM的驗證顯示高一致性，顯示LLM能縮短聚類產出與解釋的距離。此外，LLM與人類編碼的比較揭示了兩者的偏見，質疑傳統將人類編碼視為最終標準的做法。 PubMed DOI

An Embedding-Based Semantic Analysis Approach: A Preliminary Study on Redundancy Detection in Psychological Concepts Operationalized by Scales.
基於嵌入的語義分析方法：心理概念中由量表操作化的冗餘檢測初步研究。 J Intell 2025-01-24

這項研究探討心理概念重疊的問題，這種重疊讓數據解釋變得複雜，增加了參與者的負擔。研究引入了一種名為嵌入式語義分析方法（ESAA），利用自然語言處理技術檢測心理量表中的冗餘。透過OpenAI的text-embedding-3-large模型，ESAA生成高維語義向量，並用層次聚類識別相似項目。研究進行了三個實驗，評估ESAA在識別相似項目、區分不同項目及揭示冗餘方面的有效性。結果顯示，ESAA表現穩定且優於基於GPT-4的聊天機器人，顯示其在心理研究中的潛力。 PubMed DOI

SEMbeddings: how to evaluate model misfit before data collection using large-language models.
SEMbeddings：如何在數據收集之前使用大型語言模型評估模型不適合性。 Front Psychol 2025-02-19

這篇論文介紹了一個新工具 SEMbeddings，結合微調的嵌入模型與潛在測量模型，能在實際數據收集前評估項目反應數據的適配度。作者將其應用於 VIA-IS-P 問卷，分析了 31,697 名參與者的回應，結果顯示項目嵌入的餘弦相似度與實證相關性有顯著關聯 (r = 0.67)。論文也提到，傳統適配指標可能不夠準確，但修正指標能提供潛在不適配的見解，對於問卷開發有幫助。隨著大型語言模型的進步，這些方法有望提升新問卷的開發效率。 PubMed DOI

Deductively coding psychosocial autopsy interview data using a few-shot learning large language model.
使用少量學習的大型語言模型對心理社會驗屍訪談數據進行演繹編碼。 Front Public Health 2025-03-06

這項研究探討大型語言模型（LLM）在質性研究中的應用，特別是針對自殺的心理社會驗屍。研究進行了38次半結構式訪談，評估LLM在編碼和總結自殺喪失者訪談數據的能力。結果顯示，LLM與人類研究者在二元分類上有高一致性（準確率0.84），總結的評價也有80%為正面。研究建議將LLM與人類審查結合，以提高效率，並呼籲未來在不同背景下進一步探索這些發現。 PubMed DOI

The use of large language models for qualitative research: The Deep Computational Text Analyser (DECOTA).
大型語言模型在質性研究中的應用：深度計算文本分析器 (DECOTA)。 Psychol Methods 2025-04-07

深度計算文本分析器（DECOTA）是一種新型機器學習工具，能自動分析大量自由文本數據，幫助研究人員和政策制定者更有效地了解公眾意見。透過結構主題建模和精細調整的語言模型，DECOTA能快速識別關鍵主題和代碼，無需大量人力。與傳統方法相比，DECOTA的速度快378倍，成本低1,920倍，且與人類編碼結果高度一致，對於基於證據的政策制定和公眾參與具有重要意義。 PubMed DOI

Using large language models to facilitate academic work in the psychological sciences.
運用大型語言模型促進心理科學的學術工作 Curr Psychol 2025-05-29

大型語言模型在心理科學等學術領域越來越重要，能協助教學、寫作和模擬人類行為。雖然帶來不少好處，但也有倫理和實務上的挑戰。這份摘要整理了最新進展、最佳做法，並提出未來發展方向，幫助學界更負責任且有效地運用LLMs。 PubMed DOI

A semantic embedding space based on large language models for modelling human beliefs.
基於大型語言模型的人類信念語意嵌入空間 Nat Hum Behav 2025-06-04

這項研究用微調過的大型語言模型，把線上辯論中的各種信念轉成神經嵌入，來分析信念間的關聯。這方法能看出信念極化、連結模式，還能預測個人未來可能的信念，並用信念距離估算認知失調。結果顯示，結合語言模型和線上資料，有助於了解人類信念的形成和互動原則。 PubMed DOI

Neural text embeddings in psychological research: A guide with examples in R.
心理學研究中的神經文本嵌入：以 R 語言為例的指南 Psychol Methods 2025-06-12

這份指南回顧並比較三種心理學構念的向量化方法：用單字清單、問卷和有標記範例。作者指出，若要分析不同文本類型，建議用單字清單；若文本和問卷內容接近，則用問卷；有大量標記資料時，則用標記範例。指南也提醒研究者注意嵌入模型的特性和潛在方法問題。 PubMed DOI

A large-scale replication of scenario-based experiments in psychology and management using large language models.
使用大型語言模型進行心理學與管理學情境式實驗的大規模重複研究 Nat Comput Sci 2025-07-09

大型語言模型能準確重現多數心理學實驗，效果有時甚至比真人還明顯。不過，遇到社會敏感議題或原研究沒發現效果時，模型容易高估結果。LLMs 適合做初步、快速研究，但遇到複雜或敏感議題，還是得靠真人參與才能更全面。 PubMed DOI

原始文章

站上相關主題文章列表