原始文章

這篇論文介紹了一個新工具 SEMbeddings,結合微調的嵌入模型與潛在測量模型,能在實際數據收集前評估項目反應數據的適配度。作者將其應用於 VIA-IS-P 問卷,分析了 31,697 名參與者的回應,結果顯示項目嵌入的餘弦相似度與實證相關性有顯著關聯 (r = 0.67)。論文也提到,傳統適配指標可能不夠準確,但修正指標能提供潛在不適配的見解,對於問卷開發有幫助。隨著大型語言模型的進步,這些方法有望提升新問卷的開發效率。 PubMed DOI


站上相關主題文章列表

最近,GPT-4在大型語言模型(LLMs)方面的進展,可能會改變社會科學的研究方式。研究探討了GPT-4在模擬擁有不同大五人格特徵的個體的有效性,進行了兩項模擬研究。 第一項模擬顯示,GPT-4生成的個性反應比人類反應更具一致性,且與人類自我報告的分數高度相關,顯示其能有效模仿真實個性。第二項模擬則指出,隨著角色複雜度增加,GPT-4的表現會下降,但加入人口統計信息後,模擬的準確性有所提升。 總體而言,這些結果顯示使用GPT-4創造多樣個性的代理人,對理解人類行為的研究有很大潛力,並為未來的研究提供了新方向。 PubMed DOI

最近,自然語言處理(NLP)在語意數據分析上有了顯著進展,特別是在問卷研究中。研究者開發了一個「語意搜尋助手」的原型,能有效協調不同工具測量相同構念,並探索新構念組合。透過案例研究,該應用成功識別潛在的協調配對,減少了手動評估的需求。專家評估顯示,模型生成的配對與專家意見高度一致,證實了這種方法的有效性,顯示出嵌入模型在協調複雜數據集中的潛力。 PubMed DOI

這項研究探討心理概念重疊的問題,這種重疊讓數據解釋變得複雜,增加了參與者的負擔。研究引入了一種名為嵌入式語義分析方法(ESAA),利用自然語言處理技術檢測心理量表中的冗餘。透過OpenAI的text-embedding-3-large模型,ESAA生成高維語義向量,並用層次聚類識別相似項目。 研究進行了三個實驗,評估ESAA在識別相似項目、區分不同項目及揭示冗餘方面的有效性。結果顯示,ESAA表現穩定且優於基於GPT-4的聊天機器人,顯示其在心理研究中的潛力。 PubMed DOI

這項研究評估了專門的深度神經網絡(如 PersonalityMap)與大型語言模型(如 GPT-4o 和 Claude 3 Opus)在預測人格問卷項目相關性上的有效性。所有 AI 模型的表現都顯著超越大多數普通人和學術專家。透過使用每個群體的中位數預測,可以提升個別預測的準確性,展現「群眾智慧」的效果。結果顯示,PersonalityMap 和學術專家在中位數預測上通常優於 LLMs 和普通人,強調了專門模型在特定任務中的價值。 PubMed DOI

這項案例研究探討大型語言模型(LLMs)在自我發展測量中的應用,這對成人個性成長至關重要。研究評估專家與LLMs生成的自我發展階段分類的一致性,結果顯示加權Kappa值為0.779,顯示出顯著一致性,證明LLMs能有效自動化此過程。不過,在單句分析上仍有改進空間。研究結果顯示,自動化系統能提供穩健的數據,適用於多層次分析,對組織心理學和企業分析具價值。整體而言,這方法論可應用於其他LLMs的分類任務,展現其在文本分析中的潛力。 PubMed DOI

最近大型語言模型(LLMs)的進展引起了對其在生物醫學術語翻譯方面的關注。不過,這些模型的不透明性讓研究人員需依賴人工基準,對模型的實際內容了解有限。我們的研究顯示,預訓練的LLMs能解釋高達51%的神經問題問卷中的遺傳相關性,且無需微調。此外,精神疾病名稱與遺傳關係的對應性比診斷描述更密切。這顯示LLMs能反映遺傳架構,並在心理健康研究中整合文本與遺傳數據方面具潛力。 PubMed DOI

這項研究發現,大型語言模型和文字嵌入模型能從精神科病患的句子完成測驗中,準確辨識憂鬱症和自殺風險,尤其在分析自我概念相關內容時效果最好。最佳模型偵測憂鬱症的AUROC達0.841。雖然AI有潛力協助心理健康評估,但臨床應用前還需要更多改進和安全驗證。 PubMed DOI

傳統質性研究難以驗證假說,因為文字資料不好量化。TESA這個新方法,利用大型語言模型把假說變成搜尋詞,抓出語意嵌入,再跟文本比對相似度。這樣就能用分數分布來做假說檢驗,解決過去方法偏誤和效率低的問題。 PubMed DOI

這項研究用微調過的大型語言模型,把線上辯論中的各種信念轉成神經嵌入,來分析信念間的關聯。這方法能看出信念極化、連結模式,還能預測個人未來可能的信念,並用信念距離估算認知失調。結果顯示,結合語言模型和線上資料,有助於了解人類信念的形成和互動原則。 PubMed DOI

這份指南回顧並比較三種心理學構念的向量化方法:用單字清單、問卷和有標記範例。作者指出,若要分析不同文本類型,建議用單字清單;若文本和問卷內容接近,則用問卷;有大量標記資料時,則用標記範例。指南也提醒研究者注意嵌入模型的特性和潛在方法問題。 PubMed DOI