原始文章

這項研究聚焦於隱性動機,探討影響行為和情感的潛在需求,並與人格特質區分開來。研究團隊開發了機器學習模型,利用85,028句子的數據集來評估權力、成就和歸屬感的需求。結果顯示,這些模型與傳統方法一致性高,內部一致性相關係數分別達到.85、.87和.89。研究還重複經典實驗以驗證模型的有效性,並提供免費的R-package text框架,顯著減少編碼時間,讓隱性動機研究更具可及性。 PubMed DOI


站上相關主題文章列表

文字資料分析廣泛運用,探討人類行為的情感、話語、詞彙和句法。強調跨領域合作,提供Python程式碼進行分析,以ChatGPT 3.5 Turbo為例。有助於語言學、社會學、精神病學和心理學等領域的研究人員了解人類行為的相關文字特徵。 PubMed DOI

線上文章提供價值洞察,手動編碼可靠但限制大數據分析。自動文本分析近似人評估,大型語言模型如GPT-4表現佳。模型複雜度和性能權衡對科學家重要。 PubMed DOI

研究發現,大型語言模型(LLMs)如GPT-4和RoB-ELoC在分類成年人反思職場衝突故事時表現優異,比人類編碼者更可靠。RoB-ELoC和少樣本GPT-4特別適合作為分類器。LLMs能自動化編碼社會科學研究中的複雜概念,有助整合到研究流程中。 PubMed DOI

這項研究探討生成式人工智慧(GenAI),特別是ChatGPT和Bard,在數位健康介入中對文本數據質性分析的影響。研究分析了40條針對HIV患者的SMS提醒,發現GenAI與人類編碼者的主題一致性為71%,但在演繹分析中,ChatGPT降至50%,Bard為58%。雖然GenAI能顯著縮短分析時間至20分鐘,但在人類編碼者在細緻主題識別上表現更佳。研究建議結合人類洞察與AI效率,以提升質性研究的效果,並強調未來需關注AI使用的倫理問題。 PubMed DOI

在研究中,我探討了大型語言模型(LLMs),特別是GPT-3.5和GPT-4,對複雜行為科學實驗結果的預測能力。結果顯示,GPT-4在預測情感、性別和社會認知方面,與119位人類專家的表現相當,相關性高達0.89,而GPT-3.5則僅有0.07。在另一項研究中,讓大學參與者與GPT-4驅動的聊天機器人互動,提升了他們的預測準確性。這些結果顯示,人工智慧在預測行為主張的實證支持上,可能成為有價值的工具,並強調人類與AI合作的潛力。 PubMed DOI

這項研究評估了專門的深度神經網絡(如 PersonalityMap)與大型語言模型(如 GPT-4o 和 Claude 3 Opus)在預測人格問卷項目相關性上的有效性。所有 AI 模型的表現都顯著超越大多數普通人和學術專家。透過使用每個群體的中位數預測,可以提升個別預測的準確性,展現「群眾智慧」的效果。結果顯示,PersonalityMap 和學術專家在中位數預測上通常優於 LLMs 和普通人,強調了專門模型在特定任務中的價值。 PubMed DOI

這項研究探討了人工智慧在敘事人格評估中的潛力,特別是使用社會認知與物件關係量表 - 總體評分法(SCORS-G)。研究發現,透過精煉的提示,AI聊天機器人能更準確地評估敘事,尤其在總體層面上表現良好。專家們改進的提示在評估者間的可靠性和與既定評分的一致性上優於基本提示。總體來說,這顯示AI能有效減輕臨床醫生和研究人員在使用SCORS-G時的時間和資源負擔,並提出未來研究的方向。 PubMed DOI

這項案例研究探討大型語言模型(LLMs)在自我發展測量中的應用,這對成人個性成長至關重要。研究評估專家與LLMs生成的自我發展階段分類的一致性,結果顯示加權Kappa值為0.779,顯示出顯著一致性,證明LLMs能有效自動化此過程。不過,在單句分析上仍有改進空間。研究結果顯示,自動化系統能提供穩健的數據,適用於多層次分析,對組織心理學和企業分析具價值。整體而言,這方法論可應用於其他LLMs的分類任務,展現其在文本分析中的潛力。 PubMed DOI

這項研究探討大型語言模型(LLM)在質性研究中的應用,特別是針對自殺的心理社會驗屍。研究進行了38次半結構式訪談,評估LLM在編碼和總結自殺喪失者訪談數據的能力。結果顯示,LLM與人類研究者在二元分類上有高一致性(準確率0.84),總結的評價也有80%為正面。研究建議將LLM與人類審查結合,以提高效率,並呼籲未來在不同背景下進一步探索這些發現。 PubMed DOI

這項研究發現,經過優化指令後,AI語言模型在辨識故事中的人際情緒調節策略,準確度已接近人工,但在不同情緒和策略上仍有落差。研究強調AI分析敘事資料有潛力,但設計指令和驗證結果時要特別小心。 PubMed DOI