Diminished diversity-of-thought in a standard large language model.
標準大型語言模型中思想多樣性的減少。 Behav Res Methods 2024-01-09

研究發現GPT-3.5在模擬人類行為上有限制，容易出現「正確答案」效應。即使改變資料或答案，結果仍一致。有研究顯示GPT-3.5傾向右派價值觀。這顯示在社會科學中使用大型語言模型存在挑戰，也引發對未來由AI主導可能帶來的思想單一性的擔憂。 PubMed DOI

Framework-based qualitative analysis of free responses of Large Language Models: Algorithmic fidelity.
大型語言模型自由回應的基於框架的定性分析：演算法忠實度。 PLoS One 2024-03-15

研究使用大型生成式語言模型模擬質性研究中的面試問題回答，發現LLM生成的內容與人類看法有相似之處，但結構和語氣有差異。結論指出目前LLMs缺乏算法忠實度，無法廣泛應用於真實人群，但未來或有改善。強調建立評估基於LLM的質性研究有效性規範的重要性，尤其是代表多樣人類經驗。 PubMed DOI

An evolutionary model of personality traits related to cooperative behavior using a large language model.
使用大型語言模型建立與合作行為相關的人格特質演化模型 Sci Rep 2024-03-23

研究使用大型語言模型模擬人類在博弈理論中的行為選擇，探討合作行為特質的演化。模型基於平均報酬和基因突變，演化出合作或自私行為族群。結果顯示，模型能模擬多樣人格表徵下的合作行為演化，並產生合作和自私特質。基因反映個性行為傾向，影響個體行為和演化。 PubMed DOI

Assessing the Alignment of Large Language Models With Human Values for Mental Health Integration: Cross-Sectional Study Using Schwartz's Theory of Basic Values.
評估大型語言模型與人類價值觀在精神健康整合方面的一致性：使用施瓦茨基本價值理論的橫斷面研究。 JMIR Ment Health 2024-04-09

研究使用Schwartz的基本價值理論評估大型語言模型（LLMs）中的價值構念，發現LLMs存在動機偏見，與人類價值有所偏離，對心理健康應用存在道德疑慮。研究強調透明度和對齊過程的重要性，以確保LLMs在提供心理健康護理時公平。 PubMed DOI

Exploring variability in risk taking with large language models.
使用大型語言模型探索風險承擔的變異性。 J Exp Psychol Gen 2024-05-02

心理學家利用心理測量方法研究不同情境下個人風險行為的差異。文章提出結合大型語言模型（LLMs）來量化風險行為和決策模型，以解釋行為和個人之間的相關性。這種方法可預測行為、解釋原因，並用心理術語解釋，提供對日常行為異質性的洞察。 PubMed DOI

Large language models can infer psychological dispositions of social media users.
大型語言模型可以推斷社交媒體使用者的心理傾向。 PNAS Nexus 2024-07-01

研究探討大型語言模型如ChatGPT是否能從社群媒體貼文推斷人格特質，結果顯示模型可準確推斷大五人格特質，尤其對女性和年輕人更準確。這種能力或許讓心理評估更普及，但也引發隱私和監管疑慮。 PubMed DOI

The Role of Humanization and Robustness of Large Language Models in Conversational Artificial Intelligence for Individuals With Depression: A Critical Analysis.
大型語言模型在對話人工智慧中的人性化和強健性對憂鬱症患者的角色：一個批判性分析。 JMIR Ment Health 2024-07-03

大型語言模型（LLM）應用廣泛，包括心理健康領域。然而，使用LLM強化的對話人工智慧（CAI）協助抑鬱症患者面臨人性化和情境韌性挑戰。觀點論文探討這些挑戰，提出跨學科解決方案，結合哲學、心理學和計算機科學。為了負責地設計和應用LLM增強的CAI支援抑鬱症患者，提出建議。 PubMed DOI

Strategic behavior of large language models and the role of game structure versus contextual framing.
大型語言模型的策略行為及遊戲結構與情境框架的角色。 Sci Rep 2024-08-09

這篇論文探討大型語言模型（LLMs）如GPT-3.5、GPT-4和LLaMa-2在博弈理論中的策略行為，並分析遊戲結構與背景對決策的影響。研究發現： - **GPT-3.5** 對背景敏感，但抽象策略思考較弱。 - **GPT-4** 專注於遊戲內部機制，對背景敏感度低，區分遊戲類型較粗略。 - **LLaMa-2** 在理解遊戲結構與考量背景上取得平衡，處理複雜策略情境時更具優勢。總體來看，LLaMa-2在整合遊戲結構與背景方面表現最佳，而GPT-4則偏向一般化的結構策略。 PubMed DOI

Strong and weak alignment of large language models with human values.
大型語言模型與人類價值觀的強對齊與弱對齊。 Sci Rep 2024-08-21

這段文字探討了人工智慧系統與人類價值觀對齊的挑戰，區分了強價值對齊和弱價值對齊。強對齊需要高級認知能力，讓人工智慧理解意圖並建立因果關聯，這對識別潛在風險至關重要。作者指出像ChatGPT、Gemini和Copilot等模型在這方面的不足，並分析了詞嵌入的差異。文中提出「帶有詞彙轉換字典的中文房間」的思想實驗，進一步探討這些概念。最後提到的研究旨在實現弱對齊，雖然能產生可接受的回應，但不保證其真實性。 PubMed DOI

Cultural bias and cultural alignment of large language models.
大型語言模型的文化偏見與文化對齊。 PNAS Nexus 2024-09-18

這項研究探討生成式人工智慧模型中的文化偏見，特別是五個版本的OpenAI語言模型如何影響使用者表達並強化主導文化價值觀。研究發現，這些模型多反映英語系和新教歐洲國家的文化。為解決這問題，研究人員測試了一種叫做文化提示的方法，結果顯示這方法能改善後期模型（如GPT-4）在71-81%的評估地區的文化一致性。研究建議持續使用文化提示和評估，以減少生成式人工智慧中的文化偏見。 PubMed DOI

原始文章

站上相關主題文章列表