The Role of Humanization and Robustness of Large Language Models in Conversational Artificial Intelligence for Individuals With Depression: A Critical Analysis.
大型語言模型在對話人工智慧中的人性化和強健性對憂鬱症患者的角色：一個批判性分析。 JMIR Ment Health 2024-07-03

大型語言模型（LLM）應用廣泛，包括心理健康領域。然而，使用LLM強化的對話人工智慧（CAI）協助抑鬱症患者面臨人性化和情境韌性挑戰。觀點論文探討這些挑戰，提出跨學科解決方案，結合哲學、心理學和計算機科學。為了負責地設計和應用LLM增強的CAI支援抑鬱症患者，提出建議。 PubMed DOI

Perils and opportunities in using large language models in psychological research.
在心理研究中使用大型語言模型的風險與機會。 PNAS Nexus 2024-07-17

心理研究中使用大型語言模型(LLMs)引起關注，但「GPTology」的使用限制和風險令人擔憂，可能影響像ChatGPT這樣的模型。我們需了解LLMs在心理研究中的限制、道德問題和潛力，解決其對實證研究的影響。重要的是認識全球心理多樣性，謹慎看待LLMs作為通用解決方案，發展透明方法從AI生成的數據中做可靠推論。多元化人類樣本，擴展心理學方法，確保科學包容可靠，避免同質化和過度依賴LLMs。 PubMed DOI

Fostering effective hybrid human-LLM reasoning and decision making.
促進有效的混合人類-LLM 推理與決策。 Front Artif Intell 2025-01-23

現代大型語言模型（LLMs）引起了廣泛關注，展現出驚人的能力，但有時也會出錯，顯示出人工智慧在日常生活中的潛力與挑戰。雖然許多研究致力於改善這些模型，但人類與LLM的合作動態仍待深入探討。本文強調未來研究應優先考慮人類與LLM的互動，並指出可能妨礙合作的偏見，提出解決方案，並概述促進相互理解及提升團隊表現的研究目標，以改善推理與決策過程。 PubMed DOI

Artificial intelligence speaks upThese Strange New Minds: How AI Learned to Talk and What It Means Christopher Summerfield Viking, 2025. 384 pp.
人工智慧發聲這些奇怪的新思維：AI 如何學會說話及其意義 克里斯多福·薩默菲爾德 Viking, 2025年。384頁。 Science 2025-03-06

作為人工智慧安全專家，我常在創新與謹慎之間掙扎，特別是大型語言模型（LLMs）。這些模型雖然能力驚人，但也引發了社會、倫理和安全的擔憂。主要問題包括生成錯誤資訊的風險，可能被用來製造假新聞或操控輿論；模型中的偏見可能導致不公平對待某些群體；隱私問題則涉及敏感資訊的洩露；過度依賴LLMs可能使使用者做出不良決策。為了應對這些挑戰，需實施強有力的安全措施，並促進開發者、政策制定者和倫理學家的合作，以確保LLMs能以有益和倫理的方式服務人類。 PubMed DOI

作為人工智慧安全專家，我常在創新與謹慎之間掙扎，尤其是面對大型語言模型（LLMs）。這些模型雖然能力驚人，但也引發了社會、倫理和安全的擔憂。主要問題包括生成錯誤資訊的風險，可能削弱公眾對媒體的信任；偏見問題，因訓練數據可能不具代表性；隱私問題，若數據中含有個人資訊；以及過度依賴，可能影響批判性思維。為了應對這些挑戰，開發和部署LLMs時必須重視安全與倫理，並促進研究人員、政策制定者和業界的合作，確保技術能服務於更大公益。 PubMed DOI

The Double-Edged Sword of Anthropomorphism in LLMs †.
大型語言模型中擬人化的雙刃劍。 Proceedings (MDPI) 2025-03-24

這篇論文探討「過度活躍的代理檢測」，指人類在進化中會快速將環境中的威脅歸因於潛在的代理者，例如樹葉沙沙聲可能代表掠食者。這種認知也影響人們與聊天機器人如ChatGPT和Gemini的互動，讓人們傾向擬人化這些技術。作者提到，這種「機器中看到心智」的傾向在教育上有正反兩面。擬人化能提升學習動機，但也可能讓學生過度信任機器人提供的信息，忽略其不準確性。為了應對這些挑戰，論文建議應加強學生的數位素養，幫助他們更好地理解與聊天機器人的互動。 PubMed DOI

Adverse reactions to the use of large language models in social interactions.
大型語言模型於社交互動中使用所引發的不良反應 PNAS Nexus 2025-04-16

研究發現，當人們知道經濟遊戲的夥伴是AI時，會變得比較不信任、不合作，也覺得AI不公平、不可靠。但如果不知道對方是不是AI，這些負面感受就不明顯。大家其實很常讓AI來做決定，而且很難分辨哪些決策是AI還是人做的。 PubMed DOI

Testing the limits of large language models in debating humans.
大型語言模型在人類辯論中的極限測試 Sci Rep 2025-04-22

**重點摘要：** 大型語言模型（LLMs）可以參與以辯論為基礎的社會學實驗，通常比人類更能專注在主題上，進而提升團隊的生產力。不過，人類覺得LLM代理人比較不具說服力，也比較沒有自信，而且這些代理人在辯論時的行為和人類有明顯差異，因此很容易被辨識出是非人類參與者。 PubMed DOI

The Ethics of Speaking (of) AIs Through the Lens of Natural Language.
透過自然語言視角探討人工智慧（AI）發聲的倫理 J Bioeth Inq 2025-05-15

這篇文章用後人類主義角度，探討跟大型語言模型互動時的倫理問題，認為倫理行動力是人跟機器共同產生的。作者批評只用訓練資料來判斷 AI 的道德性太過片面，也提醒大家別把 LLMs 擬人化。文章建議，討論 LLM 倫理時，應該關注語言如何轉化成文化意義，並考慮模型的黑箱特性和開發者的公開說明。最後呼籲大家重新思考人性和倫理的定義。 PubMed DOI

Take caution in using LLMs as human surrogates.
在將 LLMs 作為人類代理時需謹慎。 Proc Natl Acad Sci U S A 2025-06-13

雖然大型語言模型有時能模仿人類回應，但在像 11-20 money request game 這類需要複雜推理的任務上，表現常常和人類差很多，還會受到提示語和安全機制影響，出錯方式也很難預測。所以，社會科學研究如果想用 LLMs 取代人類，真的要特別小心。 PubMed DOI

原始文章

站上相關主題文章列表