Dissociating language and thought in large language models.
大型語言模型中語言和思維的分離。 Trends Cogn Sci 2024-03-20

大型語言模型（LLMs）在理解語言方面有進展，但在語言能力和認知方面看法不同。研究評估LLMs的形式語言能力和功能語言能力，人類神經科學顯示這兩種能力依賴不同神經機制。LLMs在形式能力表現優異，但在功能任務上表現不穩，可能需要額外調整或外部模組。為了達到人類般的語言使用，模型可能需掌握兩種能力，並提供專門機制。 PubMed DOI

(Ir)rationality and cognitive biases in large language models.
大型語言模型中的（不）理性與認知偏誤。 R Soc Open Sci 2024-08-05

這篇論文探討大型語言模型（LLMs）的理性推理能力，評估它們在認知心理學任務中的表現。研究發現，LLMs展現出與人類相似的非理性，但其非理性特徵與人類偏見不同。當LLMs給出錯誤答案時，這些錯誤不符合典型的人類偏見，顯示出獨特的非理性。此外，這些模型的回應顯示出顯著的不一致性，進一步增添了非理性的層面。論文也提出了評估和比較LLMs理性推理能力的方法論貢獻。 PubMed DOI

The Limitations of Large Language Models for Understanding Human Language and Cognition.
大型語言模型在理解人類語言和認知方面的局限性。 Open Mind (Camb) 2024-09-04

這段論述指出大型語言模型（LLMs）在理解人類語言的學習與演變上有其限制。主要有兩個觀點： 1. **功能與機制的差異**：雖然LLMs能生成類似人類的語言，但其學習過程與人類不同。人類透過多種感官互動學習語言，而LLMs主要依賴文本數據，這使得它們的相似性只是表面現象。 2. **語言行為的範疇**：人類的語言使用範圍更廣，而LLMs的設計限制了它們對語言意義的理解及自然互動的能力。因此，LLMs應被視為輔助語言研究的工具，而非語言理論本身，這強調了謹慎應用的必要性。 PubMed DOI

Studying and improving reasoning in humans and machines.
研究與改善人類和機器的推理能力。 Commun Psychol 2024-09-06

這項研究探討大型語言模型（LLMs）與人類的推理能力，使用有限理性的認知心理學工具進行比較。實驗中，我們分析了人類參與者和不同預訓練LLMs在經典認知任務上的表現。結果顯示，許多LLMs的推理錯誤與人類相似，且受到啟發式影響。然而，深入分析後發現，人類與LLMs的推理存在顯著差異，較新的LLMs表現出更少的限制。雖然可以提升表現的策略存在，但人類和LLMs對提示技術的反應卻不同。我們討論了這些發現對人工智慧及認知心理學的意義，特別是在比較人類與機器行為的挑戰上。 PubMed DOI

Fostering effective hybrid human-LLM reasoning and decision making.
促進有效的混合人類-LLM 推理與決策。 Front Artif Intell 2025-01-23

現代大型語言模型（LLMs）引起了廣泛關注，展現出驚人的能力，但有時也會出錯，顯示出人工智慧在日常生活中的潛力與挑戰。雖然許多研究致力於改善這些模型，但人類與LLM的合作動態仍待深入探討。本文強調未來研究應優先考慮人類與LLM的互動，並指出可能妨礙合作的偏見，提出解決方案，並概述促進相互理解及提升團隊表現的研究目標，以改善推理與決策過程。 PubMed DOI

How should the advancement of large language models affect the practice of science?
大型語言模型的進步應如何影響科學實踐？ Proc Natl Acad Sci U S A 2025-01-27

將大型語言模型（LLMs）整合進科學工作流程中，既有機會也有挑戰。四組科學家提供不同觀點：Schulz等人認為LLMs能提升研究生產力；Bender等人警告過度炒作，主張專注於可解釋的專用工具；Marelli等人強調透明性與負責任使用，呼籲標示LLMs貢獻；Botvinick和Gershman則認為人類應對科學探究負最終責任。這場對話旨在確保LLMs的使用能提升科學實踐，同時維持倫理與問責。 PubMed DOI

On explaining recommendations with Large Language Models: a review.
關於使用大型語言模型解釋建議的綜述。 Front Big Data 2025-02-11

這篇論文探討大型語言模型（LLMs），像是LLaMA和ChatGPT，如何增強推薦系統的可解釋性。文中強調清晰解釋對建立用戶信任和透明度的重要性。作者進行了系統性文獻回顧，聚焦於2022年11月至2024年11月的研究，發現232篇文章中僅有六篇直接探討LLMs在推薦系統中生成解釋的研究，顯示整合仍在初期階段。論文分析這些研究，探討當前方法、挑戰及未來研究方向，強調LLMs在改善推薦解釋和以用戶為中心的解決方案上的潛力。 PubMed DOI

Large language models and psychiatry.
大型語言模型與精神醫學。 Int J Law Psychiatry 2025-02-28

生成式人工智慧和大型語言模型（LLMs），如GPT-4，對臨床醫學和認知心理學影響深遠。這些模型在理解和生成語言方面表現優異，能改善臨床決策和心理諮詢。雖然LLMs在類比推理和隱喻理解上表現良好，但在因果推理和複雜規劃上仍有挑戰。本文探討LLMs的認知能力及其在心理測試中的表現，並討論其在認知心理學和精神醫學的應用、限制及倫理考量，強調進一步研究的重要性，以釋放其潛力。 PubMed DOI

[Technical foundations of large language models].
大型語言模型的技術基礎 Radiologie (Heidelb) 2025-03-10

大型語言模型（LLMs）如ChatGPT已經改變了人機互動和語言分析。這些模型基於自然語言處理和機器學習的進步，特別是變壓器模型的引入，能更有效理解上下文。 LLMs的訓練過程分為預訓練和監督式微調，讓模型學習語法和推理能力。然而，它們也有缺陷，常生成聽起來合理但不正確的資訊，可能誤導使用者。因此，在使用LLMs時，特別是在敏感領域如放射學，必須謹慎評估其輸出。 PubMed DOI

(How) Do reasoning models reason?
（如何）推理模型是如何推理的？ Ann N Y Acad Sci 2025-04-13

大型推理模型如OpenAI的GPT系列和DeepSeek的R1，顯示了人工智慧在自然語言處理上的重大進展。這些模型能理解和生成類似人類的文本，應用範圍廣泛，從聊天機器人到內容創作。它們的力量來自於龐大的參數和訓練數據，但常被誤解為具有人類理解能力，實際上只是基於模式生成回應。此外，它們在上下文理解和常識推理上仍有局限，且表現依賴於訓練數據的質量。總之，應理性看待這些模型的潛力與限制。 PubMed DOI

原始文章

站上相關主題文章列表