Scale matters: Large language models with billions (rather than millions) of parameters better match neural representations of natural language.
規模重要性：擁有數十億（而非數百萬）參數的大型語言模型更能匹配自然語言的神經表徵。 bioRxiv 2024-07-15

最新研究利用先進語言模型研究人腦處理語言方式。模型提升語言能力，但神經科學研究未跟上。研究者用不同大小模型觀察其捕捉大腦語言資訊能力，發現大模型預測神經活動較佳。研究指出，隨模型增大，最佳神經信號預測層轉移到較早層，顯示大腦處理語言有組織層次結構。 PubMed DOI

Large language models have divergent effects on self-perceptions of mind and the attributes considered uniquely human.
大型語言模型對自我心智感知及被認為是獨特人類特徵的影響存在差異。 Conscious Cogn 2024-08-08

這項研究探討接觸大型語言模型（LLMs）對個體自我認知及他人認知的影響，特別是心智感知的角度。參與者在與LLMs互動前後，評估自己的行動能力和經驗能力。結果顯示，接觸LLMs後，參與者對自身能力的評價提高，並認為這些特質對人類不再獨特。這顯示擬人化LLMs可能增強個體對自我心智的看法，並減少這些特質被視為人類專有的感知，進而引發對擬人化影響的更深思考。 PubMed DOI

Symbol ungrounding: what the successes (and failures) of large language models reveal about human cognition.
符號去根：大型語言模型的成功（與失敗）揭示了人類認知的哪些面向。 Philos Trans R Soc Lond B Biol Sci 2024-08-19

這篇論文探討大型語言模型（LLMs）與人類語意理解的關係，特別是在具身認知的背景下。具身認知的支持者認為，LLMs 只依賴文本訓練，缺乏感官經驗的連結，這對人類理解很重要。不過，論文指出人類的認知結合了具身經驗和語言學習，語言在塑造我們對世界的理解中扮演關鍵角色。因此，LLMs 可以反映語言作為語意信息來源的豐富性，並強調語言如何在缺乏直接感官經驗的情況下增強認知能力，這也有助於理解具身認知與人工智慧的互動。 PubMed DOI

The Limitations of Large Language Models for Understanding Human Language and Cognition.
大型語言模型在理解人類語言和認知方面的局限性。 Open Mind (Camb) 2024-09-04

這段論述指出大型語言模型（LLMs）在理解人類語言的學習與演變上有其限制。主要有兩個觀點： 1. **功能與機制的差異**：雖然LLMs能生成類似人類的語言，但其學習過程與人類不同。人類透過多種感官互動學習語言，而LLMs主要依賴文本數據，這使得它們的相似性只是表面現象。 2. **語言行為的範疇**：人類的語言使用範圍更廣，而LLMs的設計限制了它們對語言意義的理解及自然互動的能力。因此，LLMs應被視為輔助語言研究的工具，而非語言理論本身，這強調了謹慎應用的必要性。 PubMed DOI

Large language models predict human sensory judgments across six modalities.
大型語言模型預測人類在六種感官模式下的判斷。 Sci Rep 2024-09-13

這項研究探討大型語言模型，特別是GPT-4，如何從語言中恢復感知資訊，這在哲學和認知科學中非常重要。研究分析了六個心理物理數據集，發現GPT-4的判斷與人類數據相符，能捕捉到感知表徵，如色輪和音高螺旋。值得注意的是，GPT-4在視覺任務上的表現並未顯著提升，因為它同時接受視覺和語言訓練。此外，研究還檢視了多語言的顏色命名任務，顯示GPT-4能反映英語和俄語之間的變異，突顯語言與感知的複雜關係。 PubMed DOI

Deanthropomorphising NLP: Can a language model be conscious?
去人性化的自然語言處理：語言模型能夠意識到自己嗎？ PLoS One 2024-12-04

這篇文章探討了大型語言模型（LLMs），特別是基於Transformer的LaMDA模型，是否具備感知能力。雖然這些主張可能影響自然語言處理（NLP）領域，但作者認為LLMs並不具備意識，也沒有證據支持相反的看法。他們利用資訊理論分析Transformer架構，並指出將這些模型擬人化的趨勢。作者強調，這是反思語言建模進展及其倫理意涵的重要時刻，並提供了NLP基礎知識，幫助讀者理解。 PubMed DOI

Using large language models to estimate features of multi-word expressions: Concreteness, valence, arousal.
使用大型語言模型來估計多詞表達的特徵：具體性、價值、喚起。 Behav Res Methods 2024-12-05

這項研究探討大型語言模型（LLMs）在評估多字表達的具體性、價值性和喚起性方面的效果。與早期的人工智慧方法相比，LLMs能更好地捕捉這些表達的細微意義。研究中，GPT-4o在預測情感和感官維度的表現上，與人類評分有強烈相關性（r = .8）。後續研究也顯示其在價值性和喚起性評分上有類似的強相關性，表現優於以往的人工智慧模型。此外，研究提供了一個包含126,397個單字和63,680個多字表達的數據集，幫助研究人員選擇刺激材料。 PubMed DOI

Language-specific representation of emotion-concept knowledge causally supports emotion inference.
情感概念知識的語言特定表徵因果支持情感推理。 iScience 2024-12-13

這項研究探討語言與情感理解的關聯，利用大型語言模型（LLMs）來分析語言如何影響AI在新情境中推斷情感。研究人員找出了十四個與人類情感相關的獨特屬性，並發現這些屬性由特定神經元群體表徵。透過操控這些神經元，研究證明情感知識對生成情感推論至關重要。結果顯示，LLMs能透過語言學習情感，而不需依賴感官或運動經驗，語言知識對情感推論非常重要。 PubMed DOI

A survey on multimodal large language models.
關於多模態大型語言模型的調查。 Natl Sci Rev 2024-12-16

這篇論文探討了多模態大型語言模型（MLLMs）的最新進展，特別是像GPT-4V這類結合語言處理與多模態任務的模型。作者強調了MLLMs的獨特能力，例如從圖像生成敘事及進行複雜推理，顯示出朝向人工通用智慧的潛力。論文提供了MLLMs的全面概述，包括架構、訓練策略和評估方法，並探討了增強其適應性的方法。此外，還討論了多模態幻覺等問題及未來研究方向，以提升MLLM的能力。 PubMed DOI

Urban sensing in the era of large language models.
大型語言模型時代的城市感知。 Innovation (Camb) 2025-01-28

隨著城市成為人類活動的核心，城市感知的重要性日益提升。大型語言模型（LLMs）透過其語言框架，為城市感知帶來新機會。本文探討LLMs在理解城市機制上的潛力，重點在於改善人類與LLMs的知識轉移、提升對城市運作的認識，以及透過LLM代理實現自動化決策。雖然LLMs能提供更深入的城市動態理解，但也面臨多模態數據整合、時空推理、文化適應性和隱私等挑戰。未來的城市感知需善用LLMs的智慧，並克服這些挑戰，以促進智能和可持續的城市發展。 PubMed DOI

原始文章

站上相關主題文章列表