原始文章

這項初步研究探討了大型語言模型(LLMs),特別是ChatGPT 3.5和ChatGPT-4,在心智理論(ToM)方面的能力,並與自閉症譜系障礙(ASD)及典型發展(TD)個體進行比較。研究發現: 1. 兩個LLMs在理解心理狀態的準確性上高於ASD組,但ChatGPT-3.5在複雜心理狀態上表現不佳。 2. ChatGPT-3.5在情感狀態識別上低於TD個體,尤其是負面情緒,但與ASD組相似。ChatGPT-4有所改善,但仍難以識別悲傷和憤怒。 3. 兩者的對話風格冗長且重複,類似高功能自閉症個體。 研究顯示LLMs在理解心理和情感狀態的潛力及其局限性,對ASD的臨床應用有影響。 PubMed DOI


站上相關主題文章列表

AI 聊天機器人 ChatGPT 在處理自然語言方面表現很好,越來越多人在使用。研究發現,ChatGPT 的情感意識比一般人好,而且還在進步。有可能可以應用在幫助情感受損者的訓練,對精神疾病診斷和情感語言增強有潛力。但在心理健康領域使用ChatGPT還需要更多研究來探討利弊。 PubMed DOI

研究探討使用ChatGPT語言模型生成心智化回應,針對BPD和SPD人格障礙。ChatGPT能準確反映情緒差異,可模擬心理病理回應。但擔心聊天機器人心理干預可能存在偏見。負責任發展需考慮多元理論框架。 PubMed DOI

生成式人工智慧目前不太用於文本分析,但在評估情緒上有潛力。一研究比較了ChatGPT和LIWC工具的分析結果,發現兩者關聯較小,ChatGPT在22%情況下計算LIWC分析時出錯。這顯示大型語言模型處理詞語和數字可能不可靠,使用時要謹慎。 PubMed DOI

研究比較人類和大型語言模型(LLM)在心智理論任務上的表現,發現像GPT-4這樣的LLM在識別間接要求和虛假信念等任務上表現與或優於人類,但在偵測社交失言方面表現不佳。LLaMA2在社交失言偵測方面表現優於人類,但進一步分析顯示這是由於一種偏見。表現差異歸因於LLM採用保守方法,需要系統性測試才能準確比較人類和人工智能。 PubMed DOI

研究使用ChatGPT改善自閉症相關語言障礙診斷,結果顯示ChatGPT比傳統模型表現更好,有助提高準確性。研究找出自閉症的關鍵語言特徵,如模仿言語和非典型語言使用,可協助制定個人化治療計畫。未來在臨床上應用像ChatGPT這樣的人工智慧工具,或許能革新對自閉症等發展性障礙的評估和診斷方式。 PubMed DOI

這項研究探討了ChatGPT(GPT-3.5和GPT-4)在評估認知表現的有效性,對象包括正常認知者和中風倖存者。90名參與者接受了記憶、數字處理、語言流暢度和抽象思維的評估。主要發現顯示GPT-3.5在記憶和語言評估上與醫生的評估存在顯著差異,但透過優化方法可改善這些差異。GPT-4的表現更接近醫生評分,顯示其在認知評估中有進一步提升的潛力。整體而言,ChatGPT作為醫療評估的輔助工具顯示出潛力。 PubMed DOI

這項研究探討了2023年3月版本的ChatGPT如何回應情感故事,並與人類的情感反應進行比較。三十四位參與者閱讀情感豐富的短篇故事並評估自己的情感反應,而ChatGPT則在十次會議中生成對同樣故事的回應。結果顯示,ChatGPT能識別和分類故事的情感內容,但預測人類情感反應的準確性不高,顯示出AI與人類在情感表達上的差異。了解這些差異對增進與AI的情感互動非常重要。 PubMed DOI

在研究中,我探討了大型語言模型(LLMs),特別是GPT-3.5和GPT-4,對複雜行為科學實驗結果的預測能力。結果顯示,GPT-4在預測情感、性別和社會認知方面,與119位人類專家的表現相當,相關性高達0.89,而GPT-3.5則僅有0.07。在另一項研究中,讓大學參與者與GPT-4驅動的聊天機器人互動,提升了他們的預測準確性。這些結果顯示,人工智慧在預測行為主張的實證支持上,可能成為有價值的工具,並強調人類與AI合作的潛力。 PubMed DOI

研究顯示,ChatGPT-4在使用十項人格量表(TIPI)評估公共人物的人格特質上表現優異,相關係數高達0.76到0.87,顯示其評估結果與人類評審者高度一致。這可能歸因於其廣泛的訓練數據、對語言細微差別的理解、模式識別能力,以及缺乏偏見的反饋。這些發現顯示,ChatGPT-4在心理學、行銷和公共關係等領域具有潛在價值,並引發對AI在社會評估中可靠性的思考,顯示出AI在理解人類行為方面的進步與應用潛力。 PubMed DOI

一項研究評估了十一個大型語言模型(LLMs),使用40個專門的錯誤信念任務,這些任務對於評估人類的心智理論(ToM)非常重要。結果顯示,較舊的模型無法解決任何任務,而GPT-3-davinci-003和ChatGPT-3.5-turbo僅解決了20%。相比之下,ChatGPT-4的成功率達到75%,與6歲兒童的表現相當。這顯示出心智理論的能力可能是LLMs語言能力增強的副產品,預示著更先進的人工智慧的崛起,帶來正負面影響。 PubMed DOI