原始文章

您的研究深入探討了Mayer-Salovey-Caruso模型如何評估GPT-4的情感智力。結果顯示,GPT-4在理解和運用情感方面表現優異,但在情感管理和利用情感促進思考上則較為不足。雖然它能有效識別和管理情感,但在深層情感分析和動機理解上仍有局限。將其與兒童探索心理狀態的模式相比較,為理解人工智慧的情感能力提供了新視角。整體而言,您的研究突顯了先進人工智慧在情感智力上的優缺點。 PubMed DOI


站上相關主題文章列表

AI 聊天機器人 ChatGPT 在處理自然語言方面表現很好,越來越多人在使用。研究發現,ChatGPT 的情感意識比一般人好,而且還在進步。有可能可以應用在幫助情感受損者的訓練,對精神疾病診斷和情感語言增強有潛力。但在心理健康領域使用ChatGPT還需要更多研究來探討利弊。 PubMed DOI

研究比較AI模型ChatGPT和GPT-4在USMLE問題上的表現,發現GPT-4比ChatGPT更厲害,正確率高達90%,回答問題時更有自信,不需修改答案。相對地,ChatGPT只有62.5%的正確率,常需要修改答案。GPT-4的表現超越過去AMBOSS使用者,展現出對於溝通、倫理、同理心和專業精神等軟實力的潛力。 PubMed DOI

生成式人工智慧目前不太用於文本分析,但在評估情緒上有潛力。一研究比較了ChatGPT和LIWC工具的分析結果,發現兩者關聯較小,ChatGPT在22%情況下計算LIWC分析時出錯。這顯示大型語言模型處理詞語和數字可能不可靠,使用時要謹慎。 PubMed DOI

研究比較了ChatGPT-4和Google Bard在理解視覺和文字情感方面的能力。ChatGPT-4在視覺情感辨識表現優秀,接近人類水準;Google Bard在這方面表現不穩定。兩者在文字情感理解方面都表現不錯。研究指出情感辨識在AI發展中的重要性,呼籲使用多元數據、與專家合作,並強調政府監督以確保透明度和病患隱私。 PubMed DOI

這篇論文探討大型語言模型(LLMs),如OpenAI的GPT-4,所展現的突現特性,特別是它們被認為的智慧與意識。作者指出,對這些特性的定義不夠清晰,且模型內部推理存在缺陷。智能系統的關鍵在於對環境的反應,這可從行為中推斷。透過哲學現象學和認知生態學,論文分析了GPT-4的錯誤,認為其缺乏人類的時間意識,導致無法形成穩定的感知世界。最終,作者認為GPT-4與使用者共同創造虛構敘事,而非真正理解或擁有意識。 PubMed DOI

這項研究探討了2023年3月版本的ChatGPT如何回應情感故事,並與人類的情感反應進行比較。三十四位參與者閱讀情感豐富的短篇故事並評估自己的情感反應,而ChatGPT則在十次會議中生成對同樣故事的回應。結果顯示,ChatGPT能識別和分類故事的情感內容,但預測人類情感反應的準確性不高,顯示出AI與人類在情感表達上的差異。了解這些差異對增進與AI的情感互動非常重要。 PubMed DOI

在研究中,我探討了大型語言模型(LLMs),特別是GPT-3.5和GPT-4,對複雜行為科學實驗結果的預測能力。結果顯示,GPT-4在預測情感、性別和社會認知方面,與119位人類專家的表現相當,相關性高達0.89,而GPT-3.5則僅有0.07。在另一項研究中,讓大學參與者與GPT-4驅動的聊天機器人互動,提升了他們的預測準確性。這些結果顯示,人工智慧在預測行為主張的實證支持上,可能成為有價值的工具,並強調人類與AI合作的潛力。 PubMed DOI

最近生成式人工智慧和自然語言處理的進展,讓大型語言模型(LLMs)和像ChatGPT的AI聊天機器人誕生,這些技術在程式設計和軟體開發上有實際應用。雖然準確性有待加強,但ChatGPT流暢的語言使其成為學生的虛擬導師。 我們分析了ChatGPT與人類對Stack Overflow 2000個問題的回應,發現ChatGPT的回應較為正面,而人類則常表達憤怒和厭惡等情緒。人類情感範圍更廣,顯示出AI與人類回應間的情感差異,強調在教育環境中研究這些情感層面的重要性。 PubMed DOI

研究顯示,ChatGPT-4在使用十項人格量表(TIPI)評估公共人物的人格特質上表現優異,相關係數高達0.76到0.87,顯示其評估結果與人類評審者高度一致。這可能歸因於其廣泛的訓練數據、對語言細微差別的理解、模式識別能力,以及缺乏偏見的反饋。這些發現顯示,ChatGPT-4在心理學、行銷和公共關係等領域具有潛在價值,並引發對AI在社會評估中可靠性的思考,顯示出AI在理解人類行為方面的進步與應用潛力。 PubMed DOI

這項初步研究探討了大型語言模型(LLMs),特別是ChatGPT 3.5和ChatGPT-4,在心智理論(ToM)方面的能力,並與自閉症譜系障礙(ASD)及典型發展(TD)個體進行比較。研究發現: 1. 兩個LLMs在理解心理狀態的準確性上高於ASD組,但ChatGPT-3.5在複雜心理狀態上表現不佳。 2. ChatGPT-3.5在情感狀態識別上低於TD個體,尤其是負面情緒,但與ASD組相似。ChatGPT-4有所改善,但仍難以識別悲傷和憤怒。 3. 兩者的對話風格冗長且重複,類似高功能自閉症個體。 研究顯示LLMs在理解心理和情感狀態的潛力及其局限性,對ASD的臨床應用有影響。 PubMed DOI