原始文章

這項研究探討了大型語言模型GPT-4在檢測社交焦慮症狀的效果,共有51名德國成年人參加。他們在線上訪談前填寫了社交焦慮自我報告問卷(SPIN)。結果顯示,GPT-4的預測與自我報告分數之間有強烈相關性(r = 0.79),F1準確率達到0.84。作者建議需進一步研究,以在更大且多樣的樣本中驗證這些結果。 PubMed DOI


站上相關主題文章列表

這項研究探討了不同人工智慧模型在精神醫學診斷的表現,包括GPT-3.5、GPT-4、Aya和Nemotron。由於病人主觀報告的影響,準確診斷常常困難。研究使用20個DSM-5的臨床案例,結果顯示GPT-3.5和GPT-4在準確性和推理上優於其他模型,尤其在診斷精神病和雙相情感障礙方面表現突出,但在某些情況下則不佳。研究建議,人工智慧有潛力改善精神科診斷,但其他模型需進一步改進,未來應擴展數據集以增強診斷能力。 PubMed DOI

這項研究探討了支撐ChatGPT的GPT模型在多語言心理文本分析中的有效性。研究分析了15個數據集,包含47,925條推文和新聞標題,評估GPT在12種語言中檢測情感、情緒等心理構念的能力。結果顯示,GPT的表現超越傳統方法,且隨著版本更新準確性提升,特別是在不常用語言中,具成本效益。研究建議GPT能民主化自動文本分析,促進跨語言研究,並提供範例代碼和教學。 PubMed DOI

這項研究探討大型自然語言模型如GPT-3和GPT-4如何幫助社會心理學研究者生成新假設。由於該領域發現眾多,整合想法變得困難,可能會錯過重要聯繫。研究採用兩種方法:首先對GPT-3進行微調,使用數千篇社會心理學摘要,專家評分後發現其生成的假設在清晰度和創新性上與人類相似;其次不微調使用GPT-4,結果顯示其生成的假設在多個維度上評分更高。總體來看,這些模型能有效支持假設生成。 PubMed DOI

這項研究評估了GPT-4在心理健康管理認證測試中的表現,重點在於調整提示是否能提升結果。研究者使用3 × 2的因子設計,測試600道多選題,並比較了簡單提示與調整提示的效果。結果顯示,GPT-4在不同難度級別的得分相近,且兩種提示條件之間沒有顯著差異。雖然調整提示未顯著提升表現,但能減少錯誤並改善輸出組織。該研究已在UMIN-CTR註冊。 PubMed DOI

在研究中,我探討了大型語言模型(LLMs),特別是GPT-3.5和GPT-4,對複雜行為科學實驗結果的預測能力。結果顯示,GPT-4在預測情感、性別和社會認知方面,與119位人類專家的表現相當,相關性高達0.89,而GPT-3.5則僅有0.07。在另一項研究中,讓大學參與者與GPT-4驅動的聊天機器人互動,提升了他們的預測準確性。這些結果顯示,人工智慧在預測行為主張的實證支持上,可能成為有價值的工具,並強調人類與AI合作的潛力。 PubMed DOI

研究顯示,ChatGPT-4在使用十項人格量表(TIPI)評估公共人物的人格特質上表現優異,相關係數高達0.76到0.87,顯示其評估結果與人類評審者高度一致。這可能歸因於其廣泛的訓練數據、對語言細微差別的理解、模式識別能力,以及缺乏偏見的反饋。這些發現顯示,ChatGPT-4在心理學、行銷和公共關係等領域具有潛在價值,並引發對AI在社會評估中可靠性的思考,顯示出AI在理解人類行為方面的進步與應用潛力。 PubMed DOI

本研究探討ChatGPT作為焦慮症患者心理治療師的有效性與可接受性。透過4週的介入,399名來自沙烏地阿拉伯的參與者評估了AI心理治療的經驗。結果顯示,91.2%的使用者認為ChatGPT準確,89.6%有治療經驗,36.1%報告嚴重焦慮。參與者對隱私和倫理的擔憂也被提及。城市居民和女性對ChatGPT的評價較高。結論是,ChatGPT有潛力補充傳統心理治療,改善心理健康護理的可及性。 PubMed DOI

這項研究探討了人工智慧(AI)語言模型在診斷兒童焦慮的有效性,並與一般醫生進行比較。研究發現,AI工具在識別焦慮症方面的成功率明顯高於醫生,特別是Claude.AI和Gemini表現最佳。雖然40%的醫生偏好在診所內處理案例,但AI通常建議轉介至專業心理或身體健康服務。整體來看,這些大型語言模型在兒童焦慮診斷上展現出相對於醫生的優勢。 PubMed DOI

最近,GPT-4在大型語言模型(LLMs)方面的進展,可能會改變社會科學的研究方式。研究探討了GPT-4在模擬擁有不同大五人格特徵的個體的有效性,進行了兩項模擬研究。 第一項模擬顯示,GPT-4生成的個性反應比人類反應更具一致性,且與人類自我報告的分數高度相關,顯示其能有效模仿真實個性。第二項模擬則指出,隨著角色複雜度增加,GPT-4的表現會下降,但加入人口統計信息後,模擬的準確性有所提升。 總體而言,這些結果顯示使用GPT-4創造多樣個性的代理人,對理解人類行為的研究有很大潛力,並為未來的研究提供了新方向。 PubMed DOI

這項研究探討了ChatGPT 4在透過書面文本評估人格特質的有效性,使用了兩個公開數據集,包含文本和基於五大人格模型的自我評估。研究目的是評估ChatGPT 4在十一點量表上預測人格特質的準確性,並與作者的自我評估進行比較。結果顯示,ChatGPT 4能中等程度推斷人格特質,但在判斷輸入適當性方面有困難。研究建議改進基準測試方法,以提升評估過程,並強調大型語言模型在人格評估中的潛力。 PubMed DOI