Beyond rating scales: With targeted evaluation, large language models are poised for psychological assessment.
超越評分量表：透過有針對性的評估，大型語言模型準備好進行心理評估。 Psychiatry Res 2024-02-19

討論了最新研究，認為大型語言模型如BERT和ChatGPT有潛力改革心理評估。這些模型在語言處理任務中表現準確，且受歡迎。成功因有效表達上下文單詞。建議透過適當驗證，專注自然語言溝通可改變心理健康評估。 PubMed DOI

Comparing the Perspectives of Generative AI, Mental Health Experts, and the General Public on Schizophrenia Recovery: Case Vignette Study.
比較生成式人工智慧、精神健康專家和一般大眾對於精神分裂症康復的觀點：案例簡介研究。 JMIR Ment Health 2024-03-28

研究比較大型語言模型（LLMs）和心理健康專業人員在評估精神分裂症患者預後能力。結果顯示，LLMs在評估接受治療的患者預後方面表現接近專業人士，但與普羅大眾看法有差異。ChatGPT-3.5較悲觀，可能影響患者治療動機。LLMs有潛力改善醫療保健，但需經驗證及整合人類專業知識。 PubMed DOI

Large language models in psychiatry: Opportunities and challenges.
精神病學中的大型語言模型：機會與挑戰。 Psychiatry Res 2024-06-23

LLMs在精神醫學領域引起關注，如ChatGPT/GPT-4可用於預測患者風險、治療干預和材料分析。然而，採用LLMs需面對挑戰，如限制、偏見、可解釋性、隱私擔憂和錯誤信息風險。評論討論了在精神醫學實踐中使用LLMs的機會、限制和考量。 PubMed DOI

Evaluation of large language models as a diagnostic aid for complex medical cases.
大型語言模型作為複雜醫學案例診斷輔助的評估。 Front Med (Lausanne) 2024-07-05

研究比較了大型語言模型（LLMs）在臨床案例診斷上的表現，發現GPT4比GPT3.5更準確且提供更專業的診斷列表。然而，兩者仍有可能漏掉最可能的診斷。研究建議LLMs像GPT4可擴展診斷考慮範圍，但需改進以更符合疾病發生率和文獻。 PubMed DOI

Applications of large language models in psychiatry: a systematic review.
大型語言模型在精神病學中的應用：一項系統性回顧。 Front Psychiatry 2024-07-09

像ChatGPT這樣的大型語言模型(LLMs)在精神醫學領域有潛力搭起人工智慧與人類認知過程之間的橋樑。它們可以協助診斷心理健康問題、管理憂鬱症、評估自殺風險，並支援教育。然而，存在一些限制，例如處理複雜案例的困難和低估自殺風險。未來的研究可能會探索LLMs如何重塑精神健康照護。 PubMed DOI

Large language models outperform mental and medical health care professionals in identifying obsessive-compulsive disorder.
大型語言模型在識別強迫症方面超越了心理和醫療健康專業人員。 NPJ Digit Med 2024-07-19

研究顯示，大型語言模型（LLMs）在診斷強迫症（OCD）方面表現優於醫療和心理健康專業人士，顯示其在提升診斷速度和準確性上的潛力，能解決治療延遲的問題。這強調了將LLMs整合進心理健康護理的可能性，以改善診斷流程和病人結果。未來的研究可進一步探討LLMs在臨床應用中的實際效果與限制。 PubMed DOI

Exploring the Efficacy of Large Language Models in Summarizing Mental Health Counseling Sessions: Benchmark Study.
探索大型語言模型在總結心理健康諮詢會議中的有效性：基準研究。 JMIR Ment Health 2024-07-23

這項研究探討大型語言模型（LLMs）在自動摘要心理健康諮詢會議的應用，旨在解決手動摘要對諮詢過程的影響。研究人員建立了一個名為「心理健康諮詢-組件引導對話摘要」的數據集，包含191個諮詢會議的摘要。他們評估了11個先進的LLM，結果顯示像MentalLlama、Mistral和MentalBART等模型在摘要生成上表現不錯，特別是Mistral獲得專家高評價。然而，所有模型在機會成本和感知有效性上仍有不足，顯示尚未適合臨床使用，需進一步精煉和驗證。 PubMed DOI

Can Large Language Models Replace Therapists? Evaluating Performance at Simple Cognitive Behavioral Therapy Tasks.
大型語言模型能取代治療師嗎？評估其在簡單認知行為療法任務中的表現。 JMIR AI 2024-07-30

大型語言模型（LLMs）如ChatGPT的出現可能會影響心理治療，特別是認知行為療法（CBT）。我們的系統性研究顯示，LLMs能夠識別不利的思維，評估其有效性，並建議將其重新框架為更具建設性的替代方案。然而，儘管LLMs在這方面能提供有用的建議，但不應僅依賴它們來進行CBT。 PubMed DOI

The Opportunities and Risks of Large Language Models in Mental Health.
大型語言模型在心理健康領域的機會與風險。 JMIR Ment Health 2024-08-06

全球心理健康問題日益嚴重，現有的照護模式無法滿足需求。大型語言模型（LLMs）被視為解決方案，能在心理健康教育、評估和介入上提供幫助。本文回顧了LLMs的應用，並指出其潛在的正面影響與風險，強調需採取策略來降低風險。平衡心理健康支持的需求與LLMs的負責任開發至關重要，確保這些模型符合倫理標準，並讓有經驗的人參與開發，以減少傷害並增強其正面影響。 PubMed DOI

Diagnostic accuracy of large language models in psychiatry.
大型語言模型在精神科的診斷準確性。 Asian J Psychiatr 2024-08-07

這項研究探討了不同人工智慧模型在精神醫學診斷的表現，包括GPT-3.5、GPT-4、Aya和Nemotron。由於病人主觀報告的影響，準確診斷常常困難。研究使用20個DSM-5的臨床案例，結果顯示GPT-3.5和GPT-4在準確性和推理上優於其他模型，尤其在診斷精神病和雙相情感障礙方面表現突出，但在某些情況下則不佳。研究建議，人工智慧有潛力改善精神科診斷，但其他模型需進一步改進，未來應擴展數據集以增強診斷能力。 PubMed DOI

原始文章

站上相關主題文章列表