An overview of diagnostics and therapeutics using large language models.
大型語言模型在診斷和治療中的概述。 J Trauma Stress 2024-07-18

這篇文章探討了人工智慧，特別是大型語言模型（LLMs），在解決治療壓力和創傷相關問題的專業人員短缺方面的潛力。文章指出，LLMs能增強診斷評估、生成臨床筆記及提供治療支持。作者強調，克服在臨床環境中部署這些模型的挑戰很重要，包括確保AI系統的多元代表性，以避免護理資源的差異。此外，還需採用保護隱私的訓練方法，保障病人數據，同時利用公共數據集提升模型表現。 PubMed DOI

Can Large Language Models Replace Therapists? Evaluating Performance at Simple Cognitive Behavioral Therapy Tasks.
大型語言模型能取代治療師嗎？評估其在簡單認知行為療法任務中的表現。 JMIR AI 2024-07-30

大型語言模型（LLMs）如ChatGPT的出現可能會影響心理治療，特別是認知行為療法（CBT）。我們的系統性研究顯示，LLMs能夠識別不利的思維，評估其有效性，並建議將其重新框架為更具建設性的替代方案。然而，儘管LLMs在這方面能提供有用的建議，但不應僅依賴它們來進行CBT。 PubMed DOI

Using Large Language Models to Detect Depression From User-Generated Diary Text Data as a Novel Approach in Digital Mental Health Screening: Instrument Validation Study.
使用大型語言模型從用戶生成的日記文本數據中檢測抑鬱症：數位心理健康篩檢中的新方法及工具驗證研究。 J Med Internet Res 2024-09-18

抑鬱症對全球影響深遠，影響工作效率和殘疾率。雖然早期發現很重要，但現有的篩檢工具常缺乏客觀性。研究者正探索影像分析、血液標記及日記寫作等客觀指標。這項研究利用情感日記應用程式，評估91名參與者的日記文本，並使用GPT-3.5和GPT-4等大型語言模型進行抑鬱症檢測。結果顯示，微調後的GPT-3.5準確率達90.2%，顯示用戶生成的文本在臨床檢測抑鬱症上具潛力，未來可結合其他可測量指標進一步研究。 PubMed DOI

Aligning Large Language Models for Enhancing Psychiatric Interviews Through Symptom Delineation and Summarization: Pilot Study.
透過症狀劃分與總結來增強精神科訪談的大型語言模型對齊：初步研究。 JMIR Form Res 2024-10-24

這項研究探討大型語言模型（LLMs）在精神科訪談中的應用，特別針對北韓脫北者的心理健康挑戰。研究目標是確認LLMs能否有效識別精神病症狀並總結壓力源。主要任務包括提取壓力源、識別症狀及總結訪談內容。結果顯示，使用GPT-4 Turbo模型後，73個記錄片段準確關聯精神病症狀，經微調後性能提升，平均準確率達0.82。LLMs生成的摘要在連貫性和相關性上得分高，顯示其在心理健康領域的潛力。 PubMed DOI

Using large language models to detect outcomes in qualitative studies of adolescent depression.
使用大型語言模型來檢測青少年憂鬱症質性研究中的結果。 J Am Med Inform Assoc 2024-12-11

這項研究探討如何利用大型語言模型（LLMs）來識別青少年抑鬱症訪談中的心理治療結果。作者建立了一個編碼框架，能夠捕捉多樣的治療結果，並評估五個開源LLM的分類能力。實驗結果顯示，這些模型能有效分類31種結果，ROC曲線下面積得分在0.6到1.0之間，成功識別出友誼和學業表現等重要結果。研究強調了臨床數據的應用，顯示詳細編碼治療結果的可行性，並有助於量化重要結果。 PubMed DOI

Exploring the potential of large language models to understand interpersonal emotion regulation strategies from narratives.
運用大型語言模型探索從敘事中理解人際情緒調節策略的潛力 Emotion 2025-04-17

這項研究發現，經過優化指令後，AI語言模型在辨識故事中的人際情緒調節策略，準確度已接近人工，但在不同情緒和策略上仍有落差。研究強調AI分析敘事資料有潛力，但設計指令和驗證結果時要特別小心。 PubMed DOI

COMPASS: Computational mapping of patient-therapist alliance strategies with language modeling.
COMPASS：以語言建模進行病患－治療師聯盟策略的計算性對應 Transl Psychiatry 2025-05-15

這篇論文提出COMPASS架構，運用大型語言模型，能自動從心理治療會談逐字稿評估治療關係品質，不用再靠傳統問卷。COMPASS分析950多場不同精神疾病的會談，能追蹤病人和治療師互動變化，找出各疾病特有的對話模式，並提供具體、可解釋的建議，協助治療師即時提升治療效果。 PubMed DOI

Large Language Models and Text Embeddings for Detecting Depression and Suicide in Patient Narratives.
大型語言模型與文本嵌入於病患敘述中偵測憂鬱與自殺的應用 JAMA Netw Open 2025-05-23

這項研究發現，大型語言模型和文字嵌入模型能從精神科病患的句子完成測驗中，準確辨識憂鬱症和自殺風險，尤其在分析自我概念相關內容時效果最好。最佳模型偵測憂鬱症的AUROC達0.841。雖然AI有潛力協助心理健康評估，但臨床應用前還需要更多改進和安全驗證。 PubMed DOI

Toward Large Language Models as a Therapeutic Tool: Comparing Prompting Techniques to Improve GPT-Delivered Problem-Solving Therapy.
邁向將大型語言模型作為治療工具：比較提示技巧以提升GPT提供的問題解決治療效果 AMIA Annu Symp Proc 2025-05-26

這項研究發現，透過提示工程（prompt engineering）可以提升大型語言模型在心理治療（PST）初期階段的表現，尤其在症狀辨識和目標設定上更有效。雖然品質和同理心有所提升，但仍有侷限。整體來說，LLM 有潛力協助解決心理健康人力不足，推動 AI 治療服務發展。 PubMed

Evaluating the capacity of large language models to interpret emotions in images.
大型語言模型解讀影像中情緒能力之評估 PLoS One 2025-06-03

這項研究發現，GPT-4在辨識圖片情緒（愉悅度和激發度）時，表現和人類相近，但對細微情緒還是有點吃力。這代表未來用GPT-4來自動篩選和驗證情緒刺激，有機會大幅減少人力、提升效率。 PubMed DOI

原始文章

站上相關主題文章列表