Large language models in psychiatry: Opportunities and challenges.
精神病學中的大型語言模型：機會與挑戰。 Psychiatry Res 2024-06-23

LLMs在精神醫學領域引起關注，如ChatGPT/GPT-4可用於預測患者風險、治療干預和材料分析。然而，採用LLMs需面對挑戰，如限制、偏見、可解釋性、隱私擔憂和錯誤信息風險。評論討論了在精神醫學實踐中使用LLMs的機會、限制和考量。 PubMed DOI

Applications of large language models in psychiatry: a systematic review.
大型語言模型在精神病學中的應用：一項系統性回顧。 Front Psychiatry 2024-07-09

像ChatGPT這樣的大型語言模型(LLMs)在精神醫學領域有潛力搭起人工智慧與人類認知過程之間的橋樑。它們可以協助診斷心理健康問題、管理憂鬱症、評估自殺風險，並支援教育。然而，存在一些限制，例如處理複雜案例的困難和低估自殺風險。未來的研究可能會探索LLMs如何重塑精神健康照護。 PubMed DOI

Exploring the Efficacy of Large Language Models in Summarizing Mental Health Counseling Sessions: Benchmark Study.
探索大型語言模型在總結心理健康諮詢會議中的有效性：基準研究。 JMIR Ment Health 2024-07-23

這項研究探討大型語言模型（LLMs）在自動摘要心理健康諮詢會議的應用，旨在解決手動摘要對諮詢過程的影響。研究人員建立了一個名為「心理健康諮詢-組件引導對話摘要」的數據集，包含191個諮詢會議的摘要。他們評估了11個先進的LLM，結果顯示像MentalLlama、Mistral和MentalBART等模型在摘要生成上表現不錯，特別是Mistral獲得專家高評價。然而，所有模型在機會成本和感知有效性上仍有不足，顯示尚未適合臨床使用，需進一步精煉和驗證。 PubMed DOI

The Opportunities and Risks of Large Language Models in Mental Health.
大型語言模型在心理健康領域的機會與風險。 JMIR Ment Health 2024-08-06

全球心理健康問題日益嚴重，現有的照護模式無法滿足需求。大型語言模型（LLMs）被視為解決方案，能在心理健康教育、評估和介入上提供幫助。本文回顧了LLMs的應用，並指出其潛在的正面影響與風險，強調需採取策略來降低風險。平衡心理健康支持的需求與LLMs的負責任開發至關重要，確保這些模型符合倫理標準，並讓有經驗的人參與開發，以減少傷害並增強其正面影響。 PubMed DOI

Large Language Models for Mental Health Applications: Systematic Review.
大型語言模型在心理健康應用中的系統性回顧。 JMIR Ment Health 2024-10-18

這篇系統性回顧探討大型語言模型（LLMs）在心理健康領域的應用，特別是在早期篩檢、數位介入和臨床應用的有效性。回顧分析了2017年到2024年期間的40篇文章，結果顯示LLMs能有效識別心理健康問題並提供電子健康服務，但也存在文本不一致、幻覺現象及缺乏倫理框架等風險。主要挑戰包括需要多語言專家標註的數據、內容可靠性及數據隱私等倫理問題。雖然LLMs不應取代專業服務，但作為輔助工具的潛力值得進一步研究。 PubMed DOI

Aligning Large Language Models for Enhancing Psychiatric Interviews Through Symptom Delineation and Summarization: Pilot Study.
透過症狀劃分與總結來增強精神科訪談的大型語言模型對齊：初步研究。 JMIR Form Res 2024-10-24

這項研究探討大型語言模型（LLMs）在精神科訪談中的應用，特別針對北韓脫北者的心理健康挑戰。研究目標是確認LLMs能否有效識別精神病症狀並總結壓力源。主要任務包括提取壓力源、識別症狀及總結訪談內容。結果顯示，使用GPT-4 Turbo模型後，73個記錄片段準確關聯精神病症狀，經微調後性能提升，平均準確率達0.82。LLMs生成的摘要在連貫性和相關性上得分高，顯示其在心理健康領域的潛力。 PubMed DOI

Evaluating Diagnostic Accuracy and Treatment Efficacy in Mental Health: A Comparative Analysis of Large Language Model Tools and Mental Health Professionals.
評估心理健康診斷準確性和治療效果：大型語言模型工具與心理健康專業人士的比較分析。 Eur J Investig Health Psychol Educ 2025-01-24

這項研究評估了四個大型語言模型（LLMs）在心理健康診斷和治療的能力，包括Gemini 2.0、Claude 3.5、ChatGPT-3.5和ChatGPT-4。主要發現顯示，ChatGPT-4在診斷憂鬱症和PTSD方面優於人類專業人士，但在複雜案例如早期精神分裂症的準確率僅55%。LLMs提供的治療建議較為多樣，但專業人士則偏好具體的精神科諮詢。總體來看，雖然LLMs能協助診斷和治療計畫，但在複雜情況下仍需專業監督。 PubMed DOI

Classifying Unstructured Text in Electronic Health Records for Mental Health Prediction Models: Large Language Model Evaluation Study.
電子健康紀錄中非結構化文本的分類以進行心理健康預測模型：大型語言模型評估研究。 JMIR Med Inform 2025-01-26

這項研究探討大型語言模型（LLMs）在分類與心理健康相關的電子健康紀錄（EHRs）術語的有效性，並與臨床專家的判斷進行比較。研究使用了來自美國50多家醫療機構的數據，分析了因心理健康問題入院的病人EHR。結果顯示，LLM與臨床醫生在術語的廣泛分類上達成高一致性（κ=0.77），但在具體的心理健康（κ=0.62）和身體健康術語（κ=0.69）上則較低，顯示出LLM的變異性。儘管如此，研究強調了LLM在自動化編碼和預測建模中的潛力。 PubMed DOI

Large language models and psychiatry.
大型語言模型與精神醫學。 Int J Law Psychiatry 2025-02-28

生成式人工智慧和大型語言模型（LLMs），如GPT-4，對臨床醫學和認知心理學影響深遠。這些模型在理解和生成語言方面表現優異，能改善臨床決策和心理諮詢。雖然LLMs在類比推理和隱喻理解上表現良好，但在因果推理和複雜規劃上仍有挑戰。本文探討LLMs的認知能力及其在心理測試中的表現，並討論其在認知心理學和精神醫學的應用、限制及倫理考量，強調進一步研究的重要性，以釋放其潛力。 PubMed DOI

Exploring the Potential of Large Language Models for Automated Safety Plan Scoring in Outpatient Mental Health Settings.
探索大型語言模型在門診心理健康環境中自動安全計劃評分的潛力。 medRxiv 2025-04-08

安全規劃介入忠實度評估工具（SPIFR）是一個自動化工具，專門用來評估自殺風險管理的安全規劃介入（SPI）質量。它利用三個大型語言模型（LLMs）分析了266個去識別化的SPI，重點在於警示徵兆、內部應對策略、安全環境及生存理由。研究發現，LLaMA 3和o3-mini的表現優於GPT-4，並針對每個步驟提出了最佳評分系統。這顯示大型語言模型在提供臨床醫師即時且準確的反饋方面的潛力，有助於提升自殺預防策略的有效性。 PubMed DOI

原始文章

站上相關主題文章列表