Explainable depression symptom detection in social media.
社交媒體中可解釋的憂鬱症狀檢測。 Health Inf Sci Syst 2024-09-09

這篇論文探討了基於變壓器的模型，旨在檢測社交媒體上用戶生成內容中的抑鬱症狀。研究強調了解釋性的重要性，特別是對健康專業人員而言。作者提出兩種方法：一是將分類和解釋任務分開，二是整合到同一模型中。他們還利用對話型大型語言模型（LLMs）進行上下文學習和微調，生成的自然語言解釋與症狀相符，讓臨床醫生更易理解模型輸出。評估結果顯示，能在提供可解釋的解釋的同時，達到高分類性能。 PubMed DOI

Using Large Language Models to Detect Depression From User-Generated Diary Text Data as a Novel Approach in Digital Mental Health Screening: Instrument Validation Study.
使用大型語言模型從用戶生成的日記文本數據中檢測抑鬱症：數位心理健康篩檢中的新方法及工具驗證研究。 J Med Internet Res 2024-09-18

抑鬱症對全球影響深遠，影響工作效率和殘疾率。雖然早期發現很重要，但現有的篩檢工具常缺乏客觀性。研究者正探索影像分析、血液標記及日記寫作等客觀指標。這項研究利用情感日記應用程式，評估91名參與者的日記文本，並使用GPT-3.5和GPT-4等大型語言模型進行抑鬱症檢測。結果顯示，微調後的GPT-3.5準確率達90.2%，顯示用戶生成的文本在臨床檢測抑鬱症上具潛力，未來可結合其他可測量指標進一步研究。 PubMed DOI

Aligning Large Language Models for Enhancing Psychiatric Interviews Through Symptom Delineation and Summarization: Pilot Study.
透過症狀劃分與總結來增強精神科訪談的大型語言模型對齊：初步研究。 JMIR Form Res 2024-10-24

這項研究探討大型語言模型（LLMs）在精神科訪談中的應用，特別針對北韓脫北者的心理健康挑戰。研究目標是確認LLMs能否有效識別精神病症狀並總結壓力源。主要任務包括提取壓力源、識別症狀及總結訪談內容。結果顯示，使用GPT-4 Turbo模型後，73個記錄片段準確關聯精神病症狀，經微調後性能提升，平均準確率達0.82。LLMs生成的摘要在連貫性和相關性上得分高，顯示其在心理健康領域的潛力。 PubMed DOI

Using large language models for extracting and pre-annotating texts on mental health from noisy data in a low-resource language.
使用大型語言模型從低資源語言的雜訊數據中提取和預標註心理健康文本。 PeerJ Comput Sci 2024-12-09

最近大型語言模型（LLMs）在心理健康護理中的對話代理（CAs）方面有了新進展，但仍面臨高品質訓練數據不足、隱私問題及低資源語言標註成本高等挑戰。研究利用社交媒體的公共討論來建立人機標註系統，並探討零樣本分類技術對四種LLMs進行文本分類，分析64,404篇俄語文本，聚焦七種心理疾病。結果顯示，微調模型能顯著提升分類準確率，並且多語言模型表現優於翻譯文本的英語模型。我們的數據集和模型已公開，助力心理健康對話代理的發展。 PubMed DOI

Using large language models to detect outcomes in qualitative studies of adolescent depression.
使用大型語言模型來檢測青少年憂鬱症質性研究中的結果。 J Am Med Inform Assoc 2024-12-11

這項研究探討如何利用大型語言模型（LLMs）來識別青少年抑鬱症訪談中的心理治療結果。作者建立了一個編碼框架，能夠捕捉多樣的治療結果，並評估五個開源LLM的分類能力。實驗結果顯示，這些模型能有效分類31種結果，ROC曲線下面積得分在0.6到1.0之間，成功識別出友誼和學業表現等重要結果。研究強調了臨床數據的應用，顯示詳細編碼治療結果的可行性，並有助於量化重要結果。 PubMed DOI

Mental-LLM: Leveraging Large Language Models for Mental Health Prediction via Online Text Data.
Mental-LLM：利用大型語言模型透過線上文本數據進行心理健康預測。 Proc ACM Interact Mob Wearable Ubiquitous Technol 2025-02-10

這項研究評估了多種大型語言模型（LLMs）在心理健康預測任務中的表現，測試的模型包括Alpaca、FLAN-T5、GPT-3.5和GPT-4。研究探討了不同的提示技術，結果顯示指令微調能顯著提升模型能力，尤其是Mental-Alpaca和Mental-FLAN-T5在準確率上超越了GPT-3.5和GPT-4。此外，研究也強調了模型的推理能力及其在實際應用中的倫理問題與偏見考量。這些發現為改善LLM在心理健康領域的應用提供了指導。 PubMed DOI

Explainable differential diagnosis with dual-inference large language models.
可解釋的差異性診斷：結合雙重推理的大型語言模型 Npj Health Syst 2025-04-28

這項研究首度公開570份專家撰寫的臨床鑑別診斷解釋資料集，並提出新架構「Dual-Inf」來提升大型語言模型產生DDx解釋的準確度。此創新做法評估了AI在診斷推理解釋上的能力，期望提升AI診斷透明度與品質，幫助臨床決策更可靠。 PubMed DOI

Large Language Models and Text Embeddings for Detecting Depression and Suicide in Patient Narratives.
大型語言模型與文本嵌入於病患敘述中偵測憂鬱與自殺的應用 JAMA Netw Open 2025-05-23

這項研究發現，大型語言模型和文字嵌入模型能從精神科病患的句子完成測驗中，準確辨識憂鬱症和自殺風險，尤其在分析自我概念相關內容時效果最好。最佳模型偵測憂鬱症的AUROC達0.841。雖然AI有潛力協助心理健康評估，但臨床應用前還需要更多改進和安全驗證。 PubMed DOI

Toward Large Language Models as a Therapeutic Tool: Comparing Prompting Techniques to Improve GPT-Delivered Problem-Solving Therapy.
邁向將大型語言模型作為治療工具：比較提示技巧以提升GPT提供的問題解決治療效果 AMIA Annu Symp Proc 2025-05-26

這項研究發現，透過提示工程（prompt engineering）可以提升大型語言模型在心理治療（PST）初期階段的表現，尤其在症狀辨識和目標設定上更有效。雖然品質和同理心有所提升，但仍有侷限。整體來說，LLM 有潛力協助解決心理健康人力不足，推動 AI 治療服務發展。 PubMed

Enhancing Cross-Domain Generalizability in Social Determinants of Health Extraction with Prompt-Tuning Large Language Models.
利用提示微調大型語言模型提升社會健康決定因素萃取的跨領域泛化能力 AMIA Jt Summits Transl Sci Proc 2025-06-12

這項研究發現，結合 soft prompt-based learning 和大型語言模型（像 GatorTronGPT），能大幅提升從不同醫院和疾病的臨床文本中萃取社會健康決定因素（SDoH）的效果。經過 prompt-tuning 的 GatorTronGPT，F1 分數最高比傳統 fine-tuned 模型多出 21.8%，顯示它在跨領域應用上表現更好。 PubMed

原始文章

站上相關主題文章列表