原始文章

這項研究針對自殺這一公共衛生議題,運用機器學習模型來識別有風險的個體,特別針對14至25歲的青少年。研究使用德國危機熱線的數據,開發預測自殺意念和行為的方法,並與傳統文本分類進行比較。基於變壓器的模型表現優異,達到0.89的宏觀AUC,並成功識別與自殺風險相關的語言特徵。研究結果顯示,這些模型能有效輔助臨床決策,未來可探索多模態輸入及時間性因素。 PubMed DOI


站上相關主題文章列表

自殺是重要的公共健康議題,人工智慧的進步,特別是大型語言模型(LLMs),在自殺檢測和預防上有顯著貢獻。這篇綜述分析了2018年到2024年間的29項研究,探討像GPT、Llama和BERT等模型在自殺預防中的應用。研究顯示,這些模型在早期檢測和預測方面通常表現優於心理健康專業人士。儘管LLMs展現出拯救生命的潛力,但仍需解決倫理問題,並與心理健康專家合作。 PubMed DOI

生成式人工智慧(genAI)在提升醫療保健方面潛力巨大,特別是心理健康護理,因為美國專業人員短缺。針對自殺相關查詢,我們評估了五個genAI工具的回應質量。結果顯示,79%的回應是支持性的,但只有24%提供危機熱線號碼,僅4%包含基於證據的干預資訊。雖然有害內容出現頻率不高,但開發者應在提供必要的心理健康資訊與降低風險之間取得平衡,確保心理健康的平等應成為優先事項。 PubMed DOI

自殺預防是全球健康的重要議題,每年約有80萬人因自殺而喪生。大型語言模型(LLMs)在數位服務中有助於自殺預防,但也帶來臨床與倫理挑戰。2024年2月的回顧研究分析了43項相關研究,發現大多數集中於自殺風險識別,並探討了LLMs在臨床應用中的潛力。研究指出,隱私和同意等倫理問題需特別注意,並強調多學科合作及高品質數據的重要性。生成性人工智慧的發展可能改善危機護理與教育,但需持續人類監督。 PubMed DOI

這項研究探討大型語言模型(LLMs)在分類與心理健康相關的電子健康紀錄(EHRs)術語的有效性,並與臨床專家的判斷進行比較。研究使用了來自美國50多家醫療機構的數據,分析了因心理健康問題入院的病人EHR。結果顯示,LLM與臨床醫生在術語的廣泛分類上達成高一致性(κ=0.77),但在具體的心理健康(κ=0.62)和身體健康術語(κ=0.69)上則較低,顯示出LLM的變異性。儘管如此,研究強調了LLM在自動化編碼和預測建模中的潛力。 PubMed DOI

這篇論文探討如何利用自然語言處理(NLP)評估青少年聊天輔導服務的滿意度。研究分析了2,609名年輕用戶的數據和約140,000條訊息,訓練了兩種分類器:極端梯度提升(XGBoost)和基於變壓器的模型。XGBoost的表現較佳,AUC得分為0.69,而Longformer為0.68。研究發現,認為諮詢有幫助的用戶通常表達滿意,而拒絕提供的練習則顯示無幫助。雖然預測性能中等,作者建議進行更多隨機試驗以評估服務改進的影響,並強調簡單模型與複雜模型比較的重要性。 PubMed DOI

這項研究評估了三個大型語言模型(LLMs)—ChatGPT-4o、Claude 3.5 Sonnet 和 Gemini 1.5 Pro—在自殺意念反應評估的能力。結果顯示,這三個模型的反應評價普遍比專家自殺學者更適當,尤其是ChatGPT的評分差異最大。異常值分析發現,Gemini的偏差比例最高。整體來看,ChatGPT的表現相當於碩士級輔導員,Claude超過受訓心理健康專業人士,而Gemini則類似未受訓的學校工作人員。這顯示LLMs在評估反應時可能有偏向,但部分模型的表現已達到或超過專業水平。 PubMed DOI

這項研究發現,主流AI語言模型在評估退伍軍人自殺風險和治療建議上,表現常與專業人員不同,容易高估或低估風險,且各AI模型間差異大。雖然AI有時能與人類判斷一致,但治療建議不夠穩定,像ChatGPT-4o就全都建議住院。AI目前只能當輔助工具,不能取代專業判斷,臨床應用前還需要更多研究和專家監督。 PubMed DOI

一個本地運作的小型語言模型(Llama-DeepSeek-R1 8B),在預測住院病人自殺風險時,表現幾乎跟大型的GPT-4o一樣好,雖然準確度略低(c-statistic 0.64 vs 0.67),但還是能有效找出高風險族群。這代表小型模型也能安全、有效地應用在自殺風險預測上,且更容易取得與擴展。 PubMed DOI

這項研究發現,大型語言模型和文字嵌入模型能從精神科病患的句子完成測驗中,準確辨識憂鬱症和自殺風險,尤其在分析自我概念相關內容時效果最好。最佳模型偵測憂鬱症的AUROC達0.841。雖然AI有潛力協助心理健康評估,但臨床應用前還需要更多改進和安全驗證。 PubMed DOI

這項研究發現,社群媒體上關於自殺的討論常忽略弱勢族群的議題。研究團隊用AI生成補足這些缺漏主題的資料,讓機器學習模型訓練更全面。結果顯示,加入這些合成資料後,模型偵測自殺意念的準確度提升,有助於打造更包容的線上自殺風險偵測工具。 PubMed DOI