原始文章

這項研究探討了一種自動化的問題類型編碼模型,特別是「穩健優化雙向編碼器表示法」,用於分析兒童虐待受害者的法醫訪談和法庭證詞。模型在大型數據集上訓練,顯示出95%的可靠性,與人工編碼者的協議相當。進一步分析發現,人工編碼者在識別問題時容易出錯,修正後模型的可靠性提升至98%。研究結果顯示,自動編碼是一種省時且準確的手段,訓練好的模型可供研究人員和實務工作者使用。 PubMed DOI


站上相關主題文章列表

研究人員使用自傳式訪談分析自傳記憶,發現手動評分耗時。他們開發了一種新方法,利用自然語言處理自動評分回應,表現優異。為了方便其他研究人員,提供了Colab筆記本。 PubMed DOI

研究開發了一個自然語言模型,可以將文字記憶分為五種自傳記憶類型。這有助於評估記憶偏差,包括心理健康疾病中的特異性降低和靈活性受損。模型在大數據集上訓練,準確度高。開源版本可在臨床中使用,幫助記憶干預,提升治療效果。 PubMed DOI

最新的機器編碼技術進步讓人們擔心大型語言模型(LLM)的分類驗證。這篇論文比較了監督式和半監督式算法在政治數據編碼上的表現,探討LLM分類的驗證。研究評估了模型多次迭代的表現,與專家編碼對比,並考量了提示工程和數據預處理的影響。結果顯示,在熟悉情境下,GPT-4的表現最接近專家編碼,且在不同情境下呈現更一致的編碼。論文最後討論了機器編碼對未來的影響。 PubMed DOI

這篇文章探討利用先進的機器學習技術來檢測自閉症譜系障礙(ASD)。研究主要有三個目標:評估模型在不同數據集上的有效性、檢視模型之間的知識轉移潛力,以及評估數據增強對模型表現的影響。研究使用了微調HerBERT和OpenAI的文本嵌入技術,數據集來自TLC工具和ADOS-2。結果顯示,模型在TLC數據上表現較好,但知識轉移未見成效,且數據增強技術可能掩蓋重要信號。總體而言,模型的有效性受數據類型和診斷工具影響。 PubMed DOI

這項研究探討Snapchat的My AI在提供性健康資訊給年輕人的有效性,特別是性同意、拒絕、性侵害和傳送性暗示訊息。研究者向My AI提出標準化問題,分析其回應的一致性。結果顯示,My AI強調清晰溝通的重要性,並建議在面對性侵害或性暗示問題時諮詢可信的照顧者。雖然回應大致一致,但仍有變異,顯示教育者需補充數位工具,以確保年輕人能全面理解和獲得支持。 PubMed DOI

這項研究探討如何利用大型語言模型(LLMs)來識別青少年抑鬱症訪談中的心理治療結果。作者建立了一個編碼框架,能夠捕捉多樣的治療結果,並評估五個開源LLM的分類能力。實驗結果顯示,這些模型能有效分類31種結果,ROC曲線下面積得分在0.6到1.0之間,成功識別出友誼和學業表現等重要結果。研究強調了臨床數據的應用,顯示詳細編碼治療結果的可行性,並有助於量化重要結果。 PubMed DOI

這項研究探討如何利用大型語言模型(LLMs)從兒童保護服務(CPS)的案例報告中提取結構化數據,特別是識別不同的暴力子類型。研究流程分為四個階段,並分析了來自瑞士的29,770份報告,提取了28,223個文本段落。表現最佳的模型Mixtral-8x7B在文本分類中達到87%的準確率,超過人類審查員的77%協議率。結果顯示,LLMs能有效模擬人類的編碼能力,提升CPS研究的質量,但也需注意文本分段的弱點及潛在偏見。 PubMed DOI

這項研究開發了一個聊天機器人,目的是早期識別青少年的抑鬱症狀,並解決精神科服務接觸率低的問題。研究分為兩個步驟: 1. **數據收集與分析**:對53名青少年進行標準化訪談,產生4,077對問答,訓練出一個準確率高達97%的模型,能有效區分有無抑鬱症的青少年。 2. **使用Chat GPT生成數據**:為增強數據集,研究利用Chat GPT生成額外語句,發現有效的提示工程具有挑戰性,但成功策略是平衡提示長度與示例數量。 總體來看,這項研究顯示分析青少年語言模式能有效識別抑鬱症狀,而Chat GPT則是創建合成數據的好工具。 PubMed DOI

這項研究比較了大型語言模型(LLM)ChatGPT與人類面試官在對6到8歲兒童進行模擬訪談的效果。78名兒童中,40名由LLM訪談,38名由人類面試官訪談。結果顯示,無論是LLM還是人類,建議問題都能引導出更準確的信息。雖然LLM提問較少,但獲得的獨特正確信息更多,且錯誤信息較少。這顯示LLM能提出符合兒童訪談最佳實踐的問題,未來仍需進一步研究其在實際情境中的應用。 PubMed DOI

這項研究探討大型語言模型(LLM)在質性研究中的應用,特別是針對自殺的心理社會驗屍。研究進行了38次半結構式訪談,評估LLM在編碼和總結自殺喪失者訪談數據的能力。結果顯示,LLM與人類研究者在二元分類上有高一致性(準確率0.84),總結的評價也有80%為正面。研究建議將LLM與人類審查結合,以提高效率,並呼籲未來在不同背景下進一步探索這些發現。 PubMed DOI