M.I.N.I.-KID interviews with adolescents: a corpus-based language analysis of adolescents with depressive disorders and the possibilities of continuation using Chat GPT.
青少年 M.I.N.I.-KID 訪談：針對抑鬱症青少年的語料庫語言分析及使用 Chat GPT 繼續進行的可能性。 Front Psychiatry 2025-01-03

這項研究開發了一個聊天機器人，目的是早期識別青少年的抑鬱症狀，並解決精神科服務接觸率低的問題。研究分為兩個步驟： 1. **數據收集與分析**：對53名青少年進行標準化訪談，產生4,077對問答，訓練出一個準確率高達97%的模型，能有效區分有無抑鬱症的青少年。 2. **使用Chat GPT生成數據**：為增強數據集，研究利用Chat GPT生成額外語句，發現有效的提示工程具有挑戰性，但成功策略是平衡提示長度與示例數量。總體來看，這項研究顯示分析青少年語言模式能有效識別抑鬱症狀，而Chat GPT則是創建合成數據的好工具。 PubMed DOI

Comparing the performance of a large language model and naive human interviewers in interviewing children about a witnessed mock-event.
比較大型語言模型與天真的人類面試者在對兒童進行目擊模擬事件面試中的表現。 PLoS One 2025-02-28

這項研究比較了大型語言模型（LLM）ChatGPT與人類面試官在對6到8歲兒童進行模擬訪談的效果。78名兒童中，40名由LLM訪談，38名由人類面試官訪談。結果顯示，無論是LLM還是人類，建議問題都能引導出更準確的信息。雖然LLM提問較少，但獲得的獨特正確信息更多，且錯誤信息較少。這顯示LLM能提出符合兒童訪談最佳實踐的問題，未來仍需進一步研究其在實際情境中的應用。 PubMed DOI

Deductively coding psychosocial autopsy interview data using a few-shot learning large language model.
使用少量學習的大型語言模型對心理社會驗屍訪談數據進行演繹編碼。 Front Public Health 2025-03-06

這項研究探討大型語言模型（LLM）在質性研究中的應用，特別是針對自殺的心理社會驗屍。研究進行了38次半結構式訪談，評估LLM在編碼和總結自殺喪失者訪談數據的能力。結果顯示，LLM與人類研究者在二元分類上有高一致性（準確率0.84），總結的評價也有80%為正面。研究建議將LLM與人類審查結合，以提高效率，並呼籲未來在不同背景下進一步探索這些發現。 PubMed DOI

The use of large language models for qualitative research: The Deep Computational Text Analyser (DECOTA).
大型語言模型在質性研究中的應用：深度計算文本分析器 (DECOTA)。 Psychol Methods 2025-04-07

深度計算文本分析器（DECOTA）是一種新型機器學習工具，能自動分析大量自由文本數據，幫助研究人員和政策制定者更有效地了解公眾意見。透過結構主題建模和精細調整的語言模型，DECOTA能快速識別關鍵主題和代碼，無需大量人力。與傳統方法相比，DECOTA的速度快378倍，成本低1,920倍，且與人類編碼結果高度一致，對於基於證據的政策制定和公眾參與具有重要意義。 PubMed DOI

Automatic implicit motive codings are at least as accurate as humans' and 99% faster.
自動隱性動機編碼的準確性至少與人類相當，且速度快99%。 J Pers Soc Psychol 2025-04-10

這項研究聚焦於隱性動機，探討影響行為和情感的潛在需求，並與人格特質區分開來。研究團隊開發了機器學習模型，利用85,028句子的數據集來評估權力、成就和歸屬感的需求。結果顯示，這些模型與傳統方法一致性高，內部一致性相關係數分別達到.85、.87和.89。研究還重複經典實驗以驗證模型的有效性，並提供免費的R-package text框架，顯著減少編碼時間，讓隱性動機研究更具可及性。 PubMed DOI

RoBIn: A Transformer-based model for risk of bias inference with machine reading comprehension.
RoBIn：結合機器閱讀理解的 Transformer 架構風險偏倚推論模型 J Biomed Inform 2025-04-18

這篇研究提出 RoBIn 兩種 Transformer 模型，自動評估臨床試驗論文的偏倚風險。作者用 Cochrane Database 標註 PubMed 論文，建立全新公開的 RoB 資料集。RoBIn 表現比傳統方法和大型語言模型更好，AUROC 達 0.83，展現自動化 RoB 評估的高效率與擴充性。 PubMed DOI

Generative AI for Thematic Analysis in a Maternal Health Study: Coding Semi-structured Interviews using Large Language Models (LLMs).
在一項母體健康研究中應用生成式 AI 進行主題分析：利用大型語言模型（LLMs）編碼半結構式訪談 medRxiv 2025-05-02

這項研究用 ChatGPT 來自動分析產科醫療訪談內容，讓原本很花時間的質性編碼流程變得更有效率。ChatGPT 的編碼準確率超過八成，還能省下八成以上的時間。不過，AI 在主題分析上雖然有潛力，但準確性、偏誤和隱私等問題還需要再加強和研究。 PubMed DOI

Classifying the Information Needs of Survivors of Domestic Violence in Online Health Communities Using Large Language Models: Prediction Model Development and Evaluation Study.
利用大型語言模型分類線上健康社群中家庭暴力倖存者的資訊需求：預測模型開發與評估研究 J Med Internet Res 2025-05-12

這項研究開發了一個微調過的大型語言模型，能自動從Reddit家暴相關社群的女性貼文中，辨識她們的資訊需求。研究團隊用真實和AI生成的資料解決樣本不足和類別不均問題，並將貼文分成8類（如法律、安置、庇護所等）。這個模型在準確率和F1-score都比GPT-3.5、GPT-4等基準模型好，也比人工判讀快很多，有助醫療人員更快掌握家暴倖存者需求，提供即時協助。 PubMed DOI

Generative AI for thematic analysis in a maternal health study: coding semistructured interviews using large language models.
在一項母體健康研究中應用生成式 AI 進行主題分析：利用大型語言模型編碼半結構式訪談 Appl Psychol Health Well Being 2025-05-16

這項研究用 ChatGPT 來自動分析產科醫療人員的訪談內容，讓原本很花時間的質性編碼流程變得更有效率。ChatGPT 的編碼準確率超過八成，還能省下八成以上的時間。不過，準確性、偏誤和隱私等問題還沒完全解決，未來還需要更多研究來克服這些挑戰。 PubMed DOI

A case study of forensic psychiatry experts' reports analysis through large language models.
利用大型語言模型分析法醫精神科專家報告之個案研究 Int J Law Psychiatry 2025-06-14

這項研究發現，GPT-4o能有效從法醫精神科報告中擷取並摘要臨床與非臨床資訊，雖然整合關鍵細節仍有困難，但顯示AI有助於半自動化資料整理，未來有望推動大型研究資料庫的建立。 PubMed DOI

原始文章

站上相關主題文章列表