A question-answering framework for automated abstract screening using large language models.
使用大型語言模型的自動摘要篩選問答框架。 J Am Med Inform Assoc 2024-07-23

這篇論文探討系統性回顧中摘要篩選的挑戰，並利用大型語言模型（LLMs）的零-shot能力來解決。研究提出一個新穎的問答框架，將篩選標準視為問題，讓LLM回答，並根據綜合回應做出納入或排除的決策。透過CLEF eHealth 2019 Task 2基準驗證，結果顯示該框架在31個系統性回顧數據集上表現優於傳統方法和微調的BERT模型，顯示LLM在摘要篩選中的有效性與潛力。 PubMed DOI

Inductive thematic analysis of healthcare qualitative interviews using open-source large language models: How does it compare to traditional methods?
使用開源大型語言模型進行醫療質性訪談的歸納主題分析：與傳統方法相比如何？ Comput Methods Programs Biomed 2024-07-27

這項研究探討大型語言模型（LLMs）在質性主題分析中的應用，並將其表現與人類分析師在精神科環境中的表現進行比較。研究使用了一個700億參數的開源LLM，並透過先進的提示工程，能在幾分鐘內從半結構性訪談中生成主題。分析結果顯示，LLM生成的主題與人類創建的主題之間的相似性中等到顯著，顯示LLMs在質性研究中有潛力，能提升研究的可及性。 PubMed DOI

Applying Large Language Models to Interpret Qualitative Interviews in Healthcare.
應用大型語言模型解讀醫療領域的質性訪談。 Stud Health Technol Inform 2024-08-23

這項研究探討如何利用大型語言模型（LLMs）來改善醫療領域的質性訪談數據解釋。傳統的主題建模方法常常過於簡化，難以捕捉患者和醫療專業人員的細微經驗。研究發現，LLMs在數據解釋的效率和深度上表現更佳，顯示它們在整合人類觀點進入可持續醫療系統的發展中，可能扮演重要角色，並有助於解決該領域的挑戰。 PubMed DOI

On the development and validation of large language model-based classifiers for identifying social determinants of health.
基於大型語言模型的分類器在識別健康社會決定因素中的開發與驗證。 Proc Natl Acad Sci U S A 2024-09-16

這項研究強調在醫療照護中評估健康社會決定因素（SDoH）的重要性，以改善病患照護並縮小健康差距。研究探討了電子健康紀錄（EHRs）中SDoH數據不足的挑戰，主要因為缺乏標準化的診斷代碼。研究團隊使用大型語言模型（如BERT和RoBERTa）來分類無家可歸、食物不安全和家庭暴力等SDoH概念，並創建合成訓練數據集。結果顯示，這些模型能有效提取SDoH資訊，幫助醫療提供者識別高風險病患，進而實施針對性干預，支持減少健康差距的努力。 PubMed DOI

<i>Literature search sandbox</i>: a large language model that generates search queries for systematic reviews.
<i>文獻搜尋沙盒</i>：一個生成系統評價搜尋查詢的大型語言模型。 JAMIA Open 2024-09-26

系統性回顧（SR）的搜尋查詢開發通常相當繁瑣。本研究利用大型語言模型（LLMs）來自動生成基於SR標題和關鍵問題的布林搜尋查詢，並整理了10,346個來自PROSPERO的查詢作為訓練數據集。模型評估顯示，生成的搜尋查詢中位敏感度達85%，但仍有改進空間。訪談結果指出，這些模型可作為初步探索的工具，未來可透過提升查詢質量及特定領域微調來增強效果。此專案的數據集將有助於LLMs的訓練與評估。 PubMed DOI

A new AI-assisted data standard accelerates interoperability in biomedical research.
一種新的 AI 輔助數據標準加速生物醫學研究中的互操作性。 medRxiv 2024-11-01

這篇論文探討如何利用大型語言模型（LLMs）來簡化生物醫學數據處理，特別是自動化數據發現與整合。我們推廣互操作性標準，透過創建共同數據元素（CDEs）來提升數據整合的效率。經過分析三十一項研究，我們開發了CDEs，並使用API填寫OpenAI GPT模型的元數據。經專家審查，94%的元數據無需手動修訂。我們的方法在阿茲海默症和帕金森基因計畫的數據中測試，顯示出良好的互操作性，旨在提升生物醫學研究的效率與合作性。 PubMed DOI

An Embedding-Based Semantic Analysis Approach: A Preliminary Study on Redundancy Detection in Psychological Concepts Operationalized by Scales.
基於嵌入的語義分析方法：心理概念中由量表操作化的冗餘檢測初步研究。 J Intell 2025-01-24

這項研究探討心理概念重疊的問題，這種重疊讓數據解釋變得複雜，增加了參與者的負擔。研究引入了一種名為嵌入式語義分析方法（ESAA），利用自然語言處理技術檢測心理量表中的冗餘。透過OpenAI的text-embedding-3-large模型，ESAA生成高維語義向量，並用層次聚類識別相似項目。研究進行了三個實驗，評估ESAA在識別相似項目、區分不同項目及揭示冗餘方面的有效性。結果顯示，ESAA表現穩定且優於基於GPT-4的聊天機器人，顯示其在心理研究中的潛力。 PubMed DOI

Scalable information extraction from free text electronic health records using large language models.
使用大型語言模型從自由文本電子健康紀錄中進行可擴展的信息提取。 BMC Med Res Methodol 2025-01-28

這項研究探討開源大型語言模型（LLMs）在從電子健康紀錄（EHRs）中提取社會健康決定因素（SDoH）數據的效果。研究隨機選取200名患者，並由兩位審查者手動標記九個SDoH方面，達成93%的高一致性。結果顯示，LLMs的表現明顯優於基準模型，特別是在識別明確提及的SDoH方面。最佳模型openchat_3.5在所有SDoH方面的準確率最高。研究強調進一步精煉和專業訓練的潛力，以提升LLMs在臨床研究中的應用，最終改善醫療結果。 PubMed DOI

SEMbeddings: how to evaluate model misfit before data collection using large-language models.
SEMbeddings：如何在數據收集之前使用大型語言模型評估模型不適合性。 Front Psychol 2025-02-19

這篇論文介紹了一個新工具 SEMbeddings，結合微調的嵌入模型與潛在測量模型，能在實際數據收集前評估項目反應數據的適配度。作者將其應用於 VIA-IS-P 問卷，分析了 31,697 名參與者的回應，結果顯示項目嵌入的餘弦相似度與實證相關性有顯著關聯 (r = 0.67)。論文也提到，傳統適配指標可能不夠準確，但修正指標能提供潛在不適配的見解，對於問卷開發有幫助。隨著大型語言模型的進步，這些方法有望提升新問卷的開發效率。 PubMed DOI

Breaking Digital Health Barriers: Development and Validation of an LLM-Based Tool for Automated OMOP Mapping.
打破數位健康障礙：基於 LLM 的自動 OMOP 映射工具的開發與驗證。 J Med Internet Res 2025-03-27

將臨床數據整合成OMOP標準格式對數據共享和分析至關重要，但過程複雜且耗時。為解決這一問題，開發了一個友好的自動化工具，利用大型語言模型來轉換臨床試驗數據和電子健康紀錄。該工具採用三層語義匹配系統，並在驗證中展現出高準確性，精確度達0.92至0.99，召回率達0.88至0.97。這使得小型研究團隊能更輕鬆參與數據共享，對加速臨床研究數據標準化具有重要意義。 PubMed DOI

原始文章

站上相關主題文章列表