Unlocking the potential of advanced large language models in medication review and reconciliation: A proof-of-concept investigation.
釋放先進大型語言模型在藥物審查和調解中的潛力：一項概念驗證研究。 Explor Res Clin Soc Pharm 2024-09-11

這項研究評估了大型語言模型（LLMs）在藥物審查中的表現，特別是劑量錯誤、藥物相互作用及基因組學建議的能力。研究測試了四個LLM，發現ChatGPT在劑量方案上表現良好，但對simvastatin的問題有例外。所有LLM都能識別warfarin的相互作用，但錯過metoprolol和verapamil的相互作用。Claude-Instant在治療監測上提供適當建議，而Gemini在基因組學上表現不錯。研究指出，LLM在藥物審查中有潛力，但整合進醫療系統對病人安全至關重要。 PubMed DOI

Standardized patient profile review using large language models for case adjudication in observational research.
使用大型語言模型進行觀察性研究中的案例裁定的標準化病人檔案審查。 NPJ Digit Med 2025-01-09

這項研究探討了結合知識增強電子檔案審查系統（KEEPER）與大型語言模型（LLMs），自動化觀察性研究中基於行政索賠和電子健康紀錄的案例裁定過程的可行性。傳統上，研究人員面臨數據限制及手動審查的挑戰。KEEPER 提取臨床發現，LLMs 評估患者是否符合案例標準。研究測試了四種 LLM，包括 GPT-4，結果顯示敏感性從 78% 到 98% 不等，特異性範圍為 48% 到 98%。這顯示 LLMs 在自動化表型評估上有潛力，未來可能減少手動審查的需求。 PubMed DOI

Collaborative large language models for automated data extraction in living systematic reviews.
用於自動數據提取的協作大型語言模型在活系統評價中的應用。 J Am Med Inform Assoc 2025-01-21

這項研究探討如何利用大型語言模型（LLMs）自動化提取生活系統性回顧（LSRs）中的數據，模擬兩位審稿人的流程。分析了來自10個試驗的數據，針對23個變數進行研究。使用的模型包括GPT-4-turbo和Claude-3-Opus。結果顯示，在提示開發集中，模型達到96%的高一致性率，但在測試集中降至87%。經過交叉評析後，51%的不一致回應變得一致，整體準確率提升至0.76。研究表明，LLMs能有效支持數據提取，促進系統性回顧的進行。 PubMed DOI

Language models for data extraction and risk of bias assessment in complementary medicine.
補充醫學中數據提取和偏倚風險評估的語言模型。 NPJ Digit Med 2025-01-31

這項研究評估大型語言模型（LLMs）在107項補充醫學試驗中的數據提取及偏見風險評估的效果。僅用LLM的方法，如Moonshot-v1-128k和Claude-3.5-sonnet，準確率達95%以上；而LLM輔助的方法更佳，準確率可達97%以上。此外，LLM輔助的方法處理時間大幅縮短，分別只需14.7分鐘和5.9分鐘，傳統方法則需86.9分鐘和10.4分鐘。這些結果顯示，LLM結合人類專業知識能有效提升證據綜合的效率與準確性。 PubMed DOI

Automating pharmacovigilance evidence generation: using large language models to produce context-aware structured query language.
自動化藥物監測證據生成：使用大型語言模型產生具上下文意識的結構化查詢語言。 JAMIA Open 2025-02-10

這項研究探討大型語言模型（LLMs），特別是OpenAI的GPT-4，如何提升自然語言查詢（NLQs）轉換為藥物監測（PV）數據庫中的SQL查詢的準確性。研究分三個階段，變化查詢複雜度，並評估有無商業上下文文件的效果。結果顯示，NLQ轉換為SQL的準確性從8.3%提升至78.3%，在所有複雜度層級中均一致。排除高複雜度查詢時，準確率可達85%。這項研究對非技術用戶在數據密集型領域的信息可及性具有重要意義。 PubMed DOI

Linguistic changes in spontaneous speech for detecting Parkinson's disease using large language models.
使用大型語言模型檢測帕金森病的自發言語語言變化。 PLOS Digit Health 2025-02-10

帕金森氏症是一種影響全球超過一千萬人的神經退行性疾病，每年新增病例達一百萬。由於症狀多樣，診斷相當複雜，語言障礙可能在運動症狀前就出現，這使得語言分析成為早期檢測的有力工具。最近，大型語言模型（LLMs）的進展讓我們能夠自動識別帕金森氏症，準確率高達78%。研究顯示，這些模型能提取更相關的語言特徵，可能顯著改善診斷方法並幫助理解疾病進展。 PubMed DOI

Inductive reasoning with large language models: A simulated randomized controlled trial for epilepsy.
大型語言模型的歸納推理：針對癲癇的模擬隨機對照試驗。 Epilepsy Res 2025-02-28

這項研究探討了人工智慧，特別是大型語言模型（LLMs），在模擬隨機臨床試驗中對癲癇藥物cenobamate的應用。試驗包含240名患者，分為安慰劑組和全劑量藥物組。AI能準確分析臨床筆記，評估藥物的療效與安全性，結果顯示AI分析與人類分析相近，僅在療效識別上有小差異。這顯示AI在未來臨床研究中具備高效且可擴展的潛力，能減少對傳統數據挖掘方法的需求。 PubMed DOI

Detecting neuropsychiatric fluctuations in Parkinson's Disease using patients' own words: the potential of large language models.
使用病患自身語言偵測 Parkinson's Disease 神經精神波動：大型語言模型的潛力 NPJ Parkinsons Dis 2025-04-18

這項研究用機器學習和大型語言模型分析33位帕金森氏症患者在服藥前後的語音內容，最好的模型準確率高達98%，還能預測神經精神評分。結果顯示，透過語音分析，有機會遠端且全面監測帕金森氏症患者的神經精神狀況。 PubMed DOI

Using Large Language Models for Advanced and Flexible Labelling of Protocol Deviations in Clinical Development.
在臨床開發中運用大型語言模型進行先進且彈性的試驗偏差標註 Ther Innov Regul Sci 2025-05-13

臨床試驗中，方案偏差（PDs）定義不一，難以有效辨識關鍵影響。傳統用NLP分類PDs又慢又複雜。這項研究用Meta Llama2大型語言模型，開發自動化系統，能快速分類Roche系統裡的PDs，自動標記出超過八成可能影響結果的PDs，讓專家能聚焦審查，大幅提升效率，幾分鐘就能得到有用見解。 PubMed DOI

High-Throughput Phenotyping of the Symptoms of Alzheimer Disease and Related Dementias Using Large Language Models: Cross-Sectional Study.
使用大型語言模型進行阿茲海默症及相關失智症症狀的高通量表現型分析：橫斷面研究 JMIR AI 2025-06-03

研究團隊開發了一套經微調的大型語言模型，能自動從電子病歷的臨床紀錄中擷取阿茲海默症及相關失智症的7大症狀，準確度（AUROC）高達0.97-0.99，優於傳統方法。這些症狀不僅能預測失智症診斷，還和腦部MRI結果有關，有助提升診斷準確率並推動相關研究。 PubMed DOI

原始文章

站上相關主題文章列表