原始文章

臨床試驗中,方案偏差(PDs)定義不一,難以有效辨識關鍵影響。傳統用NLP分類PDs又慢又複雜。這項研究用Meta Llama2大型語言模型,開發自動化系統,能快速分類Roche系統裡的PDs,自動標記出超過八成可能影響結果的PDs,讓專家能聚焦審查,大幅提升效率,幾分鐘就能得到有用見解。 PubMed DOI


站上相關主題文章列表

本研究評估三種大型語言模型(LLMs)在心血管藥物開發文獻篩選中的有效性,重點包括: 1. **表現**:分析每個LLM在識別和總結心血管藥物相關文獻的能力。 2. **成本**:探討使用這些LLMs的財務影響,並與傳統文獻回顧方法比較時間和資源的節省。 3. **提示工程權衡**:研究不同提示設計對模型輸出的影響,及其對文獻篩選效率的影響。 本研究旨在揭示LLMs在心血管藥物開發中的潛力,促進更明智的決策和加速新療法上市。 PubMed DOI

這篇論文提出了一個臨床試驗方案推薦系統,結合大型語言模型GPT-4與知識圖譜,旨在提升患者與臨床試驗的匹配效率。系統透過GPT-4的語意分析能力,根據患者特徵推薦合適的試驗方案。實驗結果顯示,GPT-4在方案排序和個性化推薦上優於其他模型。未來版本將納入更多患者因素,進一步提升推薦的個性化程度。這種整合有望對醫學研究和公共衛生管理帶來顯著好處,推動臨床試驗的發展。 PubMed DOI

藥物基因組學(PGx)旨在根據個人基因特徵來個性化醫療,以提升藥物療效與安全性。不過,PGx 研究面臨數據分散和提取繁瑣的挑戰。本研究評估大型語言模型(LLMs),特別是 Llama3.1-70B,能否自動化從 FDA 藥物標籤中提取 PGx 資訊。結果顯示,該模型在識別藥物-生物標記對的準確率達 91.4%,並且在提取 PGx 類別的穩定性超過 85%。這不僅簡化了數據提取,還有助於改善個性化醫療,並為少數族群揭示新資訊,顯示 LLMs 在 PGx 研究中的潛力。 PubMed DOI

大型語言模型(LLMs)如GPT和LLaMA在自然語言處理上表現優異,但在製藥製造等特定領域仍在探索中。本研究利用製造偏差的歷史記錄,旨在提升生產力、效率、品質和合規性。透過建立數據集,研究評估生成型LLMs和文本嵌入模型在處理偏差任務的能力。結果顯示,較大的生成模型在提取任務中表現佳,推理能力強,但也有幻覺行為。嵌入模型則能有效捕捉偏差類別的語義。整體而言,AI工具在製藥製造流程中展現出顯著潛力,並提出未來研究的方向。 PubMed DOI

這項研究評估大型語言模型(LLMs)在生成臨床試驗計畫書的有效性。研究人員使用LLM生成不同疾病和試驗階段的計畫書,並根據臨床思維、透明度、醫學術語和內容相關性四個標準進行評估。結果顯示,LLM在內容相關性和術語方面表現良好,但在臨床思維和透明度上則較差。為提升表現,研究人員採用檢索增強生成(RAG)方法,顯著改善了內容質量,提升了臨床思維和透明度的分數。這表明RAG方法能有效提升LLM在臨床試驗文件撰寫的可用性,並可能改變藥物開發過程。 PubMed DOI

這項研究探討了使用開源大型語言模型Llama 3,分析2018至2023年間去中心化臨床試驗(DCTs)的趨勢,並解決試驗登記中術語不標準的問題。研究人員從ClinicalTrials.gov獲取數據,使用三個不同版本的Llama 3模型進行DCT分類和提取去中心化元素。結果顯示,微調模型能提高敏感性,但正確預測值較低,需專注於DCT術語。最終識別出692個DCT,主要為第二期試驗,顯示大型語言模型在分析非結構化臨床數據的潛力,並強調管理模型偏見的重要性。 PubMed DOI

這項概念驗證研究顯示,大型語言模型(LLMs)能自動將非結構化的病例報告轉換為臨床評分。我們使用標準化的臨床評分量表,並評估LLM對其輸出的信心,以改善提示策略並確保結果的可重複性。針對藥物引起的帕金森症病例報告,研究結果顯示LLM提取的數據與臨床評分者手動提取的結果相當接近,準確率高達90%。 PubMed DOI

這個專案用標準化流程和大型語言模型來分析MAUDE資料庫裡醫療器材報告的自由敘述,提升事件分類的準確率和效率。以內視鏡黏膜切除術為例,這方法也能應用到其他醫材。不過,若要做更全面的病人安全研究,還需要更多元且大量的報告樣本。 PubMed DOI

在電子病歷中找出藥物不良事件(ADEs)很困難,因為相關資訊多藏在醫師的自由書寫紀錄裡。人工審查又很耗時,所以需要自動化工具。這項研究用大型語言模型來偵測ADEs,發現不到15%的出院紀錄會明確記載ADEs與藥物的關聯,顯示通報機制還有很大改進空間。 PubMed DOI

這項研究比較多款大型語言模型在自動化 pharmacometrics 任務的表現,發現 Claude 3.5 Sonnet 在產生模型圖、參數表和報告上最準確且易用。ChatGPT 4o 雖能模擬,但遇到複雜模型會卡關。整體來說,LLMs 有助於簡化工作流程,但還是需要專家把關結果。 PubMed DOI