原始文章

這項研究旨在透過自動化系統提升從科學文獻中提取藥物動力學(PK)數據的效率。研究團隊建立了一個包含2,640個專家標註表格的語料庫,並訓練了一個監督式分類流程,結合GPT-4來改善預測準確度,F1分數超過96%。該模型應用於PubMed Central的PK論文,並整合到www.pkpdai.com的搜尋工具中,代表自動化PK數據提取的重要進展,語料庫和代碼已公開。 PubMed DOI


站上相關主題文章列表

研究發現ChatGPT在藥物動力學數據分析中表現不錯,尤其在報告撰寫和程式碼生成方面。然而,在處理指數函數的數值計算時容易出錯。ChatGPT有潛力成為藥物動力學數據分析的生產力工具,但需要改進以提高數值計算的準確性。 PubMed DOI

研究使用ChatGPT自動化生物醫學文獻審閱,以加速新興傳染病時的藥物發現。測試結果顯示,與專家相比,ChatGPT在準確性和效能上表現優異,尤其在識別SARS-CoV-2和尼帕病毒的藥物靶點方面。這研究顯示ChatGPT在全球衛生緊急情況下,對加速藥物發現和靶點識別有相當潛力。 PubMed DOI

科學文件中的化學資訊可用來深入了解。自動提取方法目前使用機器學習,但性能、可轉移性和擴展性有限。ChemREL是一個表現優異的新工具,能高準確地提取熔點和LD50值。比現有方法和GPT-4更好,整體F1分數達95.4%。ChemREL是開源的,旨在增進化學資訊提取,促進新發現。 PubMed DOI

新藥開發和不良藥物反應檢測傳統上耗時且成本高,但隨著大規模醫療數據庫和大型語言模型的興起,藥物篩選變得更有效。本研究提出一個自動化高通量藥物篩選流程,具備多項優勢,包括估算藥物與疾病的關聯、整合藥物重新利用與監測、準確解析暴露時間等。研究分析了661萬名患者的數據,發現16,901對藥物-疾病組合顯著降低風險,11,089對則顯著增加風險,顯示出潛在的藥物重新利用和安全問題。這項研究展示了自然語言處理在藥物流行病學中的潛力。 PubMed DOI

藥物引起的肝損傷(DILI)是藥物安全性的重要議題,也是急性肝衰竭的主要原因。傳統的文獻搜尋方法因藥物相互作用的複雜性而效率不高,且手動整理容易出錯。近期,利用大型語言模型(LLMs)如LLaMA-2,研究人員開發了專門用於DILI分析的模型,並在CAMDA 2022的數據集上達到97.19%的準確率,顯示出LLMs在文獻識別上的潛力,可能簡化監管審查流程。 PubMed DOI

準確預測ADMET(吸收、分佈、代謝、排泄和毒性)特性對藥物開發非常重要,能幫助選擇具良好藥物動力學及降低毒性的化合物。目前的ADMET數據集因樣本數量少及代表性不足而受限。為了解決這些問題,我們提出了一個多代理數據挖掘系統,利用大型語言模型識別14,401個生物測試的實驗條件,並整合不同來源的數據,最終創建了PharmaBench,包含156,618條原始條目,旨在支持藥物發現相關的AI模型開發。 PubMed DOI

這項研究探討了利用生成式人工智慧(GenAI)自動提取PICO(人口、介入、比較、結果)元素的方法,對於系統文獻回顧(SLRs)非常重要。考量到歐盟健康技術評估法規的要求,研究評估了GenAI在此任務上的可行性和效率。 研究人員從PubMed檢索了682,667篇隨機對照試驗的摘要,使用OpenAI的GPT-4o進行處理,PICO元素提取在三小時內完成,平均每1,000篇摘要處理時間為200秒。驗證結果顯示,GPT-4o準確提取了98%的PICO元素,顯示GenAI能顯著提升SLRs的效率,幫助製藥開發者更好地應對健康技術評估。 PubMed DOI

這項研究開發了一個名為藥學實踐研究領域分類器(PPRDC),用來將藥學實踐教職員的出版物分為臨床、教育、社會與行政,以及基礎與轉譯四個領域。研究分析了2018至2021年間的1,000篇摘要,並微調了多個BERT模型。PPRDC在各項分類指標上表現優異,F1分數達89.4,並在重現性上獲得完美評價(Cohen's kappa = 1.0)。這項成果不僅提升了分類效率,還對文獻計量學研究有重要貢獻,幫助作者和編輯做出更好的期刊選擇。 PubMed DOI

藥物基因組學(PGx)旨在根據個人基因特徵來個性化醫療,以提升藥物療效與安全性。不過,PGx 研究面臨數據分散和提取繁瑣的挑戰。本研究評估大型語言模型(LLMs),特別是 Llama3.1-70B,能否自動化從 FDA 藥物標籤中提取 PGx 資訊。結果顯示,該模型在識別藥物-生物標記對的準確率達 91.4%,並且在提取 PGx 類別的穩定性超過 85%。這不僅簡化了數據提取,還有助於改善個性化醫療,並為少數族群揭示新資訊,顯示 LLMs 在 PGx 研究中的潛力。 PubMed DOI

這項研究介紹了MaTableGPT,一個基於GPT的工具,專門從材料科學文獻中的表格提取數據,特別針對水分解催化劑。傳統的提取方法因表格格式多樣而不夠有效。MaTableGPT透過改進的數據表示和分割策略,提升理解能力,提取準確率高達96.8%。研究比較了零樣本、少樣本和微調學習方法,發現少樣本學習在準確性和成本上達到最佳平衡,提取準確率超過95%。此外,MaTableGPT建立的數據庫為催化劑的過電位和元素利用率提供了重要見解。 PubMed DOI