原始文章

觀察性健康數據科學與資訊(OHDSI)社群專注於利用真實世界醫療數據進行大規模研究。為了參與,必須將當地術語映射到OHDSI標準詞彙,並轉換為觀察性醫療結果夥伴關係共同數據模型(OMOP CDM)。在日本,儘管醫療科技先進,真實世界數據卻未被充分利用,因為國內術語系統與國際標準不一致。研究團隊使用大型語言模型(LLM)成功將日本藥品數據映射到RxNorm,並經專家驗證,這對藥物流行病學及相關研究非常有價值。 PubMed DOI


站上相關主題文章列表

RxBERT是在BERT基礎上訓練的模型,應用在FDA藥物標籤文件,提升了藥物資訊分析效能。在各種任務中表現優異,勝過其他自然語言處理模型,有助於提升藥物安全審查和監管決策效果。RxBERT能協助研究人員和FDA審查員更有效地利用藥物標籤數據,促進公共衛生進步。這研究凸顯了專業監管文件訓練語言模型的重要性。 PubMed DOI

這項研究比較了不同大型語言模型在將病患配對到醫療臨床試驗上的效果。研究發現,當開源模型在專門的數據集上進行微調時,其表現可以與專有模型媲美。這項研究展示了開源模型在醫療應用中的潛力,並提供了一個數據集和一個經過微調的模型供公眾使用,以鼓勵在這個領域進行更多研究。 PubMed DOI

大型語言模型提升了我們對生物學和化學的理解,但在藥物發現、量子化學和結構生物學仍需更好方法。MISATO數據集結合了小分子的量子性質和實驗蛋白質-配體複合物的模擬,為語言模型提供寶貴數據。透過這些數據,機器學習模型可提高藥物發現的準確性。MISATO旨在推動開發先進AI模型以助藥物發現。 PubMed DOI

研究指出,大型語言模型(LLM)在翻譯藥物描述上有潛力,但仍有改進空間。這種翻譯有助於開發更有效的藥物治療,降低成本,並透過人工智慧改革醫療領域。然而,藥物和適應症研究仍需更深入。 PubMed DOI

新藥開發和不良藥物反應檢測傳統上耗時且成本高,但隨著大規模醫療數據庫和大型語言模型的興起,藥物篩選變得更有效。本研究提出一個自動化高通量藥物篩選流程,具備多項優勢,包括估算藥物與疾病的關聯、整合藥物重新利用與監測、準確解析暴露時間等。研究分析了661萬名患者的數據,發現16,901對藥物-疾病組合顯著降低風險,11,089對則顯著增加風險,顯示出潛在的藥物重新利用和安全問題。這項研究展示了自然語言處理在藥物流行病學中的潛力。 PubMed DOI

準確預測ADMET(吸收、分佈、代謝、排泄和毒性)特性對藥物開發非常重要,能幫助選擇具良好藥物動力學及降低毒性的化合物。目前的ADMET數據集因樣本數量少及代表性不足而受限。為了解決這些問題,我們提出了一個多代理數據挖掘系統,利用大型語言模型識別14,401個生物測試的實驗條件,並整合不同來源的數據,最終創建了PharmaBench,包含156,618條原始條目,旨在支持藥物發現相關的AI模型開發。 PubMed DOI

這項研究探討結合檢索增強生成(RAG)模型與大型語言模型(LLM),以提升國際詞彙中藥物名稱對應的準確性。研究過程中,將藥物成分名稱翻譯成英文,並使用日本藥品名稱,從OHDSI標準詞彙中提取藥物概念。結果顯示,LLM + RAG的組合表現顯著優於傳統方法,命中率超過90%,而基準僅64%。此外,r-precision指標也從23%提升至41%至50%。整體而言,RAG與LLM的整合提供了更有效的全球藥物資訊對應方法。 PubMed DOI

這項研究探討了生成預訓練變壓器(GPT)模型在評估處方藥、非處方藥及草藥補充品之間的藥物相互作用的有效性。以Lexicomp®為參考,研究評估了73對藥物組合,結果顯示所有GPT模型的準確率都低於50%,且與Lexicomp的協議度也很低。雖然GPT-4和GPT-4o在識別高風險相互作用上稍有改善,但整體而言,這些發現顯示大型語言模型在藥物相互作用評估中的局限性,對病人安全的可靠性引發擔憂。 PubMed DOI

藥物基因組學(PGx)旨在根據個人基因特徵來個性化醫療,以提升藥物療效與安全性。不過,PGx 研究面臨數據分散和提取繁瑣的挑戰。本研究評估大型語言模型(LLMs),特別是 Llama3.1-70B,能否自動化從 FDA 藥物標籤中提取 PGx 資訊。結果顯示,該模型在識別藥物-生物標記對的準確率達 91.4%,並且在提取 PGx 類別的穩定性超過 85%。這不僅簡化了數據提取,還有助於改善個性化醫療,並為少數族群揭示新資訊,顯示 LLMs 在 PGx 研究中的潛力。 PubMed DOI

將臨床數據整合成OMOP標準格式對數據共享和分析至關重要,但過程複雜且耗時。為解決這一問題,開發了一個友好的自動化工具,利用大型語言模型來轉換臨床試驗數據和電子健康紀錄。該工具採用三層語義匹配系統,並在驗證中展現出高準確性,精確度達0.92至0.99,召回率達0.88至0.97。這使得小型研究團隊能更輕鬆參與數據共享,對加速臨床研究數據標準化具有重要意義。 PubMed DOI