原始文章

觀察性健康數據科學與資訊(OHDSI)社群專注於利用真實世界醫療數據進行大規模研究。為了參與,必須將當地術語映射到OHDSI標準詞彙,並轉換為觀察性醫療結果夥伴關係共同數據模型(OMOP CDM)。在日本,儘管醫療科技先進,真實世界數據卻未被充分利用,因為國內術語系統與國際標準不一致。研究團隊使用大型語言模型(LLM)成功將日本藥品數據映射到RxNorm,並經專家驗證,這對藥物流行病學及相關研究非常有價值。 PubMed DOI


站上相關主題文章列表

準確預測ADMET(吸收、分佈、代謝、排泄和毒性)特性對藥物開發非常重要,能幫助選擇具良好藥物動力學及降低毒性的化合物。目前的ADMET數據集因樣本數量少及代表性不足而受限。為了解決這些問題,我們提出了一個多代理數據挖掘系統,利用大型語言模型識別14,401個生物測試的實驗條件,並整合不同來源的數據,最終創建了PharmaBench,包含156,618條原始條目,旨在支持藥物發現相關的AI模型開發。 PubMed DOI

這項研究探討結合檢索增強生成(RAG)模型與大型語言模型(LLM),以提升國際詞彙中藥物名稱對應的準確性。研究過程中,將藥物成分名稱翻譯成英文,並使用日本藥品名稱,從OHDSI標準詞彙中提取藥物概念。結果顯示,LLM + RAG的組合表現顯著優於傳統方法,命中率超過90%,而基準僅64%。此外,r-precision指標也從23%提升至41%至50%。整體而言,RAG與LLM的整合提供了更有效的全球藥物資訊對應方法。 PubMed DOI

基因學的進展讓基因諮詢需求增加,但合格的諮詢師卻短缺,因此有興趣利用大型語言模型(LLMs)來輔助基因諮詢。本研究針對日本基因諮詢LLMs(JGCLLMs)進行探索,評估了提示工程、檢索增強生成(RAG)和指令調整三種技術的效果。結果顯示,RAG在改善基因諮詢的關鍵指標上特別有效,而其他兩者效果較差。研究也揭示了倫理問題,強調在這些系統應用於醫療前,需持續改進與謹慎評估。 PubMed DOI

在日本,醫療器材的故障和健康問題需報告,JFMDA正努力標準化術語。國際上,IMDRF也有自己的術語標準。為促進國際協調,JFMDA與IMDRF的術語對應至關重要,但目前英日翻譯過程繁瑣且易出錯。本研究旨在找出最佳機器翻譯模型,將IMDRF術語翻譯成日語。研究顯示,GPT-4在各項評估中表現最佳,顯示其能顯著提升醫療術語對應系統的效率。 PubMed DOI

將臨床數據整合成OMOP標準格式對數據共享和分析至關重要,但過程複雜且耗時。為解決這一問題,開發了一個友好的自動化工具,利用大型語言模型來轉換臨床試驗數據和電子健康紀錄。該工具採用三層語義匹配系統,並在驗證中展現出高準確性,精確度達0.92至0.99,召回率達0.88至0.97。這使得小型研究團隊能更輕鬆參與數據共享,對加速臨床研究數據標準化具有重要意義。 PubMed DOI

這篇研究推出首個韓文醫學偏好資料集 KoMeP,能有效協助大型語言模型在生醫領域做對齊。KoMeP 透過自動化流程建立,省下大量人工成本。用 DPO 方法微調後,模型在 KorMedMCQA 測試提升明顯,Llama-3.1-8B 表現提升近 44%。DPO 效果比 ORPO 好,英韓轉移學習也很有用。未來建議擴充資料集並優化對齊方式。 PubMed DOI

基於Transformer的NLP模型能精準把電子病歷裡的藥物對應到OMOP CDM標準,表現比大型語言模型和傳統比對方法更好。常見藥物準確率高達96.5%,隨機藥物也有83%,有助於EHR資料自動化標準化,提升效率與擴展性。 PubMed

這項研究發現,GPT-4o等大型語言模型能根據實際用藥情境(如劑量)準確判斷藥物的ATC分類,表現比傳統搜尋方法更好(92.5%對82.5%)。LLM不僅準確、取得容易,還能考慮情境資訊,對藥物流行病學研究很有幫助。 PubMed DOI

這項研究發現,GPT-3.5-turbo-0125、GPT-4-turbo 和 GPT-4o 在腫瘤科藥物品牌名和學名的配對上表現很好,但在較複雜的臨床任務(如藥物交互作用判斷、診斷副作用等)則表現不穩定,甚至有偏誤。特別是 GPT-3.5-turbo-0125 偏好用品牌名。總結來說,這些模型在簡單任務上可靠,但臨床應用還需更嚴謹的評估與改進。 PubMed DOI

這篇研究比較兩種AI方法,把巴西醫療用語對應到國際標準。方法一結合語意相似度和大型語言模型,方法二用LLM代理人動態優化查詢。兩者準確度差不多,但代理人方法召回率較高。結果顯示,LLM能大幅減少專家整合醫療詞彙的人工負擔。 PubMed DOI