原始文章

這項研究提出 DFT_ANPD 深度學習框架,結合分子結構和 SMILES 字串語意,能更準確預測天然化合物的抗癌潛力。模型表現優於現有方法,成功找出多個有潛力的抗癌候選藥物,包括 FDA 已核准的藥物,並證實這些化合物與癌症相關蛋白有強結合力,顯示有助加速抗癌藥物開發。 PubMed DOI


站上相關主題文章列表

致癌物的識別與分類對癌症流行病學非常重要,但現有系統如IARC和NTP面臨文獻增長的挑戰。為此,我們開發了CarD-T框架,利用變壓器技術有效識別潛在致癌物。CarD-T在已知致癌物的PubMed摘要上進行訓練,並成功識別了60%的已確立致癌物,還提名了約1500個潛在致癌物。與GPT-4相比,CarD-T在召回率和F1分數上表現更佳,並能評估致癌性矛盾證據。總之,CarD-T是識別致癌物的強大工具,提升公共健康應對能力。 PubMed DOI

藥物抗性在癌症治療中是一大挑戰,尤其是化療和靶向治療的反應率不高。為了解決這個問題,研究團隊開發了名為DrugFormer的新模型,這是一個圖增強的大型語言模型,能預測單細胞層級的藥物抗性。DrugFormer在大量單細胞數據上訓練,表現優異,特別是在難治性多發性骨髓瘤和急性髓性白血病的數據分析中,成功識別抗藥性細胞並揭示其分子機制。這項技術有助於個性化治療策略的發展。 PubMed DOI

這項研究探討了結合MegaMolBART編碼器與XGBoost分類器的模型,成功預測化合物的血腦屏障(BBB)通透性。研究使用4956種BBB+和2851種BBB-的數據集,並分析了2461種BBB+和2184種BBB-化合物。發現temozolomide及21種化合物的通透性係數超過10 × 10<sup>-7</sup> cm/s,顯示其顯著通透性。此外,研究還評估了化合物的ADME特性及其對腦內皮細胞的細胞毒性影響,強調AI在藥物發現中的潛力。 PubMed DOI

這項研究探討生成大型語言模型(LLMs),特別是GPT,在癌細胞系藥物敏感性預測(DSP)中的應用。研究調整了提示工程技術,提升GPT在藥物基因組學數據上的表現,並與現有基準比較。 主要發現包括: 1. 開發三種提示模板,提升GPT處理結構化數據的能力。 2. 微調方法顯著提高F1分數,表現最佳。 3. GPT在GDSC數據集上F1分數提高16%,展現強大泛化能力。 4. 提供藥物與通路關聯的見解,與先前發現一致。 總體而言,研究顯示GPT可作為精準腫瘤學的有效工具,改善癌症治療策略。研究代碼和數據集已公開於GitHub。 PubMed DOI

準確預測分子毒性對藥物開發非常重要,傳統方法多依賴指紋或圖形特徵。隨著大型語言模型(LLMs)的出現,分子表示學習有了新機會。我們提出了BFGTP,一個基於BERT的兩階段分子表示學習框架,專注於毒性預測。此方法包含獨立編碼器和兩階段引導策略,能有效整合多種分子描述。實驗結果顯示,BFGTP在七個毒性數據集上表現優於現有基準,並在多項指標上達到最佳表現,證明其有效性。 PubMed DOI

作者提出 BAITSAO 統一模型,運用大型語言模型產生的嵌入技術,提升癌症藥物協同作用的預測準確度。該模型經多任務學習訓練,表現優於現有方法,還能協助新藥發現、藥物與基因互動分析及多重藥物協同效果預測。 PubMed DOI

傳統藥物設計又慢又容易失敗,深度學習模型像DrugGPT雖然能產生新分子,但常常沒用。DrugGen是改良版,結合真實資料和優化技術,能產生100%有效分子,預測和多樣性都更好。測試證明它有效,還能幫助藥物再利用和新藥設計,大大提升藥物開發效率。 PubMed DOI

這項研究開發了NICRP-Framework,運用先進NLP技術和大型語言模型,分析各類飲食資料來預測大腸直腸癌風險。該框架能有效處理資料不平衡問題,找出關鍵營養因子,預測準確率高達98.4%。這有助於深入了解飲食與癌症的關聯,並推動更精準、個人化的預防策略。 PubMed DOI

TEmbed-DDI 是一種新方法,利用大型語言模型的嵌入技術,結合醫療情境資訊,提升藥物交互作用(DDI)註釋的準確度。它不只看分子結構,還用有意義的文本特徵,讓藥物表示更完整。這方法在西藥和中藥的測試都表現優異,也是首次把中藥納入 DDI 註釋,未來在醫學研究和新藥開發很有潛力。 PubMed DOI

這項研究利用先進的transformer模型(DNABERT-2和Nucleotide Transformer),有效區分癌症與非癌症基因突變。團隊結合真實與合成資料訓練,解決資料不平衡問題。結果顯示,這方法在各項指標上都比現有模型更優秀,有助提升基因分析準確度,未來有望推動個人化癌症治療發展。 PubMed DOI