原始文章

腫瘤定位肽(THPs)能特異性結合腫瘤細胞,對癌症治療和檢測有潛力,但傳統檢測方法速度慢且成本高。為解決此問題,我們推出LLM4THP,利用大型語言模型(LLMs)快速檢測THP。該方法結合多種序列特徵,並採用集成策略,透過兩層學習架構提升準確性。LLM4THP在多項指標上表現優於現有方法,源代碼和數據集可在GitHub上獲得。 PubMed DOI


站上相關主題文章列表

少量數據下的LLMs有潛力,但在生物學等複雜領域的泛化能力尚待研究。我們提出使用LLMs進行少樣本學習,預測罕見組織中藥物協同作用。實驗結果顯示,我們的模型CancerGPT在七種罕見組織上表現優異,即使只有124M參數,也不輸給更大的GPT-3。這是首個探討此議題的研究,也是首個在生物反應預測中應用LLM的研究。 PubMed DOI

大型語言模型(LLMs)在少量數據下展現潛力,特別在生物醫學領域。我們提出使用LLMs進行少樣本學習,預測罕見組織中藥物協同作用。實驗結果顯示,我們的CancerGPT模型在極少或零樣本下表現優異,與更龐大的GPT-3模型相當。這研究有助於預測罕見組織中的藥物協同作用,推動LLMs在生物醫學領域的應用。 PubMed DOI

蛋白質在藥物研發中扮演重要角色,但傳統方法太貴又太慢。研究引入了一個快速又精確的分類器,使用了帶有ESM-2嵌入的蛋白質語言模型(PLM),準確率達95.11%。比較結果顯示,ESM-2嵌入比PSSM特徵更優。同時,開發了基於GPT-2的端對端模型,將大型語言模型成功應用在蛋白質辨識上,並經Pharos數據集驗證表現。 PubMed DOI

LNPs是用來遞送mRNA疫苗的重要工具,脂質結構影響疫苗效果。為了提高效率並節省成本,研究者開發了虛擬篩選模型,利用脂質結構和機器學習技術來預測LNPs的轉染效率。這種方法有助於優化脂質特性,可望提升疫苗研發效率。詳細資訊可至https://github.com/Sanofi-Public/LipoBART。 PubMed DOI

AMPs是短肽,可對抗微生物藥物的抗藥性。開發受到對人體細胞的毒性影響,難以控制。GPT-3已用於預測AMP活性和毒性,但簡單模型如RNN和SVM表現更佳。建議目前使用簡單模型,但需重新評估大型語言模型的潛力。 PubMed DOI

毒性是治療性肽開發的一大挑戰,常導致臨床試驗失敗。我們的團隊在2013年推出了ToxinPred,預測肽毒性的工具。這篇論文介紹了ToxinPred的升級版,提升了預測的可靠性與準確性。我們結合了機器學習和深度學習技術,改善了靈敏度與特異性之間的平衡,並在獨立數據集上取得了優異的表現。我們還推出了ToxinPred3的獨立軟體包和網頁伺服器,方便科學社群使用,網址為 https://github.com/raghavagps/toxinpred3 和 https://webs.iiitd.edu.in/raghava/toxinpred3/。 PubMed DOI

主要組織相容性複合體(MHC)在將表位呈現給T細胞受體中扮演關鍵角色,啟動免疫反應。傳統疫苗設計通常需透過昂貴的高通量篩選來找出高MHC結合親和力的表位。近期,人工智慧(AI)在蛋白質結構預測等領域展現潛力。我們提出了一種基於深度強化學習的生成算法RLpMIEC,能有效設計出結合MHC-I系統的肽,並具備高可解釋性,對加速肽基疫苗開發具有重要意義。 PubMed DOI

隨著人工智慧工具的普及,患者和醫療專業人員越來越依賴這些工具提供的醫療資訊。本研究評估了五個大型語言模型(LLaMA 1、PaLM 2、Claude-v1、GPT-3.5和GPT-4)在2044個腫瘤學相關問題上的表現。結果顯示,GPT-4在與人類基準比較中表現最佳,達到第50百分位以上。雖然GPT-4的準確率高達81.1%,但所有模型仍存在顯著錯誤率,顯示出持續評估這些AI工具的重要性,以確保其安全應用於臨床實踐。 PubMed DOI

這項研究介紹了iLLMAC,一個經過指令調整的大型語言模型,專注於利用游離DNA(cfDNA)進行癌症檢測。iLLMAC在1,135名癌症患者和1,106名對照組的血漿cfDNA數據上訓練,癌症診斷的AUROC達0.866,肝細胞癌(HCC)檢測則達0.924。隨著末端動機數量增加,性能提升,使用64個末端動機時,癌症診斷AUROC達0.886,HCC檢測AUROC達0.956。外部測試中,iLLMAC仍表現優異,顯示出基於LLM的指令調整在cfDNA癌症檢測中的潛力。 PubMed DOI

高血壓是一種常見的慢性病,會增加心血管疾病的風險。血管緊張素轉換酶(ACE)在血壓調控中扮演重要角色,傳統藥物常有副作用,因此對能抑制 ACE 的食物來源肽(ACEIP)產生興趣。文章介紹了一個新模型 AI4ACEIP,利用兩層堆疊集成架構來識別 ACEIP,並透過 PowerShap 方法優化特徵選擇。研究顯示,AI4ACEIP 的預測表現優於七種現有方法,並可在 GitHub 上公開使用。 PubMed DOI