這項研究提出了一個名為ICGI(整合性因果基因識別)的新框架,透過整合多種組學數據來識別與癌症相關的基因。傳統方法常因依賴一般化的相關性而產生偏差,未考慮混淆因素。ICGI利用大型語言模型(LLM),結合因果提示和數據驅動的特徵選擇,提升癌症基因識別的準確性。該框架在《癌症基因組圖譜》中測試了六種癌症的轉錄組數據,表現優於現有方法。此外,還開發了線上平台,讓用戶能輸入基因和癌症類型,自動評估基因的重要性,並提供清晰的解釋。不過,研究也指出目前的LLMs可能無法完全捕捉所有相關信息。
PubMed
DOI