OligoM-Cancer: A multidimensional information platform for deep phenotyping of heterogenous oligometastatic cancer.
OligoM-Cancer：一個多維度信息平台，用於深度表型分析異質性寡轉移癌。 Comput Struct Biotechnol J 2024-09-11

OligoM-Cancer平台的開發目的是為了解決寡轉移性癌症（OMC）的理解與治療挑戰。相較於多轉移性癌症，OMC對局部治療的反應較佳，但相關研究仍然不足，因此需要更系統的比較與個性化治療。該平台提供有關OMC的標記、診斷、預後及治療選項的全面資源，並擁有1345篇文獻和393個相關因素的資料庫。OligoM-Cancer利用現代網路技術，旨在提升數據可解釋性，增強臨床實踐，並支持大型語言模型在OMC領域的應用，促進深入分析與提高治療可靠性。 PubMed DOI

Learning and actioning general principles of cancer cell drug sensitivity.
癌細胞藥物敏感性的一般原則學習與實踐。 Nat Commun 2025-02-14

這項研究探討如何利用高通量篩選癌細胞株來預測藥物敏感性，並改善抗腫瘤療法。研究人員結合細胞株的轉錄組學和大型語言模型，成功將藥物與其作用機制連結。結果顯示，重要基因與藥物作用機制有顯著關聯，證明模型能有效捕捉影響治療結果的因素。研究還驗證了對胰臟癌和膠質母細胞瘤患者有效的藥物，顯示整合轉錄組數據和建模技術在個性化癌症治療中的潛力。 PubMed DOI

Extracting Knowledge from Scientific Texts on Patient-Derived Cancer Models Using Large Language Models: Algorithm Development and Validation.
利用大型語言模型從患者衍生的癌症模型科學文本中提取知識：演算法開發與驗證。 bioRxiv 2025-02-20

病人衍生癌症模型（PDCMs）在癌症研究中越來越重要，相關文獻在過去十年顯著增加。本研究探討大型語言模型（LLMs）在自動提取與PDCM相關的科學文本實體的應用，評估了直接提示和軟提示兩種方法。研究使用了先進的LLMs，包括GPT4-o和LLaMA3系列的開放模型。結果顯示，雖然GPT4-o在直接提示下表現不錯，但軟提示顯著提升了較小開放模型的性能，使其結果可與專有模型媲美。本研究強調了LLMs在專業文本提取中的有效性，以及根據任務和模型類型調整方法的重要性。 PubMed DOI

SensitiveCancerGPT: Leveraging Generative Large Language Model on Structured Omics Data to Optimize Drug Sensitivity Prediction.
SensitiveCancerGPT：利用生成大型語言模型在結構化組學數據上優化藥物敏感性預測。 bioRxiv 2025-03-10

這項研究探討生成大型語言模型（LLMs），特別是GPT，在癌細胞系藥物敏感性預測（DSP）中的應用。研究調整了提示工程技術，提升GPT在藥物基因組學數據上的表現，並與現有基準比較。主要發現包括： 1. 開發三種提示模板，提升GPT處理結構化數據的能力。 2. 微調方法顯著提高F1分數，表現最佳。 3. GPT在GDSC數據集上F1分數提高16%，展現強大泛化能力。 4. 提供藥物與通路關聯的見解，與先前發現一致。總體而言，研究顯示GPT可作為精準腫瘤學的有效工具，改善癌症治療策略。研究代碼和數據集已公開於GitHub。 PubMed DOI

Cancer gene identification through integrating causal prompting large language model with omics data-driven causal inference.
透過整合因果提示的大型語言模型與基因組數據驅動的因果推斷進行癌症基因識別。 Brief Bioinform 2025-03-12

這項研究提出了一個名為ICGI（整合性因果基因識別）的新框架，透過整合多種組學數據來識別與癌症相關的基因。傳統方法常因依賴一般化的相關性而產生偏差，未考慮混淆因素。ICGI利用大型語言模型（LLM），結合因果提示和數據驅動的特徵選擇，提升癌症基因識別的準確性。該框架在《癌症基因組圖譜》中測試了六種癌症的轉錄組數據，表現優於現有方法。此外，還開發了線上平台，讓用戶能輸入基因和癌症類型，自動評估基因的重要性，並提供清晰的解釋。不過，研究也指出目前的LLMs可能無法完全捕捉所有相關信息。 PubMed DOI

Comprehensive testing of large language models for extraction of structured data in pathology.
大型語言模型在病理學中結構化數據提取的綜合測試。 Commun Med (Lond) 2025-03-31

病理科部門產生大量非結構化數據，主要以自由文本的診斷報告形式存在，轉換成結構化格式需要大量人力。雖然先進的語言模型能協助此任務，但專有模型可能引發成本和隱私問題。我們創建了一個包含579份德文和英文病理報告的數據集，評估了六個語言模型的提取能力。研究顯示，開源模型在提取結構化數據方面的精度與專有模型相當，且具成本效益和隱私保護潛力，為醫療機構提供了重要見解。 PubMed DOI

CORAL: Expert-Curated Oncology Reports to Advance Language Model Inference.
CORAL：專家策劃的腫瘤學報告以促進語言模型推論 NEJM AI 2025-04-21

研究發現，GPT-4在從乳癌和胰臟癌病歷中擷取腫瘤特徵及用藥資訊表現最佳，但遇到複雜推理時仍會出錯或資訊不完整。雖然大型語言模型有潛力協助臨床資料整理，但目前準確度還不夠，未來還需改進才能真正應用在臨床研究和照護上。 PubMed DOI

Development of a Synthetic Oncology Pathology Dataset for Large Language Model Evaluation in Medical Text Classification.
用於大型語言模型醫學文本分類評估的合成腫瘤病理資料集開發 Stud Health Technol Inform 2025-04-24

這項研究用大型語言模型（像是 Copilot、ChatGPT Plus、Perplexity Pro）生成227份腫瘤病理報告的合成資料集，涵蓋前列腺癌、肺癌和乳癌，惡性與良性比例平均。資料集經專業癌症登記員驗證，完全沒用到真實病患資料，可作為AI病理報告分類的標準測試集，兼顧隱私與可重現性。 PubMed DOI

Large language models for extracting histopathologic diagnoses of colorectal cancer and dysplasia from electronic health records.
運用大型語言模型從電子健康紀錄中擷取大腸直腸癌與異生症的組織病理診斷 medRxiv 2025-05-02

這項研究發現，開源大型語言模型（LLMs）能準確從電子病歷的病理報告中，萃取癌症和異型增生等重要診斷，連複雜案例也適用。只用簡單「是/否」提示，在美國退伍軍人健康管理局資料庫中，診斷準確率超過93%。這方法不但省資源、設定簡單，還能大規模應用，對臨床和研究都很有幫助。 PubMed DOI

Early prediction of colorectal adenoma risk: leveraging large-language model for clinical electronic medical record data.
利用大型語言模型分析臨床電子病歷資料，早期預測大腸直腸腺瘤風險 Front Oncol 2025-05-30

這項研究開發出一套高準確度、非侵入性、無輻射的機器學習模型，能用電子病歷資料提早預測大腸直腸腺瘤。結合傳統機器學習和大型語言模型，模型在驗證和測試組的AUC都約0.98，表現非常優異。此模型也能找出關鍵風險因子，適合大規模篩檢，有助降低大腸癌發生率與死亡率。 PubMed DOI

原始文章

站上相關主題文章列表