原始文章

早期偵測和介入前癌病變對降低癌症發病率和死亡率非常重要。深入分析基因組、轉錄組、蛋白質組和表觀基因組的變化,有助於理解癌症的早期發展。然而,目前缺乏全面的分子特徵數據資源,限制了我們對前癌過程的了解。 為了解決這個問題,我們推出了前癌分子資源(PCMR),匯集了25,828個前癌樣本的分子資料,並與正常或惡性對照進行比較。這個資料庫涵蓋20個器官和35種癌症類型的前癌病變,並包含轉錄組、蛋白質組和表觀基因組的資訊。PCMR有望成為推進前癌研究和改善病人預後的重要資源。 PubMed DOI


站上相關主題文章列表

病理報告在癌症研究中很重要,但常被忽略。最近OCR和NLP技術進步,可從報告中提取資訊。透過這些技術,從9523份報告建立新數據集,可準確分類32種組織的癌症類型。對臨床NLP、臨床試驗和臨床醫師都有幫助。 PubMed DOI

以病人為中心的結果(PCOs)在癌症治療中非常重要,因為它們能反映病人的生活品質。然而,關於乳腺癌的發病率和生存率的數據,尤其是治療副作用和依從性影響的研究,通常僅限於小型研究或單一機構。為了解決這個問題,我們使用大型語言模型(LLMs)如GPT-2等,從梅奧診所、埃默里大學醫院和史丹佛大學的臨床筆記中提取PCOs。我們開發了一個開源框架,微調LLMs以提升PCO提取的準確性,結果顯示微調後的模型表現顯著優於未微調的模型。 PubMed DOI

大型語言模型(LLMs),如OpenAI的GPT系列,在醫學領域展現潛力,特別是在腫瘤學中。研究評估了LLM在分類化療引起的主觀毒性方面的能力,結果顯示LLM在一般毒性類別的準確率為85.7%,但在特定類別的準確率僅為64.6%。雖然LLM的表現與腫瘤科醫生相當,但特定類別的準確性仍需改進。未來研究應聚焦於真實病人的驗證及即時互動能力,並考量數據準確性和隱私等倫理問題。總體而言,LLMs有潛力提升病人護理質量與效率。 PubMed DOI

這項研究介紹了iLLMAC,一個經過指令調整的大型語言模型,專注於利用游離DNA(cfDNA)進行癌症檢測。iLLMAC在1,135名癌症患者和1,106名對照組的血漿cfDNA數據上訓練,癌症診斷的AUROC達0.866,肝細胞癌(HCC)檢測則達0.924。隨著末端動機數量增加,性能提升,使用64個末端動機時,癌症診斷AUROC達0.886,HCC檢測AUROC達0.956。外部測試中,iLLMAC仍表現優異,顯示出基於LLM的指令調整在cfDNA癌症檢測中的潛力。 PubMed DOI

OligoM-Cancer平台的開發目的是為了解決寡轉移性癌症(OMC)的理解與治療挑戰。相較於多轉移性癌症,OMC對局部治療的反應較佳,但相關研究仍然不足,因此需要更系統的比較與個性化治療。該平台提供有關OMC的標記、診斷、預後及治療選項的全面資源,並擁有1345篇文獻和393個相關因素的資料庫。OligoM-Cancer利用現代網路技術,旨在提升數據可解釋性,增強臨床實踐,並支持大型語言模型在OMC領域的應用,促進深入分析與提高治療可靠性。 PubMed DOI

個人化醫療透過個體特徵,特別是基因資料,來制定治療方案。研究顯示特定基因背景與藥物的劑量和副作用有關。傳統知識系統難以處理這些複雜數據,因此我們開發了CPMKG,一個全面的知識平台,整理了307,614條與藥物、疾病和基因相關的資料,分為四大類別:藥物副作用、敏感性、機制和適應症。CPMKG支援藥物中心探索和病症知識推理,並整合大型語言模型,提供易懂的數據解釋,是臨床研究的重要資源。欲了解更多,請訪問:https://www.biosino.org/cpmkg/. PubMed DOI

這項研究評估大型語言模型(LLMs)在分析乳腺癌病理報告的有效性,特別是識別病理完全反應(pCR)。研究者使用兩種方法:提取不同變壓器模型的嵌入和微調GPT-2模型,分析351名接受新輔助化療的女性患者。優化後的結果顯示,敏感度達95.3%,陽性預測值90.9%,F1分數93.0%。這顯示LLMs在提取臨床數據上優於傳統機器學習模型,並強調其在改善病人護理和乳腺癌管理的潛力,但仍需進一步驗證以確保結果的可靠性。 PubMed DOI

這項研究探討如何利用高通量篩選癌細胞株來預測藥物敏感性,並改善抗腫瘤療法。研究人員結合細胞株的轉錄組學和大型語言模型,成功將藥物與其作用機制連結。結果顯示,重要基因與藥物作用機制有顯著關聯,證明模型能有效捕捉影響治療結果的因素。研究還驗證了對胰臟癌和膠質母細胞瘤患者有效的藥物,顯示整合轉錄組數據和建模技術在個性化癌症治療中的潛力。 PubMed DOI

病人衍生癌症模型(PDCMs)在癌症研究中越來越重要,相關文獻在過去十年顯著增加。本研究探討大型語言模型(LLMs)在自動提取與PDCM相關的科學文本實體的應用,評估了直接提示和軟提示兩種方法。研究使用了先進的LLMs,包括GPT4-o和LLaMA3系列的開放模型。結果顯示,雖然GPT4-o在直接提示下表現不錯,但軟提示顯著提升了較小開放模型的性能,使其結果可與專有模型媲美。本研究強調了LLMs在專業文本提取中的有效性,以及根據任務和模型類型調整方法的重要性。 PubMed DOI

這項研究提出了一個名為ICGI(整合性因果基因識別)的新框架,透過整合多種組學數據來識別與癌症相關的基因。傳統方法常因依賴一般化的相關性而產生偏差,未考慮混淆因素。ICGI利用大型語言模型(LLM),結合因果提示和數據驅動的特徵選擇,提升癌症基因識別的準確性。該框架在《癌症基因組圖譜》中測試了六種癌症的轉錄組數據,表現優於現有方法。此外,還開發了線上平台,讓用戶能輸入基因和癌症類型,自動評估基因的重要性,並提供清晰的解釋。不過,研究也指出目前的LLMs可能無法完全捕捉所有相關信息。 PubMed DOI