TSSNote-CyaPromBERT: Development of an integrated platform for highly accurate promoter prediction and visualization of Synechococcus sp. and Synechocystis sp. through a state-of-the-art natural language processing model BERT.
TSSNote-CyaPromBERT: 開發一個整合平台，透過最先進的自然語言處理模型BERT，高度準確地預測和視覺化Synechococcus sp.和Synechocystis sp.的啟動子。 Front Genet 2022-12-22

研究使用XLNET、BERT和DNABERT等自然語言處理模型，成功預測藍綠藻的啟動子，進而合成化合物。開發了TSSNote-CyaPromBERT平台，方便數據提取和預測。研究指出，這些模型對分析DNA序列及辨識新菌株的啟動子區域相當有幫助。 PubMed DOI

Empirical evaluation of language modeling to ascertain cancer outcomes from clinical text reports.
臨床文本報告中語言建模的實證評估，以確定癌症結果。 BMC Bioinformatics 2023-11-23

研究比較了不同NLP模型在擷取非小細胞肺癌患者影像報告中的癌症結果。結果顯示，DFCI-ImagingBERT表現最佳，但簡單模型也不錯。若資源有限，簡單機器學習模型仍可有效。 PubMed DOI

GPCR-BERT: Interpreting Sequential Design of G Protein-Coupled Receptors Using Protein Language Models.
GPCR-BERT: 使用蛋白質語言模型解釋G蛋白偶聯受體的序列設計。 J Chem Inf Model 2024-03-01

化學和生物學領域正運用大型語言模型，像是變壓器(transformers)，來開創治療方法和理解的新可能性。研究團隊開發了GPCR-BERT模型，專門用於分析重要藥物靶點G蛋白偶聯受體(GPCRs)的序列設計。透過預先訓練蛋白質模型並微調預測任務，揭示了氨基酸序列、配體選擇性和GPCRs構象基序之間的關係。這個高準確性的模型提供了對受體構象內部相互作用的深入洞察。 PubMed DOI

Symptom-BERT: Enhancing Cancer Symptom Detection in EHR Clinical Notes.
在電子病歷臨床記錄中增強癌症症狀檢測的Symptom-BERT。 J Pain Symptom Manage 2024-05-24

這項研究使用了一個預先訓練的語言模型來檢測和提取臨床記錄中的癌症症狀，成功地在識別各種症狀方面達到了高準確度。這個模型的有效性突顯了對領域特定數據進行專門預訓練以增強醫學應用語言模型的潛力，特別是在改善癌症患者的症狀管理方面。 PubMed DOI

A BERT-GNN Approach for Metastatic Breast Cancer Prediction Using Histopathology Reports.
使用BERT-GNN方法預測轉移性乳腺癌的組織病理學報告。 Diagnostics (Basel) 2024-07-13

介紹了一個新的乳腺癌分類模型，可以幫助辨識轉移性乳腺癌。這個BG-MBC模型結合了BERT和GNNs，能根據組織病理學報告預測MBC。透過語義信息和關鍵特徵，模型表現準確且效能優異。 PubMed DOI

CarD-T: Interpreting Carcinomic Lexicon via Transformers.
CarD-T：通過變壓器解讀癌症詞彙。 medRxiv 2024-08-26

致癌物的識別與分類對癌症流行病學非常重要，但現有系統如IARC和NTP面臨文獻增長的挑戰。為此，我們開發了CarD-T框架，利用變壓器技術有效識別潛在致癌物。CarD-T在已知致癌物的PubMed摘要上進行訓練，並成功識別了60%的已確立致癌物，還提名了約1500個潛在致癌物。與GPT-4相比，CarD-T在召回率和F1分數上表現更佳，並能評估致癌性矛盾證據。總之，CarD-T是識別致癌物的強大工具，提升公共健康應對能力。 PubMed DOI

Automated information extraction model enhancing traditional Chinese medicine RCT evidence extraction (Evi-BERT): algorithm development and validation.
增強傳統中醫隨機對照試驗證據提取的自動化信息提取模型 (Evi-BERT)：算法開發與驗證。 Front Artif Intell 2024-08-30

在循證醫學中，隨機對照試驗（RCTs）對臨床指導方針至關重要，但傳統的手動數據提取效率低。為了解決這個問題，我們開發了一個針對傳統中醫（TCM）RCT的自動化信息提取模型，使用Evi-BERT結合規則提取技術，從48,523篇研究中提取數據。我們的模型顯著提高了數據的可搜索性和提取效率，並保持高準確性，幫助醫師節省文獻審查時間，加速臨床試驗證據的識別，最終促進精確的臨床指導方針制定。 PubMed DOI

Large language model produces high accurate diagnosis of cancer from end-motif profiles of cell-free DNA.
大型語言模型從游離DNA的末端特徵檔案中產生高準確度的癌症診斷。 Brief Bioinform 2024-09-02

這項研究介紹了iLLMAC，一個經過指令調整的大型語言模型，專注於利用游離DNA（cfDNA）進行癌症檢測。iLLMAC在1,135名癌症患者和1,106名對照組的血漿cfDNA數據上訓練，癌症診斷的AUROC達0.866，肝細胞癌（HCC）檢測則達0.924。隨著末端動機數量增加，性能提升，使用64個末端動機時，癌症診斷AUROC達0.886，HCC檢測AUROC達0.956。外部測試中，iLLMAC仍表現優異，顯示出基於LLM的指令調整在cfDNA癌症檢測中的潛力。 PubMed DOI

CACER: Clinical concept Annotations for Cancer Events and Relations.
CACER：癌症事件及關係的臨床概念註解。 J Am Med Inform Assoc 2024-09-03

這項研究專注於從非結構化的臨床筆記中提取與腫瘤學相關的結構化資訊，特別是癌症藥物與症狀負擔的關係。研究人員建立了名為CACER的資料集，包含超過48,000個醫療問題和藥物事件的詳細註解。經過微調的BERT和Llama3模型在事件提取上表現最佳，F1分數分別為88.2和88.0，而GPT-4在這些任務中的表現最差。這顯示微調模型在特定任務上更有效，CACER資料庫為未來的醫療資訊提取研究提供了重要資源。 PubMed DOI

Enhancing Precision in Detecting Severe Immune-Related Adverse Events: Comparative Analysis of Large Language Models and International Classification of Disease Codes in Patient Records.
提升檢測嚴重免疫相關不良事件的精確性：大型語言模型與國際疾病分類代碼在病歷中的比較分析。 J Clin Oncol 2024-09-03

這項研究探討大型語言模型（LLMs）在識別接受免疫檢查點抑制劑（ICI）治療患者的免疫相關不良事件（irAEs）中的應用，並與傳統手動裁定及ICD代碼進行比較。研究分析了超過12年的住院紀錄，發現LLMs在檢測irAEs的敏感性顯著高於ICD代碼，且效率更佳，平均每份病歷僅需9.53秒。總體來說，LLMs被認為是檢測irAEs的有效工具，提供更高的敏感性和效率。 PubMed DOI

原始文章

站上相關主題文章列表