Human-interpretable clustering of short text using large language models.
使用大型語言模型進行短文本的人類可解釋聚類。 R Soc Open Sci 2025-01-23

短文本聚類面臨詞彙共現的挑戰，但研究顯示大型語言模型（LLMs）能有效生成嵌入，捕捉語義細微差異，改善聚類結果。透過高斯混合模型，聚類效果比傳統方法如doc2vec和潛在狄利克雷分配更明顯且易解釋。人類評審和生成型LLM的驗證顯示高一致性，顯示LLM能縮短聚類產出與解釋的距離。此外，LLM與人類編碼的比較揭示了兩者的偏見，質疑傳統將人類編碼視為最終標準的做法。 PubMed DOI

Large Language Model Approach for Zero-Shot Information Extraction and Clustering of Japanese Radiology Reports: Algorithm Development and Validation.
日本放射科報告的零樣本信息提取與聚類的大型語言模型方法：算法開發與驗證。 JMIR Cancer 2025-01-26

這項研究探討如何利用大型語言模型（LLMs）從日本的肺癌放射學報告中提取資訊並進行聚類分析。隨著自然語言處理在醫學領域的應用增加，研究針對非英語醫學數據集的挑戰進行探討。使用MedTxt-RR數據集，研究發現腫瘤大小在73.3%的報告中被準確識別，腫瘤位置和側別則在83%的報告中被識別。結果顯示，無監督的LLM方法在資訊提取和聚類上優於傳統監督方法，顯示出LLM在提升放射學報告效用的潛力。 PubMed DOI

Integrating NLP and LLMs to discover biomarkers and mechanisms in Alzheimer's disease.
整合 NLP 和 LLMs 以發現阿茲海默症中的生物標記和機制。 SLAS Technol 2025-02-23

阿茲海默症是一種漸進性的神經系統疾病，影響全球數百萬人，導致認知能力下降和記憶喪失。傳統診斷方法難以早期檢測。本研究提出一種新方法，結合自然語言處理和大型語言模型，利用GenBERT來識別阿茲海默症的生物標記。透過整合臨床數據，GenBERT在早期預測方面表現優異，準確率達98.30%，並顯示出高敏感性和特異性，為阿茲海默症的早期診斷提供了可靠工具，可能改變未來的檢測與治療策略。 PubMed DOI

Multiomics Research: Principles and Challenges in Integrated Analysis.
多組學研究：整合分析的原則與挑戰。 Biodes Res 2025-02-24

多組學研究是一種創新的生物科學方法，結合基因組學、轉錄組學、蛋白質組學和代謝組學等數據，幫助我們全面理解生物系統。這篇綜述強調數據整合的重要性，揭示生物過程中的複雜互動。我們討論了深度學習、圖神經網絡和生成對抗網絡等計算技術的最新進展，這些技術提升了多組學數據的分析能力。同時，文章也探討了數據異質性和模型可解釋性等挑戰。此外，大型語言模型在特徵提取和知識整合方面的潛力也被提及。儘管多組學有很大潛力，但所需的計算資源和模型調整的複雜性仍需持續創新與合作。 PubMed DOI

Cancer gene identification through integrating causal prompting large language model with omics data-driven causal inference.
透過整合因果提示的大型語言模型與基因組數據驅動的因果推斷進行癌症基因識別。 Brief Bioinform 2025-03-12

這項研究提出了一個名為ICGI（整合性因果基因識別）的新框架，透過整合多種組學數據來識別與癌症相關的基因。傳統方法常因依賴一般化的相關性而產生偏差，未考慮混淆因素。ICGI利用大型語言模型（LLM），結合因果提示和數據驅動的特徵選擇，提升癌症基因識別的準確性。該框架在《癌症基因組圖譜》中測試了六種癌症的轉錄組數據，表現優於現有方法。此外，還開發了線上平台，讓用戶能輸入基因和癌症類型，自動評估基因的重要性，並提供清晰的解釋。不過，研究也指出目前的LLMs可能無法完全捕捉所有相關信息。 PubMed DOI

Large Language Model Applications for Health Information Extraction in Oncology: Scoping Review.
腫瘤學中健康信息提取的大型語言模型應用：範疇回顧。 JMIR Cancer 2025-03-28

這篇回顧探討大型語言模型（LLMs）在腫瘤學中自動提取非結構化臨床文本的應用，強調其在提升癌症研究和病人照護的潛力。回顧分析了自2000年以來的24項研究，發現大多數使用BERT變體，少數使用Chat-GPT。研究顯示，LLMs能有效提取數據，減少醫療人員的手動工作量，並建議可減輕行政負擔，讓醫護人員更專注於病人照護。未來需進一步研究其在臨床實踐中的整合及表現。 PubMed DOI

The potential of large language models to advance precision oncology.
大型語言模型推動精準腫瘤醫學的潛力 EBioMedicine 2025-04-30

這篇綜述介紹大型語言模型在腫瘤醫學的應用，包括癌症篩檢、診斷、分期和治療建議等，展現其提升精準醫療的潛力。文章也點出幻覺、倫理和應用侷限等挑戰，並提出改進建議，期望推動LLMs在癌症照護上的發展。 PubMed DOI

Enhancing biomarker based oncology trial matching using large language models.
利用大型語言模型提升以生物標記為基礎的腫瘤學試驗配對 NPJ Digit Med 2025-05-05

這項研究發現，開源大型語言模型（LLM）在從腫瘤臨床試驗描述中萃取基因生物標記資訊，並將試驗資料結構化方面，表現比GPT-4等封閉模型更好。即使沒特別調整，開源模型就很厲害，經過微調後準確度還能再提升。這有助於病患媒合合適的臨床試驗。 PubMed DOI

Use of Large Language Models in Clinical Cancer Research.
大型語言模型在臨床癌症研究中的應用 JCO Clin Cancer Inform 2025-05-19

AI大型語言模型正改變癌症研究，能協助資料擷取、分析、病患配對及多元資料整合，讓流程更有效率、決策更快速。不過，資料隱私、準確性、成本和法規等問題，還是需要特別注意。 PubMed DOI

Application of a general LLM-based classification system to retrieve information about oncological trials.
應用通用 LLM 為基礎的分類系統於腫瘤學試驗資訊檢索 Oncology 2025-06-15

我們開發了一套用大型語言模型（LLMs）自動分類腫瘤臨床試驗和文獻的系統，在多個資料集和任務上都表現優異，準確率超過94%、F1-score超過92%，回應有效性最高達99.88%。雖然還有提示敏感度和運算資源的挑戰，但未來LLMs有望成為醫學文獻分類的重要工具。 PubMed DOI

原始文章

站上相關主題文章列表