Artificial intelligence in oncology: ensuring safe and effective integration of language models in clinical practice.
腫瘤學中的人工智慧：確保語言模型在臨床實踐中的安全與有效整合。 Lancet Reg Health Eur 2024-09-18

這篇文章探討了醫療腫瘤學中，人工智慧（AI）在自動文本分析的最新進展，特別是自然語言處理（NLP）的重要性。大型語言模型在解答醫療問題上表現突出，並介紹了如預後評估、治療建議等新應用。作者呼籲啟動全球臨床評估，以驗證AI決策支持系統的有效性，並解決潛在偏見。他們強調在推進病人護理時，必須保持科學的嚴謹性。 PubMed DOI

Enhancing systematic literature reviews with generative artificial intelligence: development, applications, and performance evaluation.
利用生成式人工智慧增強系統性文獻回顧：發展、應用及效能評估。 J Am Med Inform Assoc 2025-03-04

您開發了一個大型語言模型（LLM）輔助的系統，專門用於健康技術評估（HTA）的系統性文獻回顧（SLR）。這個系統包含五個模組，從文獻搜尋到數據總結，並具有人機協作的設計，能根據LLM與人類審查者的意見調整PICOs標準。經過四組數據評估，系統在摘要篩選中表現優異，達到90%的敏感度和82的F1分數，顯示出與人類審查者的高一致性。這個AI輔助系統有潛力簡化SLR過程，降低時間和成本，並提升證據生成的準確性。 PubMed DOI

Enhanced Artificial Intelligence in Bladder Cancer Management: A Comparative Analysis and Optimization Study of Multiple Large Language Models.
膀胱癌管理中增強人工智慧的應用：多個大型語言模型的比較分析與優化研究。 J Endourol 2025-03-18

本研究探討大型語言模型（LLMs）在膀胱癌管理中的表現。研究設計了100個臨床問題，評估六種LLMs的回應準確性。結果顯示，Claude-3.5-Sonnet以89.33%準確率最佳，ChatGPT-4為85.67%。GPT-3.5-Turbo經過兩階段訓練後，準確率從74.33%提升至100%。研究顯示，針對性訓練能顯著改善模型表現，並指出策略性改進可克服專業醫學應用中的限制。 PubMed DOI

Large Language Models as Decision-Making Tools in Oncology: Comparing Artificial Intelligence Suggestions and Expert Recommendations.
大型語言模型作為腫瘤學中的決策工具：比較人工智慧建議與專家推薦。 JCO Clin Cancer Inform 2025-03-20

這項研究評估大型語言模型（LLMs）在根據病患醫療紀錄生成早期乳腺癌治療選項的準確性。使用2024年初的多學科團隊會議紀錄，測試了三個AI模型：Claude3-Opus、GPT4-Turbo和LLaMa3-70B。結果顯示，Claude3-Opus準確率86.6%，GPT4-Turbo為85.7%，LLaMa3-70B則為75.0%。兩者在輔助內分泌和靶向治療上表現良好，但在輔助放射治療上則有高估的情況。研究建議需進一步探討這些模型在臨床上的實際應用。 PubMed DOI

Large Language Model Applications for Health Information Extraction in Oncology: Scoping Review.
腫瘤學中健康信息提取的大型語言模型應用：範疇回顧。 JMIR Cancer 2025-03-28

這篇回顧探討大型語言模型（LLMs）在腫瘤學中自動提取非結構化臨床文本的應用，強調其在提升癌症研究和病人照護的潛力。回顧分析了自2000年以來的24項研究，發現大多數使用BERT變體，少數使用Chat-GPT。研究顯示，LLMs能有效提取數據，減少醫療人員的手動工作量，並建議可減輕行政負擔，讓醫護人員更專注於病人照護。未來需進一步研究其在臨床實踐中的整合及表現。 PubMed DOI

Precision Oncology in Non-small Cell Lung Cancer: A Comparative Study of Contextualized ChatGPT Models.
非小細胞肺癌精準腫瘤醫學：情境化 ChatGPT 模型的比較研究 Cureus 2025-04-24

這項研究發現，讓 ChatGPT 直接讀取 NCCN 指南 PDF 並搭配提示語（PDF+Prompt），能大幅提升其在建議晚期非小細胞肺癌治療時的準確度和符合指引性，且回覆更清楚易懂。單靠提示語沒有效果。這表示，若大型語言模型能直接存取臨床指引，對腫瘤治療決策會更有幫助，但還需更多研究來驗證其他癌症和臨床情境的適用性。 PubMed DOI

Natural language processing in drug discovery: bridging the gap between text and therapeutics with artificial intelligence.
人工智慧輔助下，自然語言處理於藥物開發：連結文本與治療之間的橋樑 Expert Opin Drug Discov 2025-04-29

近年AI和NLP技術大幅提升生命科學領域的文本分析效率，像NER、知識圖譜和大型語言模型各有優缺點，適合不同生物資料。選擇技術時要依應用需求調整。隨著科學文獻暴增，研究人員面臨更多機會與挑戰。 PubMed DOI

The potential of large language models to advance precision oncology.
大型語言模型推動精準腫瘤醫學的潛力 EBioMedicine 2025-04-30

這篇綜述介紹大型語言模型在腫瘤醫學的應用，包括癌症篩檢、診斷、分期和治療建議等，展現其提升精準醫療的潛力。文章也點出幻覺、倫理和應用侷限等挑戰，並提出改進建議，期望推動LLMs在癌症照護上的發展。 PubMed DOI

Enhancing biomarker based oncology trial matching using large language models.
利用大型語言模型提升以生物標記為基礎的腫瘤學試驗配對 NPJ Digit Med 2025-05-05

這項研究發現，開源大型語言模型（LLM）在從腫瘤臨床試驗描述中萃取基因生物標記資訊，並將試驗資料結構化方面，表現比GPT-4等封閉模型更好。即使沒特別調整，開源模型就很厲害，經過微調後準確度還能再提升。這有助於病患媒合合適的臨床試驗。 PubMed DOI

Development and validation of an autonomous artificial intelligence agent for clinical decision-making in oncology.
腫瘤學臨床決策用自主人工智慧代理的開發與驗證 Nat Cancer 2025-06-06

研究團隊把GPT-4和專業腫瘤醫學工具結合，開發出能自主做臨床決策的AI代理。測試20個複雜癌症案例時，AI選對工具的機率有87.5%，臨床決策正確率91%，引用指引正確率75.5%。這套系統比單用GPT-4準確率高出許多，證明結合語言模型和專業工具能大幅提升癌症照護決策品質。 PubMed DOI

原始文章

站上相關主題文章列表