Leveraging GPT-4 for identifying cancer phenotypes in electronic health records: a performance comparison between GPT-4, GPT-3.5-turbo, Flan-T5, Llama-3-8B, and spaCy's rule-based and machine learning-based methods.
利用 GPT-4 在電子健康記錄中識別癌症表現：GPT-4、GPT-3.5-turbo、Flan-T5、Llama-3-8B，以及spaCy基於規則和機器學習方法的性能比較。 JAMIA Open 2024-07-04

研究使用OpenAI的GPT-4模型分析非小細胞肺癌患者的電子健康記錄，結果顯示GPT-4在識別疾病階段、治療和進展方面比其他模型表現更好。這表示GPT-4在臨床表現型提取上比基於規則的模型更有效率，具有更高的精確度、召回率和F1分數。GPT模型在醫療領域有著重要的應用價值，因為它們提供了更好的上下文理解和臨床表現型識別能力。 PubMed DOI

Using artificial intelligence to semi-automate trustworthiness assessment of randomized controlled trials: A case study.
使用人工智慧半自動化隨機對照試驗的可信度評估：案例研究。 J Clin Epidemiol 2025-01-19

隨機對照試驗（RCTs）對循證醫學非常重要，但有些試驗使用虛構數據，影響研究的完整性。本研究探討利用GPT-4驅動的ChatGPT來簡化RCT評估過程。透過TRACT檢查表，ChatGPT能有效處理RCT論文的PDF，並準確回答檢查項目，與人類評估者的一致性達84%。此外，ChatGPT在數據提取方面也表現出色，對三個表格達到100%準確率。未來將致力於提升ChatGPT在多個RCT中的應用，實現更高的數據捕捉準確性及自動化處理。 PubMed DOI

Mapping the Advanced-Stage Epithelial Ovarian Cancer Landscape Goes Beyond Words: Two Large Language Models, Eight Tasks, One Journey.
超越文字的晚期上皮卵巢癌景觀映射：兩個大型語言模型，八個任務，一段旅程。 J Clin Med 2025-04-12

本研究探討了深度學習模型在預測晚期上皮性卵巢癌患者手術結果的有效性，特別是使用非結構化的手術筆記。評估了RoBERTa和GatorTron兩個模型，結果顯示GatorTron在大多數任務中表現優於RoBERTa，顯示專為醫療設計的模型在理解醫療語言上有明顯優勢。不過，兩者在預測術後併發症和住院時間時仍面臨挑戰，顯示手術文本不足以全面反映術後恢復的複雜性。這些發現對提升患者護理質量的醫療AI系統發展至關重要。 PubMed DOI

CORAL: Expert-Curated Oncology Reports to Advance Language Model Inference.
CORAL：專家策劃的腫瘤學報告以促進語言模型推論 NEJM AI 2025-04-21

研究發現，GPT-4在從乳癌和胰臟癌病歷中擷取腫瘤特徵及用藥資訊表現最佳，但遇到複雜推理時仍會出錯或資訊不完整。雖然大型語言模型有潛力協助臨床資料整理，但目前準確度還不夠，未來還需改進才能真正應用在臨床研究和照護上。 PubMed DOI

Enhancing Malignancy Detection and Tumor Classification in Pathology Reports: A Comparative Evaluation of Large Language Models.
提升病理報告中惡性腫瘤偵測與腫瘤分類的能力：大型語言模型的比較評估 Stud Health Technol Inform 2025-04-24

這項研究用GPT-4o和Llama3.3等大型語言模型，測試它們在227份人工合成病理報告中辨識和分類癌症的能力。結果顯示，這些AI模型在準確率、敏感度和特異性上都比傳統方法更優秀，有機會讓癌症登記流程更快、更可靠，提升公共衛生和臨床照護品質。 PubMed DOI

Precision Oncology in Non-small Cell Lung Cancer: A Comparative Study of Contextualized ChatGPT Models.
非小細胞肺癌精準腫瘤醫學：情境化 ChatGPT 模型的比較研究 Cureus 2025-04-24

這項研究發現，讓 ChatGPT 直接讀取 NCCN 指南 PDF 並搭配提示語（PDF+Prompt），能大幅提升其在建議晚期非小細胞肺癌治療時的準確度和符合指引性，且回覆更清楚易懂。單靠提示語沒有效果。這表示，若大型語言模型能直接存取臨床指引，對腫瘤治療決策會更有幫助，但還需更多研究來驗證其他癌症和臨床情境的適用性。 PubMed DOI

The potential of large language models to advance precision oncology.
大型語言模型推動精準腫瘤醫學的潛力 EBioMedicine 2025-04-30

這篇綜述介紹大型語言模型在腫瘤醫學的應用，包括癌症篩檢、診斷、分期和治療建議等，展現其提升精準醫療的潛力。文章也點出幻覺、倫理和應用侷限等挑戰，並提出改進建議，期望推動LLMs在癌症照護上的發展。 PubMed DOI

Enhancing biomarker based oncology trial matching using large language models.
利用大型語言模型提升以生物標記為基礎的腫瘤學試驗配對 NPJ Digit Med 2025-05-05

這項研究發現，開源大型語言模型（LLM）在從腫瘤臨床試驗描述中萃取基因生物標記資訊，並將試驗資料結構化方面，表現比GPT-4等封閉模型更好。即使沒特別調整，開源模型就很厲害，經過微調後準確度還能再提升。這有助於病患媒合合適的臨床試驗。 PubMed DOI

Development and validation of an autonomous artificial intelligence agent for clinical decision-making in oncology.
腫瘤學臨床決策用自主人工智慧代理的開發與驗證 Nat Cancer 2025-06-06

研究團隊把GPT-4和專業腫瘤醫學工具結合，開發出能自主做臨床決策的AI代理。測試20個複雜癌症案例時，AI選對工具的機率有87.5%，臨床決策正確率91%，引用指引正確率75.5%。這套系統比單用GPT-4準確率高出許多，證明結合語言模型和專業工具能大幅提升癌症照護決策品質。 PubMed DOI

Application of a general LLM-based classification system to retrieve information about oncological trials.
應用通用 LLM 為基礎的分類系統於腫瘤學試驗資訊檢索 Oncology 2025-06-15

我們開發了一套用大型語言模型（LLMs）自動分類腫瘤臨床試驗和文獻的系統，在多個資料集和任務上都表現優異，準確率超過94%、F1-score超過92%，回應有效性最高達99.88%。雖然還有提示敏感度和運算資源的挑戰，但未來LLMs有望成為醫學文獻分類的重要工具。 PubMed DOI

原始文章

站上相關主題文章列表