The In-depth Comparative Analysis of Four Large Language AI Models for Risk Assessment and Information Retrieval from Multi-Modality Prostate Cancer Work-up Reports.
四種大型語言AI模型在多模態前列腺癌檢查報告中的風險評估和信息檢索的深入比較分析。 World J Mens Health 2025-01-01

這項研究評估了四個大型語言模型（LLMs）在前列腺癌治療相關的資訊檢索和風險評估任務中的表現，特別針對第四期患者。研究使用350份模擬報告，並針對三個風險評估任務和七個資訊檢索任務進行評估。結果顯示，所有模型在資訊檢索任務中表現良好，但在風險評估上差異明顯，ChatGPT-4-turbo表現最佳。儘管結果令人鼓舞，研究仍提醒可能的誤解會影響臨床決策，並呼籲進一步研究以驗證結果的普遍性。 PubMed DOI

Assessment of decision-making with locally run and web-based large language models versus human board recommendations in otorhinolaryngology, head and neck surgery.
耳鼻喉科、頭頸外科中當地運行和基於網絡的大型語言模型與人類專家委員會建議的決策評估。 Eur Arch Otorhinolaryngol 2025-01-10

這項研究探討大型語言模型（LLMs）在耳鼻喉科手術腫瘤建議中的潛力。研究比較了多學科腫瘤委員會（MDT）與兩個LLMs（ChatGPT-4o和Llama 3）的建議。結果顯示，ChatGPT-4o與MDT的符合率為84%，Llama 3則為92%。兩者都能識別第一線治療選擇，且MDT的建議在28%的案例中被模型採納。雖然LLMs的建議受到正面評價，但研究強調應用於輔助決策，而非取代專業醫師，特別是考量數據保護問題。Llama 3的本地運行特性顯示出臨床應用潛力。 PubMed DOI

The interaction of structured data using openEHR and large Language models for clinical decision support in prostate cancer.
使用 openEHR 的結構化數據與大型語言模型在前列腺癌臨床決策支持中的互動。 World J Urol 2025-01-13

多學科團隊（MDTs）在癌症護理中非常重要，但需要專家投入大量時間，導致醫療成本上升。最近大型語言模型（LLMs）的進展，可能提升臨床決策的效率，並降低MDT的相關成本。一項針對171名新診斷前列腺癌患者的研究比較了兩個LLMs（chatGPT-4和Claude-3-Opus）與MDT會議的建議。結果顯示，LLMs的遵循率高達93%。不一致的情況主要因為臨床資訊不足。研究顯示，LLMs能生成準確的治療建議，未來有潛力簡化MDT流程，讓專家專注於更複雜的案例，並降低醫療成本。 PubMed DOI

Utility of Artificial Intelligence for Decision Making in Thoracic Multidisciplinary Tumor Boards.
人工智慧在胸部多學科腫瘤委員會決策中的應用價值。 J Clin Med 2025-01-25

本研究評估了人工智慧（AI），特別是OpenAI的自然語言處理技術，對胸腔多學科腫瘤委員會（MTB）決策的幫助。研究納入2023年1月至6月診斷為非小細胞肺癌的52位病患，AI模型生成的建議與MTB決策的一致性達76%，Kappa指數為0.59，手術建議的一致性更高，重複案例後達92.3%。結果顯示，AI可成為多學科腫瘤委員會決策的有力支持工具。 PubMed DOI

Leveraging Guideline-Based Clinical Decision Support Systems with Large Language Models: A Case Study with Breast Cancer.
利用基於指導的臨床決策支持系統與大型語言模型：乳腺癌的案例研究。 Methods Inf Med 2025-01-29

多學科腫瘤委員會（MTBs）在癌症治療決策中扮演重要角色，但常面臨案例過載，影響決策品質。臨床決策支持系統（CDSSs）雖已引入協助醫師，但使用仍有限。大型語言模型（LLMs）如ChatGPT的出現，為提升CDSS的效率提供新機會。 OncoDoc2專注於乳腺癌管理，研究探討LLMs如何透過提示工程技術（PETs）改善其可用性。使用200個乳腺癌患者摘要進行評估，結果顯示最佳方法結合Mistral和OpenChat模型，達到不錯的準確率，但與金標準建議的匹配度仍低，顯示LLMs在醫療決策中仍需進一步發展。 PubMed DOI

Leveraging Large Language Models to Generate Clinical Histories for Oncologic Imaging Requisitions.
利用大型語言模型生成腫瘤影像檢查申請的臨床歷史。 Radiology 2025-02-04

這項研究探討大型語言模型（LLMs）在自動生成腫瘤影像檢查申請的臨床歷史的應用，資料來自207名接受CT掃描的癌症患者。研究顯示，GPT-4在提取關鍵腫瘤學參數方面表現優異，F1分數達0.983。LLM生成的歷史中，主要診斷、急性症狀及相關手術的出現頻率均高於原始歷史，且差異具統計意義。放射科醫生更偏好LLM生成的歷史，認為其提供更完整的解讀，降低傷害風險。總之，LLM能準確創建全面的腫瘤影像臨床歷史，受到醫生青睞。 PubMed DOI

Enhanced Artificial Intelligence in Bladder Cancer Management: A Comparative Analysis and Optimization Study of Multiple Large Language Models.
膀胱癌管理中增強人工智慧的應用：多個大型語言模型的比較分析與優化研究。 J Endourol 2025-03-18

本研究探討大型語言模型（LLMs）在膀胱癌管理中的表現。研究設計了100個臨床問題，評估六種LLMs的回應準確性。結果顯示，Claude-3.5-Sonnet以89.33%準確率最佳，ChatGPT-4為85.67%。GPT-3.5-Turbo經過兩階段訓練後，準確率從74.33%提升至100%。研究顯示，針對性訓練能顯著改善模型表現，並指出策略性改進可克服專業醫學應用中的限制。 PubMed DOI

Assessing the accuracy of the GPT-4 model in multidisciplinary tumor board decision prediction.
評估 GPT-4 模型在多學科腫瘤委員會決策預測中的準確性。 Clin Transl Oncol 2025-03-26

這項研究評估了多學科腫瘤委員會（MTBs）與GPT-4人工智慧在癌症病患管理中的決策一致性。研究於2021年2月至2023年6月在安卡拉大學醫院進行，涵蓋610名癌症病患。結果顯示，GPT-4的預測與MTB決策的相容性得分為3.59，顯示高度一致性，但有10.2%的案例得分低於可接受範圍，需進一步審查。專家發現GPT-4在12.9%到25.8%的案例中不適當，顯示其在複雜或罕見案例中的限制。整體而言，GPT-4在腫瘤決策中具輔助潛力。 PubMed DOI

Exploring the potential of AI-powered applications for clinical decision-making in gynecologic oncology.
探討人工智慧應用於婦科腫瘤臨床決策的潛力 Int J Gynaecol Obstet 2025-06-13

這項研究發現，GPT-4在乳癌和婦科癌症治療建議上表現尚可，乳癌案例與專家意見一致率最高達84%。雖然經過多次提示後表現有提升，但在正確性、完整性及手術、基因檢測建議上仍有限制。未來AI可輔助臨床決策，但專家把關還是很重要。 PubMed DOI

Large language models in oncology: a review.
腫瘤學中大型語言模型的綜述 BMJ Oncol 2025-06-16

大型語言模型在腫瘤醫學有潛力協助臨床決策、資料整理及病患溝通，對醫師和病患都有幫助。不過，也有幻覺、泛化和倫理等問題需注意。LLMs應當作為輔助工具，幫助醫師提升癌症照護品質，而非取代醫師角色。 PubMed DOI

原始文章

站上相關主題文章列表