Evaluating ChatGPT-4o as a decision support tool in multidisciplinary sarcoma tumor boards: heterogeneous performance across various specialties.
評估 ChatGPT-4o 作為多學科肉瘤腫瘤委員會的決策支持工具：在各專科之間的異質性表現。 Front Oncol 2025-02-03

這項研究評估了ChatGPT-4o在多學科肉瘤腫瘤委員會中的決策支持效果。研究設計了五個病患案例，並由專家小組評估AI的建議。專家根據理解能力、治療建議、術後護理等五個類別進行評分，結果顯示ChatGPT-4o的平均分數為3.76，外科專業得分最高（4.48），而放射腫瘤科得分較低。研究指出，雖然ChatGPT-4o在外科決策上有潛力，但在其他領域仍需改進，臨床醫師應了解其優缺點，以便更好地應用於臨床。 PubMed DOI

The Role of Artificial Intelligence in Gynecologic Oncology Decision Making: A Feasibility Study.
人工智慧在婦科腫瘤學決策中的角色：可行性研究。 Gynecol Obstet Invest 2025-02-20

這項可行性研究探討了人工智慧（AI）在婦科腫瘤學決策中的潛力，分析了五個虛構的婦科癌症案例。不同經驗的醫生與AI語言模型（如Chat-GPT 4.0、Google Gemini和Bing-Copilot）共同評估這些案例。研究發現，AI能有效提供治療建議，且與醫生的評估高度一致，特別是Chat-GPT在建議的清晰度上表現優異。然而，在複雜案例中，仍需人類的解釋。研究建議進一步探索AI在真實病人數據中的應用，並發展混合決策模型，以提升AI在臨床實踐中的整合性。 PubMed DOI

Large Language Models as Decision-Making Tools in Oncology: Comparing Artificial Intelligence Suggestions and Expert Recommendations.
大型語言模型作為腫瘤學中的決策工具：比較人工智慧建議與專家推薦。 JCO Clin Cancer Inform 2025-03-20

這項研究評估大型語言模型（LLMs）在根據病患醫療紀錄生成早期乳腺癌治療選項的準確性。使用2024年初的多學科團隊會議紀錄，測試了三個AI模型：Claude3-Opus、GPT4-Turbo和LLaMa3-70B。結果顯示，Claude3-Opus準確率86.6%，GPT4-Turbo為85.7%，LLaMa3-70B則為75.0%。兩者在輔助內分泌和靶向治療上表現良好，但在輔助放射治療上則有高估的情況。研究建議需進一步探討這些模型在臨床上的實際應用。 PubMed DOI

Assessing the accuracy of the GPT-4 model in multidisciplinary tumor board decision prediction.
評估 GPT-4 模型在多學科腫瘤委員會決策預測中的準確性。 Clin Transl Oncol 2025-03-26

這項研究評估了多學科腫瘤委員會（MTBs）與GPT-4人工智慧在癌症病患管理中的決策一致性。研究於2021年2月至2023年6月在安卡拉大學醫院進行，涵蓋610名癌症病患。結果顯示，GPT-4的預測與MTB決策的相容性得分為3.59，顯示高度一致性，但有10.2%的案例得分低於可接受範圍，需進一步審查。專家發現GPT-4在12.9%到25.8%的案例中不適當，顯示其在複雜或罕見案例中的限制。整體而言，GPT-4在腫瘤決策中具輔助潛力。 PubMed DOI

Evaluating artificial intelligence in decision-making for surgical treatment of benign breast conditions.
人工智慧於良性乳房疾病手術治療決策中的應用評估 J Plast Reconstr Aesthet Surg 2025-04-30

這項研究發現，ChatGPT-4o在協助乳房疾病手術規劃時，雖然能給出清楚且結構良好的建議，但在手術細節和風險評估上還不夠完善，且回答內容需要較高的閱讀理解能力。現階段它只能當作輔助工具，無法取代專業醫師，未來還需更多開發和專家驗證才能臨床應用。 PubMed DOI

Application of AI Chatbot in Responding to Asynchronous Text-Based Messages From Patients With Cancer: Comparative Study.
AI 聊天機器人在回應癌症病患非同步文字訊息的應用：比較性研究 J Med Internet Res 2025-05-21

這項研究比較GPT-4和中國腫瘤科醫師回答癌症病患問題的表現。結果顯示，GPT-4在病患衛教的答案較完整，正確性和安全性也不輸醫師，但在醫療決策上正確率較低，偶爾還會出現危險錯誤。醫師和病患對同理心的感受也不同。總結來說，GPT-4適合用於衛教，但在醫療決策上仍需醫師把關。 PubMed DOI

The Role of Artificial Intelligence (ChatGPT-4o) in Supporting Tumor Board Decisions.
人工智慧（ChatGPT-4o）在腫瘤委員會決策支持中的角色 J Clin Med 2025-05-28

這項研究發現，雖然ChatGPT-4o和腫瘤委員會在治療建議上各自有高度一致性，但兩者的建議常常不同。醫師普遍較認同腫瘤委員會的決策，且這差異有統計意義。顯示目前AI還無法取代專家處理複雜癌症個案的臨床判斷。 PubMed DOI

Accuracy and Reproducibility of ChatGPT Responses to Breast Cancer Tumor Board Patients.
ChatGPT 回應乳癌腫瘤委員會病患問題的準確性與再現性 JCO Clin Cancer Inform 2025-06-04

這項研究發現，ChatGPT-4.0在乳癌治療建議上，只有46%完全符合專家團隊意見，且重複問答一致性僅39%。它在早期乳癌表現較好，但遇到複雜或基因相關情境就明顯不足，常缺乏臨床細節。總結來說，目前ChatGPT在乳癌多專科照護上，準確度和穩定性都有限，使用時要特別小心。 PubMed DOI

Development and validation of an autonomous artificial intelligence agent for clinical decision-making in oncology.
腫瘤學臨床決策用自主人工智慧代理的開發與驗證 Nat Cancer 2025-06-06

研究團隊把GPT-4和專業腫瘤醫學工具結合，開發出能自主做臨床決策的AI代理。測試20個複雜癌症案例時，AI選對工具的機率有87.5%，臨床決策正確率91%，引用指引正確率75.5%。這套系統比單用GPT-4準確率高出許多，證明結合語言模型和專業工具能大幅提升癌症照護決策品質。 PubMed DOI

Exploring the medical ethical limitations of GPT-4 in clinical decision-making scenarios: a pilot survey.
GPT-4 在臨床決策情境中醫學倫理限制之探討：初步調查 Front Public Health 2025-06-13

這項研究發現，GPT-4在臨床倫理兩難情境下，能給出明確且積極的建議，與倫理原則的符合度高達86%。不過，遇到墮胎或代理孕母等議題時表現較弱，最低僅60%。雖然GPT-4有助於臨床決策，但偶爾會出錯或無法完全遵守倫理標準，實際應用上還是有侷限。 PubMed DOI

原始文章

站上相關主題文章列表