Comparing ChatGPT-3.5 and ChatGPT-4's alignments with the German evidence-based S3 guideline for adult soft tissue sarcoma.
比較 ChatGPT-3.5 和 ChatGPT-4 在成人軟組織肉瘤方面與德國循證 S3 指南的一致性。 iScience 2025-01-06

這項研究評估了ChatGPT-3.5和ChatGPT-4在回答成人軟組織肉瘤相關臨床問題的表現，問題依據德國S3指引制定。兩位肉瘤專家對80個問題的回答進行評分。結果顯示，ChatGPT-4的表現優於ChatGPT-3.5，準確性和充分性中位數分數分別為5.5對5.0和5.0對4.0。雖然兩者在某些主題上相似，但ChatGPT-4在一般治療及四肢/軀幹肉瘤方面更佳。不過，兩者偶爾也會提供誤導性和潛在危險的信息，強調臨床應用需謹慎及人類監督的重要性。 PubMed DOI

ChatGPT's Performance in Spinal Metastasis Cases-Can We Discuss Our Complex Cases with ChatGPT?
ChatGPT 在脊椎轉移癌病例中的表現 - 我們能否與 ChatGPT 討論我們的複雜病例？ J Clin Med 2025-01-08

人工智慧（AI）如ChatGPT-4正在改變醫療保健，特別是在脊椎轉移的治療決策上。本研究評估了ChatGPT-4在五個脊椎轉移案例中的表現，並與五位經驗豐富的脊椎外科醫生進行比較。結果顯示，ChatGPT的建議在73%的案例中與醫生一致，但多數建議偏向一般性，缺乏具體臨床指導。這顯示出AI在複雜醫療決策中的潛力與限制，未來需進一步研究以提升其應用效果。 PubMed DOI

Evaluating ChatGPT-4o as a decision support tool in multidisciplinary sarcoma tumor boards: heterogeneous performance across various specialties.
評估 ChatGPT-4o 作為多學科肉瘤腫瘤委員會的決策支持工具：在各專科之間的異質性表現。 Front Oncol 2025-02-03

這項研究評估了ChatGPT-4o在多學科肉瘤腫瘤委員會中的決策支持效果。研究設計了五個病患案例，並由專家小組評估AI的建議。專家根據理解能力、治療建議、術後護理等五個類別進行評分，結果顯示ChatGPT-4o的平均分數為3.76，外科專業得分最高（4.48），而放射腫瘤科得分較低。研究指出，雖然ChatGPT-4o在外科決策上有潛力，但在其他領域仍需改進，臨床醫師應了解其優缺點，以便更好地應用於臨床。 PubMed DOI

Artificial intelligence with ChatGPT 4: a large language model in support of ocular oncology cases.
人工智慧與 ChatGPT 4：大型語言模型在眼科腫瘤病例中的支持。 Int Ophthalmol 2025-02-07

這項研究評估了ChatGPT在分析葡萄膜黑色素瘤患者案例並提供治療建議的能力。研究回顧了40名患者的案例，發現ChatGPT的手術建議準確性為55%，排除眼球摘除後提高至75%。與三位專家的建議一致性分別為50%、55%和57%，在排除眼球摘除後則提升至70%至75%。雖然ChatGPT在簡單案例中表現不錯，但在處理更複雜的情況時仍有其限制，顯示出需要更全面的患者評估。 PubMed DOI

Assessing the Quality and Reliability of ChatGPT's Responses to Radiotherapy-Related Patient Queries: Comparative Study With GPT-3.5 and GPT-4.
ChatGPT 回應放射治療相關病患問題的品質與可靠性評估：與 GPT-3.5 及 GPT-4 的比較研究 JMIR Cancer 2025-04-16

這項研究發現，GPT-4在回答放射治療常見問題時，比GPT-3.5表現更好，但兩者的回答對一般人來說還是太難懂，也有可能出現錯誤資訊。建議在正式用於病人前，還需要加強內容的易讀性和正確性。 PubMed DOI

Assessing ChatGPT for clinical decision-making in radiation oncology, with open-ended questions and images.
在放射腫瘤科臨床決策中，利用開放式問題與影像評估 ChatGPT 的表現 Pract Radiat Oncol 2025-05-01

這項研究發現，ChatGPT-4和4O在放射腫瘤科的文字型臨床問題上表現不錯，能提供實用建議，但遇到複雜或技術性高的情境就不太可靠。特別是在判讀鼻咽癌MRI影像時，ChatGPT-4O完全無法正確分期。總結來說，ChatGPT適合輔助一般臨床決策，但影像判讀還不行，使用時要特別小心。 PubMed DOI

Application of AI Chatbot in Responding to Asynchronous Text-Based Messages From Patients With Cancer: Comparative Study.
AI 聊天機器人在回應癌症病患非同步文字訊息的應用：比較性研究 J Med Internet Res 2025-05-21

這項研究比較GPT-4和中國腫瘤科醫師回答癌症病患問題的表現。結果顯示，GPT-4在病患衛教的答案較完整，正確性和安全性也不輸醫師，但在醫療決策上正確率較低，偶爾還會出現危險錯誤。醫師和病患對同理心的感受也不同。總結來說，GPT-4適合用於衛教，但在醫療決策上仍需醫師把關。 PubMed DOI

Comparative analysis of the performance of the large language models ChatGPT-3.5, ChatGPT-4 and Open AI-o1 in the field of Programmed Cell Death in myeloma.
多發性骨髓瘤程式性細胞死亡領域中大型語言模型 ChatGPT-3.5、ChatGPT-4 與 Open AI-o1 表現之比較分析 Discov Oncol 2025-05-23

這項研究比較了三種 AI 模型在多發性骨髓瘤臨床問題上的表現，結果顯示 Open AI-o1 的答案最準確、最符合臨床指引，醫師滿意度也最高。雖然 Open AI-o1 在專業腫瘤學領域表現最佳，但建議仍需專家監督使用。 PubMed DOI

The Role of Artificial Intelligence (ChatGPT-4o) in Supporting Tumor Board Decisions.
人工智慧（ChatGPT-4o）在腫瘤委員會決策支持中的角色 J Clin Med 2025-05-28

這項研究發現，雖然ChatGPT-4o和腫瘤委員會在治療建議上各自有高度一致性，但兩者的建議常常不同。醫師普遍較認同腫瘤委員會的決策，且這差異有統計意義。顯示目前AI還無法取代專家處理複雜癌症個案的臨床判斷。 PubMed DOI

Accuracy and Reproducibility of ChatGPT Responses to Breast Cancer Tumor Board Patients.
ChatGPT 回應乳癌腫瘤委員會病患問題的準確性與再現性 JCO Clin Cancer Inform 2025-06-04

這項研究發現，ChatGPT-4.0在乳癌治療建議上，只有46%完全符合專家團隊意見，且重複問答一致性僅39%。它在早期乳癌表現較好，但遇到複雜或基因相關情境就明顯不足，常缺乏臨床細節。總結來說，目前ChatGPT在乳癌多專科照護上，準確度和穩定性都有限，使用時要特別小心。 PubMed DOI

原始文章

站上相關主題文章列表