原始文章

這項研究評估了ChatGPT-4o在臨床腫瘤學問題上的表現,並與傳統血液腫瘤學教科書進行比較。共評估37個與實體器官腫瘤相關的治療問題,結果顯示ChatGPT-4o的平均得分為7.83,優於教科書的7.0,且具統計意義(p < 0.01)。在10個案例中,ChatGPT-4o提供了更準確的資訊,並在26個案例中表現出更清晰的回答。研究強調定期更新的重要性,顯示ChatGPT-4o在腫瘤學的潛力,但需專家驗證以確保可靠性。 PubMed DOI


站上相關主題文章列表

商業供應商已經開發了各種人工智慧工具,包括放射腫瘤學。研究發現,基於人工智慧的聊天機器人ChatGPT在放射腫瘤學門診部表現良好,對常見問題準確率達80%,對多重選擇問題達90%。ChatGPT可提供準確的放射腫瘤學知識,對該領域教育有潛在影響。 PubMed DOI

ChatGPT是一個強大的AI語言模型,用來回答各種問題。美國臨床腫瘤學會的ASCO-SEP計畫旨在幫助醫師掌握最新的癌症護理知識。研究發現ChatGPT-3.5在ASCO-SEP問題上整體得分為56.1%,在不同癌症類型上的表現有差異。儘管對臨床決策有潛力支持,但仍需進一步改進以符合腫瘤學標準。未來研究可探索整合至醫療流程及跨學科合作、患者參與的潛力。 PubMed DOI

一項研究評估了聊天機器人ChatGPT在卵巢癌管理方面的表現,並與國家綜合癌症網絡(NCCN)的指引進行比較。研究生成了10個問題,涵蓋風險因素、手術及醫療管理等。結果顯示,NCCN的準確且完整回答為48%,未提示的GPT為64%,經過提示的GPT為66%。GPT-4在風險因素和手術管理上表現優於NCCN,但在醫療管理上較弱。雖然不準確回答比例低,但使用聊天機器人時仍需謹慎。 PubMed DOI

這項研究評估了ChatGPT在腫瘤學考試問題上的準確性,使用了單次學習的方法。研究中將600道來自國家放射腫瘤學在職考試的選擇題輸入到ChatGPT 4o和3.5中。結果顯示,ChatGPT 4o的正確率為72.2%,而3.5則為53.8%。在不同問題類別中,特別是關鍵研究和治療建議方面,ChatGPT的表現較弱。儘管有些限制,最新版本的ChatGPT顯示出顯著改進,未來在腫瘤學醫學訓練和決策中可能成為有價值的資源。 PubMed DOI

在2023年10月進行的研究中,評估了ChatGPT-4與ChatGPT-3.5在癌症治療建議的質量,特別針對前列腺癌、腎臟癌和膀胱癌。結果顯示,ChatGPT-4在提供更詳細和準確的建議方面表現優於3.5,建議批准率和與NCCN指導方針的一致性也更高。雖然ChatGPT-4的表現顯著改善,但研究強調AI工具不應取代專業醫療建議,使用時需謹慎。 PubMed DOI

這項研究探討了ChatGPT在遠距醫療管理轉移性前列腺癌的有效性,並與腫瘤科醫師進行比較,特別是在COVID-19疫情期間。研究分析了102名患者,重點在於ChatGPT在病歷記錄和決定面對面諮詢時的協助能力。結果顯示,ChatGPT與腫瘤科醫師在治療決策上有中等程度的一致性(Cohen's Kappa = 0.43, p < 0.001),診斷數量相似(中位數各為5,p = 0.12)。雖然結果顯示合理的一致性,但仍需進一步研究以了解其在醫療中的潛在應用。 PubMed DOI

這項研究評估了ChatGPT-4在頭頸癌患者治療決策的有效性,並與多學科腫瘤會議(MOM)及全國綜合癌症網絡(NCCN)指導方針進行比較。分析263名患者的數據後發現,ChatGPT-4在一線治療的協議程度為中等(Kappa = 0.48),而在二線治療則顯著(Kappa = 0.78)。與NCCN指導方針的協議也顯著,但在某些特定患者群體中協議程度下降。研究結論指出,ChatGPT-4能有效協助臨床決策,但仍需改進以應對患者健康狀況的複雜性。 PubMed DOI

這項研究評估了AI語言模型ChatGPT在放射腫瘤學臨床情境中的表現。研究涵蓋12種不同疾病的案例,問題涉及流行病學、分期、臨床管理等領域。經過專業醫師審查後,ChatGPT的總得分為2317分(滿分2730分,得分率84%),在完整性、簡潔性和正確性方面表現良好。特別是在流行病學和癌症生物學上得分高達93%。不過,在治療計畫和臨床管理方面則表現較差,顯示其在處理複雜案例時仍有局限性。 PubMed DOI

這項研究評估了三個版本的ChatGPT在婦科癌症(卵巢癌、子宮內膜癌和宮頸癌)診斷與治療問題上的表現。結果顯示,ChatGPT-Omni在所有問題類型中表現最佳,簡單問題的正確率達100%。在多選題和開放式問題中,ChatGPT-Omni也持續領先,顯示其提供準確回答的能力。整體來看,ChatGPT-Omni在臨床問題解決上展現出色潛力,適合用作決策支持和教育工具。 PubMed DOI

這項研究評估了ChatGPT-3.5和ChatGPT-4在回答成人軟組織肉瘤相關臨床問題的表現,問題依據德國S3指引制定。兩位肉瘤專家對80個問題的回答進行評分。結果顯示,ChatGPT-4的表現優於ChatGPT-3.5,準確性和充分性中位數分數分別為5.5對5.0和5.0對4.0。雖然兩者在某些主題上相似,但ChatGPT-4在一般治療及四肢/軀幹肉瘤方面更佳。不過,兩者偶爾也會提供誤導性和潛在危險的信息,強調臨床應用需謹慎及人類監督的重要性。 PubMed DOI