原始文章

模擬研究發現,DeepSeek 在頭頸癌治療計畫擬定上比 ChatGPT 更準確,兩者在腫瘤分期表現差不多。雖然正確率有統計意義,但目前還無法取代多專科團隊,較適合輔助臨床流程。未來應聚焦開發安全且能客製化的腫瘤科 AI。 PubMed DOI


站上相關主題文章列表

這項研究評估了新推出的AI模型Claude 3 Opus在診斷和規劃頭頸部鱗狀細胞癌(HNSCC)治療的效果,並與ChatGPT 4.0進行比較。研究於2024年3月進行,涵蓋50例HNSCC病例,並將AI模型的建議與傳統的多學科腫瘤委員會(MDT)建議進行對比。結果顯示,Claude 3 Opus在診斷準確性上優於ChatGPT 4.0,且提供的治療建議與MDT一致。雖然在臨床建議和解釋方面表現相當,但Claude 3未引用資訊來源。總體而言,Claude 3 Opus顯示出作為診斷工具的潛力,建議在臨床環境中使用。 PubMed DOI

這項研究評估了兩個版本的 ChatGPT—4o 和 4.0—在提供復發性和轉移性頭頸部鱗狀細胞癌 (HNSCC) 治療建議的表現。結果顯示,兩者主要提供手術、緩和醫療或系統性治療的一般建議。ChatGPT 4o 的反應速度比 4.0 快 48.5%。雖然兩者在臨床建議的質量上表現良好,但仍需經驗豐富的醫師進行驗證,因為有時會建議不符合當前指導方針的選項。因此,這些 AI 模型可作為輔助工具,但不應取代臨床判斷。 PubMed DOI

這項研究評估了ChatGPT-4在頭頸癌患者治療決策的有效性,並與多學科腫瘤會議(MOM)及全國綜合癌症網絡(NCCN)指導方針進行比較。分析263名患者的數據後發現,ChatGPT-4在一線治療的協議程度為中等(Kappa = 0.48),而在二線治療則顯著(Kappa = 0.78)。與NCCN指導方針的協議也顯著,但在某些特定患者群體中協議程度下降。研究結論指出,ChatGPT-4能有效協助臨床決策,但仍需改進以應對患者健康狀況的複雜性。 PubMed DOI

這項研究評估了AI語言模型ChatGPT在放射腫瘤學臨床情境中的表現。研究涵蓋12種不同疾病的案例,問題涉及流行病學、分期、臨床管理等領域。經過專業醫師審查後,ChatGPT的總得分為2317分(滿分2730分,得分率84%),在完整性、簡潔性和正確性方面表現良好。特別是在流行病學和癌症生物學上得分高達93%。不過,在治療計畫和臨床管理方面則表現較差,顯示其在處理複雜案例時仍有局限性。 PubMed DOI

人工智慧(AI)如ChatGPT-4正在改變醫療保健,特別是在脊椎轉移的治療決策上。本研究評估了ChatGPT-4在五個脊椎轉移案例中的表現,並與五位經驗豐富的脊椎外科醫生進行比較。結果顯示,ChatGPT的建議在73%的案例中與醫生一致,但多數建議偏向一般性,缺乏具體臨床指導。這顯示出AI在複雜醫療決策中的潛力與限制,未來需進一步研究以提升其應用效果。 PubMed DOI

這項研究發現,ChatGPT-4o在晚期胃癌治療建議的準確性和完整性上,表現都比Gemini Advanced更穩定。不過,兩者的建議都只能當作輔助工具,還是需要專業醫師監督,不能單獨用來做臨床決策。 PubMed DOI

這項研究發現,ChatGPT-4和4O在放射腫瘤科的文字型臨床問題上表現不錯,能提供實用建議,但遇到複雜或技術性高的情境就不太可靠。特別是在判讀鼻咽癌MRI影像時,ChatGPT-4O完全無法正確分期。總結來說,ChatGPT適合輔助一般臨床決策,但影像判讀還不行,使用時要特別小心。 PubMed DOI

這項研究發現,ChatGPT-4在建議原發性喉癌治療時,有72%和多專科腫瘤團隊(MDT)決策完全一致,且沒有明顯錯誤。其準確度和病人特徵無明顯關聯。未來若再優化,ChatGPT-4有機會成為醫師管理喉癌的好幫手。 PubMed DOI

這項研究發現,DeepSeek 在用中文回答前列腺癌放射治療問題時,表現明顯優於 ChatGPT,尤其在基礎知識和治療照護方面更突出;但用英文時,兩者差異不大。這顯示選擇語言優化的 AI 模型很重要,但專家審查仍不可或缺。 PubMed DOI

這項研究發現,ChatGPT-4V在判斷頭頸癌病患CT影像的淋巴結轉移和外侵犯時,雖然敏感度很高(100%),但特異性較低(約34%),容易高估病情,建議過度手術。雖然現階段還不適合直接用於手術規劃,但AI分析速度快、推理能力強,未來仍有成為輔助工具的潛力。 PubMed DOI