原始文章

這項研究評估了ChatGPT的GPT-3.5和GPT-4模型在根據全國綜合癌症網絡(NCCN)指導方針對非肌肉侵襲性膀胱癌(NMIBC)進行風險分層的能力。研究創建了36個病人情境,結果顯示GPT-4在有文本背景下的準確率達到100%,而GPT-3.5則為74%。雖然GPT-4在處理中等風險的NMIBC時表現較佳,但仍有高估風險的情況。整體而言,GPT-4在臨床應用上顯示出潛力,但仍需進一步驗證。 PubMed DOI


站上相關主題文章列表

研究發現,ChatGPT提供的攝護腺癌資訊雖多,但準確性和品質較差,建議使用時要謹慎。未來需深入研究不同主題和語言模型,以提升人工智慧生成的患者資訊品質。 PubMed DOI

研究使用ChatGPT進行甲狀腺結節風險評估,顯示在預測惡性風險方面有一定潛力,但仍需更多研究驗證臨床應用。整合ChatGPT到臨床工作流程中,有助於提升甲狀腺結節風險評估和病人護理的效果。 PubMed DOI

最新的自然語言處理和機器學習技術,像是ChatGPT,可能會在醫療保健領域帶來革新。ChatGPT是OpenAI在2022年11月推出的,引起全球矚目。研究顯示,ChatGPT在根據NCCN指南為頭頸癌提供治療建議方面表現出潛力,雖然仍有一些不準確之處。AI模型與醫學專家的合作至關重要,才能運用AI進行個人化的癌症護理。 PubMed DOI

研究比較了ChatGPT 3.5和4.0在回答腎細胞癌臨床問題時的表現。結果顯示,ChatGPT 4.0比3.5更準確,但兩者回答時有些不穩定。透過微調GPT-3.5 Turbo模型,回答的正確率達93.75%,未來或可達100%。這種方法旨在提升ChatGPT在臨床指導上的能力,增進在腎臟腫瘤學中的應用價值。 PubMed DOI

研究指出,ChatGPT-4在神經腫瘤學案例中比ChatGPT-3.5表現更好。ChatGPT-4的診斷準確率為85%,治療計劃準確率為75%,明顯高於ChatGPT-3.5的65%和10%。神經外科醫生認為ChatGPT-4準確性較佳,有潛力成為神經腫瘤學的診斷工具。 PubMed DOI

研究比較了ChatGPT在回答攝護腺癌篩檢問題時的表現,發現GPT-4優於GPT-3.5,易讀性也更高。提示影響回應質量,尤其是清晰度。 PubMed DOI

在2023年10月進行的研究中,評估了ChatGPT-4與ChatGPT-3.5在癌症治療建議的質量,特別針對前列腺癌、腎臟癌和膀胱癌。結果顯示,ChatGPT-4在提供更詳細和準確的建議方面表現優於3.5,建議批准率和與NCCN指導方針的一致性也更高。雖然ChatGPT-4的表現顯著改善,但研究強調AI工具不應取代專業醫療建議,使用時需謹慎。 PubMed DOI

這項研究評估了ChatGPT在診斷結腸癌的能力,特別是比較GPT-3.5和GPT-4.0的表現。研究分析了286份腸癌病例,結果顯示GPT-4.0在初診和次診的準確率均高於GPT-3.5,分別為0.972對0.855和0.908對0.617。雖然GPT-4.0在處理病史和實驗室數據上有所改善,但在識別症狀方面仍有挑戰。整體而言,GPT-4.0在臨床輔助診斷中展現出潛力,但仍需進一步研究以克服其限制。 PubMed DOI

這篇評論評估了GPT-4在尿路結石診斷與治療問題上的表現,並與歐洲泌尿學會(EAU)指導方針進行比較。雖然GPT-4的回答大致符合指導方針,但有六個回答缺少關鍵內容,八個則包含錯誤資訊。模型在初步診斷和治療計劃上表現相對安全,但在預防性治療的複雜性上表現不佳,未能完全遵循EAU的策略。總體而言,GPT-4在泌尿科問題上顯示潛力,但仍需改進準確性和臨床相關性。 PubMed DOI

這項研究評估了AI語言模型ChatGPT在放射腫瘤學臨床情境中的表現。研究涵蓋12種不同疾病的案例,問題涉及流行病學、分期、臨床管理等領域。經過專業醫師審查後,ChatGPT的總得分為2317分(滿分2730分,得分率84%),在完整性、簡潔性和正確性方面表現良好。特別是在流行病學和癌症生物學上得分高達93%。不過,在治療計畫和臨床管理方面則表現較差,顯示其在處理複雜案例時仍有局限性。 PubMed DOI