原始文章

這項回溯性研究比較了前列腺癌患者接受融合切片加隨機切片與單純隨機切片的升期風險,並由ChatGPT-4.0和人類專家分別分析。結果顯示,AI和人類的統計結果完全一致,且融合切片與較低升期風險有關。雖然ChatGPT分析表現可靠,但缺乏自動引用文獻功能,未來仍需加強人機協作。 PubMed DOI


站上相關主題文章列表

這項研究評估了ChatGPT-4對前列腺癌常見問題的回答質量。研究人員制定了八個問題,並由四位評審使用多種工具評估AI的回答。結果顯示,ChatGPT-4的可理解性得分很高,但可讀性卻顯示「難以閱讀」,平均達到11年級的水平。雖然大部分參考文獻都來自可信來源,但仍有兩個例子被識別為參考幻覺。總體來看,ChatGPT-4在患者教育中提供了一般可靠的回答,但在可讀性和準確性上仍需改進。 PubMed DOI

在2023年10月進行的研究中,評估了ChatGPT-4與ChatGPT-3.5在癌症治療建議的質量,特別針對前列腺癌、腎臟癌和膀胱癌。結果顯示,ChatGPT-4在提供更詳細和準確的建議方面表現優於3.5,建議批准率和與NCCN指導方針的一致性也更高。雖然ChatGPT-4的表現顯著改善,但研究強調AI工具不應取代專業醫療建議,使用時需謹慎。 PubMed DOI

這項研究評估了ChatGPT-4解讀新診斷前列腺癌患者的^68Ga PSMA PET/CT報告的能力。分析了164份報告,針對癌症擴散提出五個問題。結果顯示,回應的清晰度平均分數在4.93到4.99之間,準確性在4.79到4.96之間。不過,對於有遠端淋巴轉移的患者,準確性較低(4.28),而無遠端淋巴轉移的則為4.94。值得注意的是,8%的回應含有潛在的有害資訊。雖然ChatGPT-4表現不錯,但研究認為它無法取代醫生的評估,因為可能會生成虛假資訊。 PubMed DOI

這項研究評估了ChatGPT-4o在放射組學質量評分(RQS)方面的有效性,並與人類專家進行比較。研究納入了52篇2023至2024年發表的文章,結果顯示ChatGPT-4o和專家的中位RQS均為14.5,且無顯著差異。ChatGPT-4o的評分可靠性高,內部信度為0.905,且評估速度遠快於專家(每篇2.9-3.5分鐘對比13.9分鐘)。總結來說,ChatGPT-4o在放射組學研究質量評估上是有效且可靠的,未來可望成為快速自動化的評估工具。 PubMed DOI

這項研究評估了ChatGPT在生成前列腺癌相關醫療回應的表現。研究期間為2023年4月至6月,超過700名醫療腫瘤科和泌尿科醫師參與,且他們不知是在評估AI。結果顯示,602名受訪者在9個問題中有7個偏好AI生成的回應,但仍認為醫療網站更可信。98名受訪者對AI生成的複雜問題回應給予高評價,顯示臨床醫師欣賞AI的清晰度,但仍偏好傳統網站作為資訊來源。這提供了對臨床醫師評估AI內容的見解,並為未來的AI驗證研究提出了評估標準。 PubMed DOI

這項研究評估了AI語言模型ChatGPT在放射腫瘤學臨床情境中的表現。研究涵蓋12種不同疾病的案例,問題涉及流行病學、分期、臨床管理等領域。經過專業醫師審查後,ChatGPT的總得分為2317分(滿分2730分,得分率84%),在完整性、簡潔性和正確性方面表現良好。特別是在流行病學和癌症生物學上得分高達93%。不過,在治療計畫和臨床管理方面則表現較差,顯示其在處理複雜案例時仍有局限性。 PubMed DOI

這項研究評估了ChatGPT在泌尿科醫學影像解讀的有效性,特別是CT和MRI影像。結果顯示,ChatGPT在14%的CT和28%的MRI案例中準確識別首要診斷,雖然無顯著差異,但加入器官指導後,CT影像的準確率提升了18%。整體來看,雖然ChatGPT的初步有效性有限,但在用戶指導下,其表現可顯著改善,顯示AI在臨床應用中的潛力與限制。 PubMed DOI

人工智慧(AI)如ChatGPT-4正在改變醫療保健,特別是在脊椎轉移的治療決策上。本研究評估了ChatGPT-4在五個脊椎轉移案例中的表現,並與五位經驗豐富的脊椎外科醫生進行比較。結果顯示,ChatGPT的建議在73%的案例中與醫生一致,但多數建議偏向一般性,缺乏具體臨床指導。這顯示出AI在複雜醫療決策中的潛力與限制,未來需進一步研究以提升其應用效果。 PubMed DOI

這項研究探討使用ChatGPT來製作以病人為中心的前列腺活檢病理報告,旨在幫助病人理解複雜的醫學術語。研究人員根據國家綜合癌症網絡的指導方針,合成了35份報告並進行評估。結果顯示,AI生成的報告在醫生和病理學家的評價中大多準確且完整,雖然需要一些修改,但修改速度比撰寫原創報告快。這顯示ChatGPT有助於改善醫療提供者與病人之間的溝通,值得進一步研究。 PubMed DOI

這項研究發現,ChatGPT-4和4O在放射腫瘤科的文字型臨床問題上表現不錯,能提供實用建議,但遇到複雜或技術性高的情境就不太可靠。特別是在判讀鼻咽癌MRI影像時,ChatGPT-4O完全無法正確分期。總結來說,ChatGPT適合輔助一般臨床決策,但影像判讀還不行,使用時要特別小心。 PubMed DOI