The In-depth Comparative Analysis of Four Large Language AI Models for Risk Assessment and Information Retrieval from Multi-Modality Prostate Cancer Work-up Reports.
四種大型語言AI模型在多模態前列腺癌檢查報告中的風險評估和信息檢索的深入比較分析。 World J Mens Health 2025-01-01

這項研究評估了四個大型語言模型（LLMs）在前列腺癌治療相關的資訊檢索和風險評估任務中的表現，特別針對第四期患者。研究使用350份模擬報告，並針對三個風險評估任務和七個資訊檢索任務進行評估。結果顯示，所有模型在資訊檢索任務中表現良好，但在風險評估上差異明顯，ChatGPT-4-turbo表現最佳。儘管結果令人鼓舞，研究仍提醒可能的誤解會影響臨床決策，並呼籲進一步研究以驗證結果的普遍性。 PubMed DOI

ChatGPT's Performance in Spinal Metastasis Cases-Can We Discuss Our Complex Cases with ChatGPT?
ChatGPT 在脊椎轉移癌病例中的表現 - 我們能否與 ChatGPT 討論我們的複雜病例？ J Clin Med 2025-01-08

人工智慧（AI）如ChatGPT-4正在改變醫療保健，特別是在脊椎轉移的治療決策上。本研究評估了ChatGPT-4在五個脊椎轉移案例中的表現，並與五位經驗豐富的脊椎外科醫生進行比較。結果顯示，ChatGPT的建議在73%的案例中與醫生一致，但多數建議偏向一般性，缺乏具體臨床指導。這顯示出AI在複雜醫療決策中的潛力與限制，未來需進一步研究以提升其應用效果。 PubMed DOI

Bridging the gap: Evaluating ChatGPT-generated, personalized, patient-centered prostate biopsy reports.
彌合差距：評估 ChatGPT 生成的個性化、以患者為中心的前列腺活檢報告。 Am J Clin Pathol 2025-01-22

這項研究探討使用ChatGPT來製作以病人為中心的前列腺活檢病理報告，旨在幫助病人理解複雜的醫學術語。研究人員根據國家綜合癌症網絡的指導方針，合成了35份報告並進行評估。結果顯示，AI生成的報告在醫生和病理學家的評價中大多準確且完整，雖然需要一些修改，但修改速度比撰寫原創報告快。這顯示ChatGPT有助於改善醫療提供者與病人之間的溝通，值得進一步研究。 PubMed DOI

Artificial intelligence with ChatGPT 4: a large language model in support of ocular oncology cases.
人工智慧與 ChatGPT 4：大型語言模型在眼科腫瘤病例中的支持。 Int Ophthalmol 2025-02-07

這項研究評估了ChatGPT在分析葡萄膜黑色素瘤患者案例並提供治療建議的能力。研究回顧了40名患者的案例，發現ChatGPT的手術建議準確性為55%，排除眼球摘除後提高至75%。與三位專家的建議一致性分別為50%、55%和57%，在排除眼球摘除後則提升至70%至75%。雖然ChatGPT在簡單案例中表現不錯，但在處理更複雜的情況時仍有其限制，顯示出需要更全面的患者評估。 PubMed DOI

ChatGPT for Univariate Statistics: Validation of AI-Assisted Data Analysis in Healthcare Research.
單變量統計的 ChatGPT：AI 輔助數據分析在醫療研究中的驗證。 J Med Internet Res 2025-02-07

這項研究評估了ChatGPT在Python程式碼解釋方面的有效性，特別作為數據分析工具。研究使用全國住院病人樣本的子集，重點在數據管理、描述性統計和推論統計。主要發現包括： 1. **數據處理和分類**：ChatGPT能準確重新分類和呈現數據。 2. **描述性統計**：提供正確的均值、標準差等計算。 3. **推論統計**：準確率隨提示具體性提升，從32.5%到92.5%不等。結論認為，ChatGPT對具備基本統計知識的研究人員是個有價值的工具，但需謹慎構建提示並進行監督，以確保結果準確。 PubMed DOI

ChatGPT-4o's Performance in Brain Tumor Diagnosis and MRI Findings: A Comparative Analysis with Radiologists.
ChatGPT-4o 在腦腫瘤診斷和 MRI 影像中的表現：與放射科醫師的比較分析。 Acad Radiol 2025-02-09

這項研究評估了ChatGPT-4o在識別MRI影像及診斷腦腫瘤的表現，並與經驗豐富的放射科醫師進行比較。研究涵蓋46名腦腫瘤患者的術前MRI影像。結果顯示，ChatGPT-4o識別病變的準確率為95.7%，但在定位病變和區分腦外、腦內病變方面表現不佳。其診斷成功率僅為56.8%，遠低於放射科醫師的90.9-93.2%。雖然ChatGPT-4o在某些特徵識別上表現良好，但在診斷上仍需改進，未來有潛力成為放射科醫師的輔助工具。 PubMed DOI

Comparing ChatGPT 4.0's Performance in Interpreting Thyroid Nodule Ultrasound Reports Using ACR-TI-RADS 2017: Analysis Across Different Levels of Ultrasound User Experience.
比較 ChatGPT 4.0 在解讀使用 ACR-TI-RADS 2017 的甲狀腺結節超音波報告中的表現：不同超音波使用者經驗水平的分析。 Diagnostics (Basel) 2025-03-13

本研究評估了ChatGPT 4.0根據ACR-TI-RADS 2017標準解讀甲狀腺超音波報告的能力，並與醫療專家及一名缺乏經驗的使用者進行比較。結果顯示，ChatGPT在回聲焦點的評估上與專家一致，但在其他標準上則有不一致。缺乏經驗的使用者表現優於ChatGPT，顯示傳統醫學訓練的重要性。結論指出，ChatGPT可作為輔助診斷工具，但無法取代人類專業知識，並建議改善AI算法以增強其臨床實用性。 PubMed DOI

ChatGPT-4o outperforms gemini advanced in assisting multidisciplinary decision-making for advanced gastric cancer.
ChatGPT-4o 在協助晚期胃癌多學科決策方面優於 Gemini Advanced Eur J Surg Oncol 2025-04-28

這項研究發現，ChatGPT-4o在晚期胃癌治療建議的準確性和完整性上，表現都比Gemini Advanced更穩定。不過，兩者的建議都只能當作輔助工具，還是需要專業醫師監督，不能單獨用來做臨床決策。 PubMed DOI

Assessing ChatGPT for clinical decision-making in radiation oncology, with open-ended questions and images.
在放射腫瘤科臨床決策中，利用開放式問題與影像評估 ChatGPT 的表現 Pract Radiat Oncol 2025-05-01

這項研究發現，ChatGPT-4和4O在放射腫瘤科的文字型臨床問題上表現不錯，能提供實用建議，但遇到複雜或技術性高的情境就不太可靠。特別是在判讀鼻咽癌MRI影像時，ChatGPT-4O完全無法正確分期。總結來說，ChatGPT適合輔助一般臨床決策，但影像判讀還不行，使用時要特別小心。 PubMed DOI

Accuracy and Reproducibility of ChatGPT Responses to Breast Cancer Tumor Board Patients.
ChatGPT 回應乳癌腫瘤委員會病患問題的準確性與再現性 JCO Clin Cancer Inform 2025-06-04

這項研究發現，ChatGPT-4.0在乳癌治療建議上，只有46%完全符合專家團隊意見，且重複問答一致性僅39%。它在早期乳癌表現較好，但遇到複雜或基因相關情境就明顯不足，常缺乏臨床細節。總結來說，目前ChatGPT在乳癌多專科照護上，準確度和穩定性都有限，使用時要特別小心。 PubMed DOI

原始文章

站上相關主題文章列表