Comparative Evaluation of AI Models Such as ChatGPT 3.5, ChatGPT 4.0, and Google Gemini in Neuroradiology Diagnostics.
神經放射學診斷中 ChatGPT 3.5、ChatGPT 4.0 和 Google Gemini 等 AI 模型的比較評估。 Cureus 2024-09-26

這項研究探討了先進人工智慧模型在放射學的診斷能力，特別是ChatGPT（3.5和4.0版本）及Google Gemini的表現。分析262道選擇題後，結果顯示ChatGPT 4.0準確率最高，達64.89%，其次是ChatGPT 3.5的62.60%和Google Gemini的55.73%。ChatGPT 4.0在腦部及頭頸部診斷上表現優異，而Google Gemini在頭頸部表現最佳，但其他領域則不佳。研究強調這些AI模型的效能差異，並呼籲進一步改進及評估，以提升其在醫療診斷和教育中的應用，並考量病人照護的倫理問題。 PubMed DOI

ChatGPT4's diagnostic accuracy in inpatient neurology: A retrospective cohort study.
住院神經科中 ChatGPT4 的診斷準確性：一項回顧性隊列研究。 Heliyon 2025-01-06

這項研究評估了ChatGPT-4在住院神經科的診斷準確性，並與顧問神經科醫師進行比較。研究使用Epic電子健康紀錄的病人數據，CG4為51位病人生成了初步診斷和治療計畫。結果顯示，CG4的平均得分為2.57，顧問醫師為2.75，整體成功率相近（CG4為96.1%，顧問醫師為94.1%）。雖然顧問醫師的全面診斷可能性略高，但CG4仍被視為神經科有價值的診斷工具。未來需進一步研究以驗證這些結果。 PubMed DOI

Can ChatGPT 4.0 Diagnose Acute Aortic Dissection? Integrating Artificial Intelligence into Medical Diagnostics.
ChatGPT 4.0 能否診斷急性主動脈剝離？將人工智慧整合進醫學診斷中。 Am J Cardiol 2025-01-18

急性主動脈剝離（AD）是一種危及生命的疾病，常因症狀與其他病症相似而被誤診。本研究探討了OpenAI的AI模型ChatGPT 4.0在診斷急性AD的有效性。透過系統性搜尋PubMed，找到163篇案例報告，隨機分析十篇。患者年齡介於29至82歲，性別分佈均衡，高血壓為常見合併症。結果顯示，ChatGPT 4.0能成功將急性AD列為前三名的鑑別診斷之一，並在五個案例中確定為主要診斷。研究指出，ChatGPT 4.0可作為輔助工具，幫助醫生進行早期篩檢。 PubMed DOI

Detection of Intracranial Hemorrhage from Computed Tomography Images: Diagnostic Role and Efficacy of ChatGPT-4o.
從電腦斷層掃描影像檢測顱內出血：ChatGPT-4o 的診斷角色與效能。 Diagnostics (Basel) 2025-01-25

本研究探討AI模型ChatGPT-4 Omni在非對比電腦斷層掃描影像中檢測顱內出血的有效性。分析240個案例後，發現該模型在識別影像模式上達到100%準確率，但在ICH檢測的準確率為68.3%。敏感性為79.2%，特異性57.5%。在第二次評估中，準確率提升至73.3%。雖然模型在識別影像模式和檢測ICH方面有潛力，但在出血定位和分類上仍有不足，建議進一步訓練以提升其醫療應用表現。 PubMed DOI

Artificial intelligence in neurovascular decision-making: a comparative analysis of ChatGPT-4 and multidisciplinary expert recommendations for unruptured intracranial aneurysms.
神經血管決策中的人工智慧：ChatGPT-4 與多學科專家對未破裂顱內動脈瘤建議的比較分析。 Neurosurg Rev 2025-02-21

這項研究探討了GPT-4在提供未破裂顱內動脈瘤（UIAs）患者治療建議的能力。研究發現，GPT-4能分析臨床資訊並生成建議，且未出現事實錯誤，但在25%的案例中未提供具體建議。專家對其建議的評分中位數為3.4分，且與神經血管委員會的決策一致性為65%。專家對AI的輔助能力共識程度偏低。總體而言，GPT-4的具體性和對科學證據的依賴尚不足以取代專業決策，建議進一步評估其臨床應用能力。 PubMed DOI

Language Artificial Intelligence Models as Pioneers in Diagnostic Medicine? A Retrospective Analysis on Real-Time Patients.
語言人工智慧模型作為診斷醫學的先驅？對即時患者的回顧性分析。 J Clin Med 2025-02-26

本研究探討AI模型（如GPT-3.5和GPT-4）在急診科生成病症鑑別診斷的表現，並與急診科醫師的準確性進行比較。結果顯示，ChatGPT-4的準確率為85.5%，略高於ChatGPT-3.5的84.6%和醫師的83%。特別是在腸胃主訴方面，ChatGPT-4的準確性達87.5%。研究顯示AI模型在臨床決策中具潛在應用價值，建議未來進一步探索AI在醫療中的應用。 PubMed DOI

Compliance Evaluation with ChatGPT for diagnosis and treatment in patients brought to the ED with a Preliminary Diagnosis of Stroke.
急診室中對於初步診斷為中風患者的診斷與治療中，使用 ChatGPT 的遵從性評估。 Prehosp Emerg Care 2025-03-04

這項研究評估了ChatGPT在急診部門對懷疑中風患者的決策支持潛力，於安卡拉Etlik市立醫院進行，涵蓋512名患者。研究比較了ChatGPT在中風中心運送、大血管阻塞懷疑及治療選擇的決策，結果顯示其建議與實際結果一致性高，中風診斷敏感度達91%，靜脈內治療的高陰性預測值分別為98%和97%。雖然ChatGPT顯示出潛力，但研究強調醫師監督的重要性，建議將其作為輔助工具整合進臨床決策過程，以提升效率並確保患者安全。 PubMed DOI

GPT-4 as a Clinical Decision Support Tool in Ischemic Stroke Management: Evaluation Study.
GPT-4 作為缺血性中風管理的臨床決策支持工具：評估研究。 JMIR AI 2025-03-07

腦血管疾病是全球第二大死亡原因，對殘疾影響深遠。本研究探討GPT-4在急診科神經科醫師處理急性缺血性中風的有效性，分析其建議與專家意見及實際治療結果的比較。研究回顧100名急性中風患者，結果顯示GPT-4的建議與專家意見高度一致，特別是在血管內血栓切除術方面表現優異。GPT-4在死亡預測上也表現良好，顯示其作為臨床決策支持工具的潛力，但也需注意其建議的侵略性，強調人類監督的重要性。未來需進一步驗證這些發現。 PubMed DOI

Stroke Etiology Prediction Utilizing GPT-4 (P9-14.002).
利用 GPT-4 進行中風病因預測 (P9-14.002)。 Neurology 2025-04-07

這項研究評估了GPT-4在預測中風病因的能力，使用了腦部影像、心臟超音波及病歷資料等診斷元素。分析基於14個案例，經過五次試驗，並採用TOAST分類系統。結果顯示，GPT-4的準確率高，特異性達0.99，敏感性0.97，精確度0.96，F1分數為0.97。它在心源性栓塞和小血管阻塞方面表現特別好，但大血管動脈硬化的精確度稍低。這顯示GPT-4在中風病因預測上有潛力，但仍需進一步研究來驗證。研究也提到作者之間的潛在利益衝突。 PubMed DOI

Post-deployment Monitoring of AI Performance in Intracranial Hemorrhage Detection by ChatGPT.
ChatGPT於顱內出血偵測中AI表現的部署後監測 Acad Radiol 2025-08-12

這篇研究發現，Aidoc AI在臨床上偵測頭部CT的顱內出血表現很好，放射科醫師用起來敏感度高、特異性也很棒。ChatGPT-4 Turbo也能準確從報告中抓出ICH，顯示自動化監控AI很有潛力。不過，Aidoc在某些掃描儀（像Philips）或影像雜訊多時，偽陽性會比較多。整體來說，持續監控AI表現很重要，結合大型語言模型能提升效率與可靠度。 PubMed DOI

原始文章

站上相關主題文章列表