ChatGPT4's diagnostic accuracy in inpatient neurology: A retrospective cohort study.
住院神經科中 ChatGPT4 的診斷準確性：一項回顧性隊列研究。 Heliyon 2025-01-06

這項研究評估了ChatGPT-4在住院神經科的診斷準確性，並與顧問神經科醫師進行比較。研究使用Epic電子健康紀錄的病人數據，CG4為51位病人生成了初步診斷和治療計畫。結果顯示，CG4的平均得分為2.57，顧問醫師為2.75，整體成功率相近（CG4為96.1%，顧問醫師為94.1%）。雖然顧問醫師的全面診斷可能性略高，但CG4仍被視為神經科有價值的診斷工具。未來需進一步研究以驗證這些結果。 PubMed DOI

Can ChatGPT 4.0 Diagnose Acute Aortic Dissection? Integrating Artificial Intelligence into Medical Diagnostics.
ChatGPT 4.0 能否診斷急性主動脈剝離？將人工智慧整合進醫學診斷中。 Am J Cardiol 2025-01-18

急性主動脈剝離（AD）是一種危及生命的疾病，常因症狀與其他病症相似而被誤診。本研究探討了OpenAI的AI模型ChatGPT 4.0在診斷急性AD的有效性。透過系統性搜尋PubMed，找到163篇案例報告，隨機分析十篇。患者年齡介於29至82歲，性別分佈均衡，高血壓為常見合併症。結果顯示，ChatGPT 4.0能成功將急性AD列為前三名的鑑別診斷之一，並在五個案例中確定為主要診斷。研究指出，ChatGPT 4.0可作為輔助工具，幫助醫生進行早期篩檢。 PubMed DOI

Evaluating Large Language Models for Automated CPT Code Prediction in Endovascular Neurosurgery.
評估大型語言模型在血管內神經外科自動 CPT 代碼預測中的應用。 J Med Syst 2025-01-24

這項研究評估了三個大型語言模型（LLMs）—ChatGPT 4.0、AtlasGPT 和 Gemini—在識別血管內神經外科手術報告中的程序術語（CPT）代碼的效果。分析了30份手術記錄後，AtlasGPT 表現最佳，正確識別35.3%的 CPT 代碼，ChatGPT 緊隨其後，正確率為35.1%，而 Gemini 僅有8.9%。統計分析顯示這些模型之間的表現差異顯著。研究指出，雖然這些模型能部分識別 CPT 代碼，但進一步訓練可提升準確性，並可能降低醫療成本。 PubMed DOI

Detection of Intracranial Hemorrhage from Computed Tomography Images: Diagnostic Role and Efficacy of ChatGPT-4o.
從電腦斷層掃描影像檢測顱內出血：ChatGPT-4o 的診斷角色與效能。 Diagnostics (Basel) 2025-01-25

本研究探討AI模型ChatGPT-4 Omni在非對比電腦斷層掃描影像中檢測顱內出血的有效性。分析240個案例後，發現該模型在識別影像模式上達到100%準確率，但在ICH檢測的準確率為68.3%。敏感性為79.2%，特異性57.5%。在第二次評估中，準確率提升至73.3%。雖然模型在識別影像模式和檢測ICH方面有潛力，但在出血定位和分類上仍有不足，建議進一步訓練以提升其醫療應用表現。 PubMed DOI

Evaluation of Advanced Artificial Intelligence Algorithms' Diagnostic Efficacy in Acute Ischemic Stroke: A Comparative Analysis of ChatGPT-4o and Claude 3.5 Sonnet Models.
急性缺血性中風中先進人工智慧演算法診斷效能的評估：ChatGPT-4o 與 Claude 3.5 Sonnet 模型的比較分析。 J Clin Med 2025-01-25

本研究評估了兩種AI模型（ChatGPT-4o和Claude 3.5 Sonnet）在檢測急性缺血性中風（AIS）方面的表現。分析了110例擴散加權影像（DWI），結果顯示Claude 3.5 Sonnet在靈敏度和特異性上均優於ChatGPT-4o，特別是在AIS的定位準確性上。雖然Claude 3.5 Sonnet的表現較佳，但兩者在準確性上仍有顯著限制，顯示出AI在臨床應用前需進一步發展。這強調了AI在放射診斷中的潛力與現階段的不足。 PubMed DOI

Artificial intelligence in neurovascular decision-making: a comparative analysis of ChatGPT-4 and multidisciplinary expert recommendations for unruptured intracranial aneurysms.
神經血管決策中的人工智慧：ChatGPT-4 與多學科專家對未破裂顱內動脈瘤建議的比較分析。 Neurosurg Rev 2025-02-21

這項研究探討了GPT-4在提供未破裂顱內動脈瘤（UIAs）患者治療建議的能力。研究發現，GPT-4能分析臨床資訊並生成建議，且未出現事實錯誤，但在25%的案例中未提供具體建議。專家對其建議的評分中位數為3.4分，且與神經血管委員會的決策一致性為65%。專家對AI的輔助能力共識程度偏低。總體而言，GPT-4的具體性和對科學證據的依賴尚不足以取代專業決策，建議進一步評估其臨床應用能力。 PubMed DOI

GPT-4 as a Clinical Decision Support Tool in Ischemic Stroke Management: Evaluation Study.
GPT-4 作為缺血性中風管理的臨床決策支持工具：評估研究。 JMIR AI 2025-03-07

腦血管疾病是全球第二大死亡原因，對殘疾影響深遠。本研究探討GPT-4在急診科神經科醫師處理急性缺血性中風的有效性，分析其建議與專家意見及實際治療結果的比較。研究回顧100名急性中風患者，結果顯示GPT-4的建議與專家意見高度一致，特別是在血管內血栓切除術方面表現優異。GPT-4在死亡預測上也表現良好，顯示其作為臨床決策支持工具的潛力，但也需注意其建議的侵略性，強調人類監督的重要性。未來需進一步驗證這些發現。 PubMed DOI

Effectiveness of ChatGPT-4 in predicting the human decision to send patients to the postoperative intensive care unit: a prospective multicentric study.
ChatGPT-4 在預測人類決策將患者送往術後重症監護病房的有效性：一項前瞻性多中心研究。 Minerva Anestesiol 2025-03-27

這項研究探討了使用ChatGPT-4預測術後重症監護病房（ICU）入院需求，並分析傳統方法如ASA分類的限制。針對406名年滿18歲的患者進行多中心分析，結果顯示ChatGPT-4預測278名患者需進入ICU，其中160名正確識別，準確率為64.5%。該模型敏感性達86.0%，特異性為46.4%，且卡方檢定顯著（P=0.000）。雖然預測結果與實際情況相符，但ICU住院時間的預測仍需改進。研究建議將AI整合進術前評估，以提升病患照護的客觀性與效率，並建議在不同族群中進行進一步驗證。 PubMed DOI

Assessing Diagnostic Precision and Therapeutic Guidance Using Artificial Intelligence in Functional Neurosurgery Cases.
運用人工智慧於功能性神經外科病例中評估診斷精確度與治療指引 Cureus 2025-06-06

這項研究比較了五種AI模型在神經外科診斷和治療建議上的表現，發現AtlasGPT最優秀。不過，各模型表現落差大，顯示AI還沒辦法直接應用在臨床，需要持續改進和嚴格監督。整體來說，AI有潛力協助神經外科決策，但導入臨床還要很謹慎。 PubMed DOI

Post-deployment Monitoring of AI Performance in Intracranial Hemorrhage Detection by ChatGPT.
ChatGPT於顱內出血偵測中AI表現的部署後監測 Acad Radiol 2025-08-12

這篇研究發現，Aidoc AI在臨床上偵測頭部CT的顱內出血表現很好，放射科醫師用起來敏感度高、特異性也很棒。ChatGPT-4 Turbo也能準確從報告中抓出ICH，顯示自動化監控AI很有潛力。不過，Aidoc在某些掃描儀（像Philips）或影像雜訊多時，偽陽性會比較多。整體來說，持續監控AI表現很重要，結合大型語言模型能提升效率與可靠度。 PubMed DOI

原始文章

站上相關主題文章列表