原始文章

這項研究評估了AtlasGPT和ChatGPT 4.0在預測動脈瘤性蛛網膜下腔出血(aSAH)患者的準確性,並與傳統臨床評估量表比較。研究包含82名患者,結果顯示住院死亡率為22%,34.1%需進行減壓性半顱切除手術。出院時28%患者有良好結果,六個月後提升至46.9%。AtlasGPT在預測手術需求方面表現最佳(AUC 0.80),而WFNS量表在長期功能預測上最為準確(AUC 0.76)。研究建議結合AI模型與傳統量表可提升預測準確性。 PubMed DOI


站上相關主題文章列表

這項研究評估了ChatGPT-4在住院神經科的診斷準確性,並與顧問神經科醫師進行比較。研究使用Epic電子健康紀錄的病人數據,CG4為51位病人生成了初步診斷和治療計畫。結果顯示,CG4的平均得分為2.57,顧問醫師為2.75,整體成功率相近(CG4為96.1%,顧問醫師為94.1%)。雖然顧問醫師的全面診斷可能性略高,但CG4仍被視為神經科有價值的診斷工具。未來需進一步研究以驗證這些結果。 PubMed DOI

急性主動脈剝離(AD)是一種危及生命的疾病,常因症狀與其他病症相似而被誤診。本研究探討了OpenAI的AI模型ChatGPT 4.0在診斷急性AD的有效性。透過系統性搜尋PubMed,找到163篇案例報告,隨機分析十篇。患者年齡介於29至82歲,性別分佈均衡,高血壓為常見合併症。結果顯示,ChatGPT 4.0能成功將急性AD列為前三名的鑑別診斷之一,並在五個案例中確定為主要診斷。研究指出,ChatGPT 4.0可作為輔助工具,幫助醫生進行早期篩檢。 PubMed DOI

這項研究評估了三個大型語言模型(LLMs)—ChatGPT 4.0、AtlasGPT 和 Gemini—在識別血管內神經外科手術報告中的程序術語(CPT)代碼的效果。分析了30份手術記錄後,AtlasGPT 表現最佳,正確識別35.3%的 CPT 代碼,ChatGPT 緊隨其後,正確率為35.1%,而 Gemini 僅有8.9%。統計分析顯示這些模型之間的表現差異顯著。研究指出,雖然這些模型能部分識別 CPT 代碼,但進一步訓練可提升準確性,並可能降低醫療成本。 PubMed DOI

本研究探討AI模型ChatGPT-4 Omni在非對比電腦斷層掃描影像中檢測顱內出血的有效性。分析240個案例後,發現該模型在識別影像模式上達到100%準確率,但在ICH檢測的準確率為68.3%。敏感性為79.2%,特異性57.5%。在第二次評估中,準確率提升至73.3%。雖然模型在識別影像模式和檢測ICH方面有潛力,但在出血定位和分類上仍有不足,建議進一步訓練以提升其醫療應用表現。 PubMed DOI

本研究評估了兩種AI模型(ChatGPT-4o和Claude 3.5 Sonnet)在檢測急性缺血性中風(AIS)方面的表現。分析了110例擴散加權影像(DWI),結果顯示Claude 3.5 Sonnet在靈敏度和特異性上均優於ChatGPT-4o,特別是在AIS的定位準確性上。雖然Claude 3.5 Sonnet的表現較佳,但兩者在準確性上仍有顯著限制,顯示出AI在臨床應用前需進一步發展。這強調了AI在放射診斷中的潛力與現階段的不足。 PubMed DOI

這項研究探討了GPT-4在提供未破裂顱內動脈瘤(UIAs)患者治療建議的能力。研究發現,GPT-4能分析臨床資訊並生成建議,且未出現事實錯誤,但在25%的案例中未提供具體建議。專家對其建議的評分中位數為3.4分,且與神經血管委員會的決策一致性為65%。專家對AI的輔助能力共識程度偏低。總體而言,GPT-4的具體性和對科學證據的依賴尚不足以取代專業決策,建議進一步評估其臨床應用能力。 PubMed DOI

腦血管疾病是全球第二大死亡原因,對殘疾影響深遠。本研究探討GPT-4在急診科神經科醫師處理急性缺血性中風的有效性,分析其建議與專家意見及實際治療結果的比較。研究回顧100名急性中風患者,結果顯示GPT-4的建議與專家意見高度一致,特別是在血管內血栓切除術方面表現優異。GPT-4在死亡預測上也表現良好,顯示其作為臨床決策支持工具的潛力,但也需注意其建議的侵略性,強調人類監督的重要性。未來需進一步驗證這些發現。 PubMed DOI

這項研究探討了使用ChatGPT-4預測術後重症監護病房(ICU)入院需求,並分析傳統方法如ASA分類的限制。針對406名年滿18歲的患者進行多中心分析,結果顯示ChatGPT-4預測278名患者需進入ICU,其中160名正確識別,準確率為64.5%。該模型敏感性達86.0%,特異性為46.4%,且卡方檢定顯著(P=0.000)。雖然預測結果與實際情況相符,但ICU住院時間的預測仍需改進。研究建議將AI整合進術前評估,以提升病患照護的客觀性與效率,並建議在不同族群中進行進一步驗證。 PubMed DOI

這項研究比較了五種AI模型在神經外科診斷和治療建議上的表現,發現AtlasGPT最優秀。不過,各模型表現落差大,顯示AI還沒辦法直接應用在臨床,需要持續改進和嚴格監督。整體來說,AI有潛力協助神經外科決策,但導入臨床還要很謹慎。 PubMed DOI

這篇研究發現,Aidoc AI在臨床上偵測頭部CT的顱內出血表現很好,放射科醫師用起來敏感度高、特異性也很棒。ChatGPT-4 Turbo也能準確從報告中抓出ICH,顯示自動化監控AI很有潛力。不過,Aidoc在某些掃描儀(像Philips)或影像雜訊多時,偽陽性會比較多。整體來說,持續監控AI表現很重要,結合大型語言模型能提升效率與可靠度。 PubMed DOI