原始文章

這項研究評估了AtlasGPT和ChatGPT 4.0在預測動脈瘤性蛛網膜下腔出血(aSAH)患者的準確性,並與傳統臨床評估量表比較。研究包含82名患者,結果顯示住院死亡率為22%,34.1%需進行減壓性半顱切除手術。出院時28%患者有良好結果,六個月後提升至46.9%。AtlasGPT在預測手術需求方面表現最佳(AUC 0.80),而WFNS量表在長期功能預測上最為準確(AUC 0.76)。研究建議結合AI模型與傳統量表可提升預測準確性。 PubMed DOI


站上相關主題文章列表

研究比較了ChatGPT、人類醫師和標準評分系統在預測創傷性腦損傷後結果的能力。結果顯示ChatGPT對於預測6個月後結果有高敏感性,但特異性較低,準確性也不如人類醫師和標準評分系統。因此,ChatGPT可能不適合用於預測TBI結果。 PubMed DOI

研究發現ChatGPT語言模型在中風患者中預測功能性結果表現優異,特別是對於治療效果好、閉塞遠、時間短的患者。將這樣的人工智慧模型應用在臨床上,有助於提升中風患者的護理品質。 PubMed DOI

這項研究評估了人工智慧工具ChatGPT-4V在急性中風診斷中的有效性,透過分析530張MRI影像,包括266例中風和264例正常病例。主要發現顯示,ChatGPT-4V在識別中風影像的準確率為88.3%,正常影像為90.1%。在檢測擴散限制方面,準確率為79.5%,但對於受影響半球的識別僅為26.2%。總體而言,該工具的診斷敏感性為79.57%,特異性為84.87%,顯示其在中風診斷中輔助醫療專業人員的潛力。 PubMed DOI

這項研究評估了更新版的ChatGPT-4o在預測癲癇持續狀態患者的臨床結果,並與癲癇持續狀態嚴重程度評分(STESS)進行比較。研究涵蓋760名患者,結果顯示ChatGPT-4o預測生存情況的敏感度為75.8%,但特異度僅36.6%。在預測恢復神經功能方面,敏感度為43.2%,特異度為74.7%。研究結論認為ChatGPT-4o在此預後評估上不可靠,建議臨床醫師不要依賴其結果。 PubMed DOI

這項研究評估了三個大型語言模型(LLMs)—ChatGPT 4.0、AtlasGPT 和 Gemini—在識別血管內神經外科手術報告中的程序術語(CPT)代碼的效果。分析了30份手術記錄後,AtlasGPT 表現最佳,正確識別35.3%的 CPT 代碼,ChatGPT 緊隨其後,正確率為35.1%,而 Gemini 僅有8.9%。統計分析顯示這些模型之間的表現差異顯著。研究指出,雖然這些模型能部分識別 CPT 代碼,但進一步訓練可提升準確性,並可能降低醫療成本。 PubMed DOI

本研究探討AI模型ChatGPT-4 Omni在非對比電腦斷層掃描影像中檢測顱內出血的有效性。分析240個案例後,發現該模型在識別影像模式上達到100%準確率,但在ICH檢測的準確率為68.3%。敏感性為79.2%,特異性57.5%。在第二次評估中,準確率提升至73.3%。雖然模型在識別影像模式和檢測ICH方面有潛力,但在出血定位和分類上仍有不足,建議進一步訓練以提升其醫療應用表現。 PubMed DOI

本研究評估了兩種AI模型(ChatGPT-4o和Claude 3.5 Sonnet)在檢測急性缺血性中風(AIS)方面的表現。分析了110例擴散加權影像(DWI),結果顯示Claude 3.5 Sonnet在靈敏度和特異性上均優於ChatGPT-4o,特別是在AIS的定位準確性上。雖然Claude 3.5 Sonnet的表現較佳,但兩者在準確性上仍有顯著限制,顯示出AI在臨床應用前需進一步發展。這強調了AI在放射診斷中的潛力與現階段的不足。 PubMed DOI

這項研究探討了GPT-4在提供未破裂顱內動脈瘤(UIAs)患者治療建議的能力。研究發現,GPT-4能分析臨床資訊並生成建議,且未出現事實錯誤,但在25%的案例中未提供具體建議。專家對其建議的評分中位數為3.4分,且與神經血管委員會的決策一致性為65%。專家對AI的輔助能力共識程度偏低。總體而言,GPT-4的具體性和對科學證據的依賴尚不足以取代專業決策,建議進一步評估其臨床應用能力。 PubMed DOI

腦血管疾病是全球第二大死亡原因,對殘疾影響深遠。本研究探討GPT-4在急診科神經科醫師處理急性缺血性中風的有效性,分析其建議與專家意見及實際治療結果的比較。研究回顧100名急性中風患者,結果顯示GPT-4的建議與專家意見高度一致,特別是在血管內血栓切除術方面表現優異。GPT-4在死亡預測上也表現良好,顯示其作為臨床決策支持工具的潛力,但也需注意其建議的侵略性,強調人類監督的重要性。未來需進一步驗證這些發現。 PubMed DOI

這項研究探討了使用ChatGPT-4預測術後重症監護病房(ICU)入院需求,並分析傳統方法如ASA分類的限制。針對406名年滿18歲的患者進行多中心分析,結果顯示ChatGPT-4預測278名患者需進入ICU,其中160名正確識別,準確率為64.5%。該模型敏感性達86.0%,特異性為46.4%,且卡方檢定顯著(P=0.000)。雖然預測結果與實際情況相符,但ICU住院時間的預測仍需改進。研究建議將AI整合進術前評估,以提升病患照護的客觀性與效率,並建議在不同族群中進行進一步驗證。 PubMed DOI