原始文章

本研究評估了兩種AI模型(ChatGPT-4o和Claude 3.5 Sonnet)在檢測急性缺血性中風(AIS)方面的表現。分析了110例擴散加權影像(DWI),結果顯示Claude 3.5 Sonnet在靈敏度和特異性上均優於ChatGPT-4o,特別是在AIS的定位準確性上。雖然Claude 3.5 Sonnet的表現較佳,但兩者在準確性上仍有顯著限制,顯示出AI在臨床應用前需進一步發展。這強調了AI在放射診斷中的潛力與現階段的不足。 PubMed DOI


站上相關主題文章列表

這項研究探討了先進人工智慧模型在放射學的診斷能力,特別是ChatGPT(3.5和4.0版本)及Google Gemini的表現。分析262道選擇題後,結果顯示ChatGPT 4.0準確率最高,達64.89%,其次是ChatGPT 3.5的62.60%和Google Gemini的55.73%。ChatGPT 4.0在腦部及頭頸部診斷上表現優異,而Google Gemini在頭頸部表現最佳,但其他領域則不佳。研究強調這些AI模型的效能差異,並呼籲進一步改進及評估,以提升其在醫療診斷和教育中的應用,並考量病人照護的倫理問題。 PubMed DOI

這項研究評估了ChatGPT-4在住院神經科的診斷準確性,並與顧問神經科醫師進行比較。研究使用Epic電子健康紀錄的病人數據,CG4為51位病人生成了初步診斷和治療計畫。結果顯示,CG4的平均得分為2.57,顧問醫師為2.75,整體成功率相近(CG4為96.1%,顧問醫師為94.1%)。雖然顧問醫師的全面診斷可能性略高,但CG4仍被視為神經科有價值的診斷工具。未來需進一步研究以驗證這些結果。 PubMed DOI

急性主動脈剝離(AD)是一種危及生命的疾病,常因症狀與其他病症相似而被誤診。本研究探討了OpenAI的AI模型ChatGPT 4.0在診斷急性AD的有效性。透過系統性搜尋PubMed,找到163篇案例報告,隨機分析十篇。患者年齡介於29至82歲,性別分佈均衡,高血壓為常見合併症。結果顯示,ChatGPT 4.0能成功將急性AD列為前三名的鑑別診斷之一,並在五個案例中確定為主要診斷。研究指出,ChatGPT 4.0可作為輔助工具,幫助醫生進行早期篩檢。 PubMed DOI

本研究探討AI模型ChatGPT-4 Omni在非對比電腦斷層掃描影像中檢測顱內出血的有效性。分析240個案例後,發現該模型在識別影像模式上達到100%準確率,但在ICH檢測的準確率為68.3%。敏感性為79.2%,特異性57.5%。在第二次評估中,準確率提升至73.3%。雖然模型在識別影像模式和檢測ICH方面有潛力,但在出血定位和分類上仍有不足,建議進一步訓練以提升其醫療應用表現。 PubMed DOI

這項研究探討了GPT-4在提供未破裂顱內動脈瘤(UIAs)患者治療建議的能力。研究發現,GPT-4能分析臨床資訊並生成建議,且未出現事實錯誤,但在25%的案例中未提供具體建議。專家對其建議的評分中位數為3.4分,且與神經血管委員會的決策一致性為65%。專家對AI的輔助能力共識程度偏低。總體而言,GPT-4的具體性和對科學證據的依賴尚不足以取代專業決策,建議進一步評估其臨床應用能力。 PubMed DOI

本研究探討AI模型(如GPT-3.5和GPT-4)在急診科生成病症鑑別診斷的表現,並與急診科醫師的準確性進行比較。結果顯示,ChatGPT-4的準確率為85.5%,略高於ChatGPT-3.5的84.6%和醫師的83%。特別是在腸胃主訴方面,ChatGPT-4的準確性達87.5%。研究顯示AI模型在臨床決策中具潛在應用價值,建議未來進一步探索AI在醫療中的應用。 PubMed DOI

這項研究評估了ChatGPT在急診部門對懷疑中風患者的決策支持潛力,於安卡拉Etlik市立醫院進行,涵蓋512名患者。研究比較了ChatGPT在中風中心運送、大血管阻塞懷疑及治療選擇的決策,結果顯示其建議與實際結果一致性高,中風診斷敏感度達91%,靜脈內治療的高陰性預測值分別為98%和97%。雖然ChatGPT顯示出潛力,但研究強調醫師監督的重要性,建議將其作為輔助工具整合進臨床決策過程,以提升效率並確保患者安全。 PubMed DOI

腦血管疾病是全球第二大死亡原因,對殘疾影響深遠。本研究探討GPT-4在急診科神經科醫師處理急性缺血性中風的有效性,分析其建議與專家意見及實際治療結果的比較。研究回顧100名急性中風患者,結果顯示GPT-4的建議與專家意見高度一致,特別是在血管內血栓切除術方面表現優異。GPT-4在死亡預測上也表現良好,顯示其作為臨床決策支持工具的潛力,但也需注意其建議的侵略性,強調人類監督的重要性。未來需進一步驗證這些發現。 PubMed DOI

這項研究評估了GPT-4在預測中風病因的能力,使用了腦部影像、心臟超音波及病歷資料等診斷元素。分析基於14個案例,經過五次試驗,並採用TOAST分類系統。結果顯示,GPT-4的準確率高,特異性達0.99,敏感性0.97,精確度0.96,F1分數為0.97。它在心源性栓塞和小血管阻塞方面表現特別好,但大血管動脈硬化的精確度稍低。這顯示GPT-4在中風病因預測上有潛力,但仍需進一步研究來驗證。研究也提到作者之間的潛在利益衝突。 PubMed DOI

這篇研究發現,Aidoc AI在臨床上偵測頭部CT的顱內出血表現很好,放射科醫師用起來敏感度高、特異性也很棒。ChatGPT-4 Turbo也能準確從報告中抓出ICH,顯示自動化監控AI很有潛力。不過,Aidoc在某些掃描儀(像Philips)或影像雜訊多時,偽陽性會比較多。整體來說,持續監控AI表現很重要,結合大型語言模型能提升效率與可靠度。 PubMed DOI