原始文章

這項研究發現,ChatGPT在判斷癲癇發作症狀和定位藥物難治型局部癲癇的致癲區時,表現不輸給癲癇專科醫師,尤其在額葉和顳葉的預測上更是突出。無論用公開資料還是台灣醫院的病例,ChatGPT的表現都很穩定,淨正向推論率也和專家差不多。未來隨著技術進步,ChatGPT有望成為協助癲癇手術規劃的好幫手。 PubMed DOI


站上相關主題文章列表

這項研究評估了人工智慧工具ChatGPT-4V在急性中風診斷中的有效性,透過分析530張MRI影像,包括266例中風和264例正常病例。主要發現顯示,ChatGPT-4V在識別中風影像的準確率為88.3%,正常影像為90.1%。在檢測擴散限制方面,準確率為79.5%,但對於受影響半球的識別僅為26.2%。總體而言,該工具的診斷敏感性為79.57%,特異性為84.87%,顯示其在中風診斷中輔助醫療專業人員的潛力。 PubMed DOI

這項研究探討了ChatGPT在神經學診斷中的輔助潛力。研究人員使用神經學專家的合成數據,評估ChatGPT對各種神經疾病的診斷準確性。結果顯示,ChatGPT的準確率介於68.5%到83.83%之間,與專家神經科醫生的81.66%相當,且高於一般醫生的57.15%。這顯示人工智慧工具如ChatGPT有助於提升臨床診斷的準確性,特別是在神經學領域,未來有望改善醫療實踐和診斷過程。 PubMed DOI

本研究比較了兩種人工智慧工具——ChatGPT和Google Gemini,在生成癲癇病人教育指南的有效性。結果顯示,兩者在多項指標上無顯著差異,但Google Gemini在理解難易度上表現較佳,特別是在全身性強直-陣攣發作、肌陣攣發作及癲癇持續狀態的回應中,且其每字音節數也較少。這顯示Google Gemini在病人教育方面更具優勢,未來需進一步提升AI工具的能力,以增進癲癇病人教育的效果。 PubMed DOI

這項研究評估了更新版的ChatGPT-4o在預測癲癇持續狀態患者的臨床結果,並與癲癇持續狀態嚴重程度評分(STESS)進行比較。研究涵蓋760名患者,結果顯示ChatGPT-4o預測生存情況的敏感度為75.8%,但特異度僅36.6%。在預測恢復神經功能方面,敏感度為43.2%,特異度為74.7%。研究結論認為ChatGPT-4o在此預後評估上不可靠,建議臨床醫師不要依賴其結果。 PubMed DOI

這項研究評估了ChatGPT-4在住院神經科的診斷準確性,並與顧問神經科醫師進行比較。研究使用Epic電子健康紀錄的病人數據,CG4為51位病人生成了初步診斷和治療計畫。結果顯示,CG4的平均得分為2.57,顧問醫師為2.75,整體成功率相近(CG4為96.1%,顧問醫師為94.1%)。雖然顧問醫師的全面診斷可能性略高,但CG4仍被視為神經科有價值的診斷工具。未來需進一步研究以驗證這些結果。 PubMed DOI

本研究評估了大型語言模型(如ChatGPT)在癲癇診斷中的有效性,並比較了癲癇醫師與AI的診斷一致性。研究分析了597名急診患者,結果顯示神經科醫師診斷癲癇的比例為36.2%,而ChatGPT僅為18.2%。兩者之間的協議極低,Cohen's kappa值為-0.01,顯示AI在癲癇診斷上無法與人類醫師相提並論。雖然AI在識別非癲癇病例上表現較好,但仍需進一步研究以提升其診斷準確性。 PubMed DOI

這項研究比較了功能性癲癇發作可能性評分(FSLS)與兩個大型語言模型(ChatGPT和GPT-4)在區分功能性癲癇發作和癲癇發作的診斷表現。使用114個病患案例,FSLS的準確率為74%,而GPT-4的準確率達85%。研究發現,LLMs的預測結果在不同時間不一致,且自我評估的確定性與變異性中等相關。雖然GPT-4和FSLS能有效識別FS病患,但預測結果的差異及不一致性引發了對其臨床可靠性的擔憂,顯示出機器學習和人工智慧在診斷中的潛力與限制。 PubMed DOI

這項研究探討了大型語言模型 ChatGPT 在解釋癲癇發作的臨床表現,以定位藥物抗性局部癲癇患者的癲癇病灶區的有效性。準確的病灶區定位對外科治療至關重要。研究比較了 ChatGPT 與癲癇專家的表現,使用了852組公開數據和184組台灣私有數據。結果顯示,ChatGPT 在額葉和顳葉的敏感性高達80-90%,且在常見病灶區的表現顯著優於專家。總體而言,ChatGPT 可成為癲癇術前評估的有用工具,未來隨著技術進步,其可靠性和有效性有望提升。 PubMed DOI

這項研究評估了ChatGPT在急診部門對懷疑中風患者的決策支持潛力,於安卡拉Etlik市立醫院進行,涵蓋512名患者。研究比較了ChatGPT在中風中心運送、大血管阻塞懷疑及治療選擇的決策,結果顯示其建議與實際結果一致性高,中風診斷敏感度達91%,靜脈內治療的高陰性預測值分別為98%和97%。雖然ChatGPT顯示出潛力,但研究強調醫師監督的重要性,建議將其作為輔助工具整合進臨床決策過程,以提升效率並確保患者安全。 PubMed DOI

這項研究探討了ChatGPT在診斷成人癲癇發作的有效性,並與專家進行比較。使用37個臨床案例,結果顯示ChatGPT在識別癲癇發作上敏感度高達96.9%,但特異度較低,特別是在區分急性與非誘發性發作時。雖然在診斷癲癇綜合症和結構性原因上表現良好,但在處理模糊案例時仍有困難。相比之下,人類專家的準確性更高。研究建議未來可將AI與專家結合,以提升癲癇診斷的準確性。 PubMed DOI