Assessing the performance of ChatGPT's responses to questions related to epilepsy: A cross-sectional study on natural language processing and medical information retrieval.
評估 ChatGPT 對有關癲癇問題回答表現的研究：自然語言處理與醫學資訊檢索的橫斷面研究。 Seizure 2024-01-31

研究比較了ChatGPT-4和ChatGPT-3.5在提供癲癇相關資訊的表現，結果顯示ChatGPT-4較佳，回答具教育價值。這模型可提供可靠資訊支援醫護人員，但仍需進一步研究其應用潛力。 PubMed DOI

Artificial intelligence: Can it help us better grasp the idea of epilepsy? An exploratory dialogue with ChatGPT and DALL·E 2.
人工智慧：它能幫助我們更好地理解癫痫的概念嗎？與ChatGPT和DALL·E 2進行的探索性對話。 Epilepsy Behav 2024-05-17

AI研究了癲癇的定義和影響，指出對神經系統有影響，導致傷害、情緒和財務負擔等後果。AI生成的圖像描述較直接，缺乏象徵性。AI能認知癲癇負擔，但討論能力有限，或許需要更進階的AI工具。 PubMed DOI

ChatGPT M.D.: Is there any room for generative AI in neurology?
神經學中是否有生成式人工智慧的應用空間？ PLoS One 2024-10-09

這項研究探討了ChatGPT在神經學診斷中的輔助潛力。研究人員使用神經學專家的合成數據，評估ChatGPT對各種神經疾病的診斷準確性。結果顯示，ChatGPT的準確率介於68.5%到83.83%之間，與專家神經科醫生的81.66%相當，且高於一般醫生的57.15%。這顯示人工智慧工具如ChatGPT有助於提升臨床診斷的準確性，特別是在神經學領域，未來有望改善醫療實踐和診斷過程。 PubMed DOI

Evaluating Artificial Intelligence (AI)-Generated Patient Education Guides on Epilepsy: A Cross-Sectional Study of ChatGPT and Google Gemini.
評估人工智慧 (AI) 生成的癲癇患者教育指南：ChatGPT 和 Google Gemini 的橫斷面研究。 Cureus 2024-12-09

本研究比較了兩種人工智慧工具——ChatGPT和Google Gemini，在生成癲癇病人教育指南的有效性。結果顯示，兩者在多項指標上無顯著差異，但Google Gemini在理解難易度上表現較佳，特別是在全身性強直-陣攣發作、肌陣攣發作及癲癇持續狀態的回應中，且其每字音節數也較少。這顯示Google Gemini在病人教育方面更具優勢，未來需進一步提升AI工具的能力，以增進癲癇病人教育的效果。 PubMed DOI

ChatGPT4's diagnostic accuracy in inpatient neurology: A retrospective cohort study.
住院神經科中 ChatGPT4 的診斷準確性：一項回顧性隊列研究。 Heliyon 2025-01-06

這項研究評估了ChatGPT-4在住院神經科的診斷準確性，並與顧問神經科醫師進行比較。研究使用Epic電子健康紀錄的病人數據，CG4為51位病人生成了初步診斷和治療計畫。結果顯示，CG4的平均得分為2.57，顧問醫師為2.75，整體成功率相近（CG4為96.1%，顧問醫師為94.1%）。雖然顧問醫師的全面診斷可能性略高，但CG4仍被視為神經科有價值的診斷工具。未來需進一步研究以驗證這些結果。 PubMed DOI

The Clinical Value of ChatGPT for Epilepsy Presurgical Decision Making: Systematic Evaluation on Seizure Semiology Interpretation.
ChatGPT 在癲癇手術前決策中的臨床價值：對癲癇發作表現解釋的系統評估。 medRxiv 2025-02-20

這項研究探討了大型語言模型 ChatGPT 在解釋癲癇發作的臨床表現，以定位藥物抗性局部癲癇患者的癲癇病灶區的有效性。準確的病灶區定位對外科治療至關重要。研究比較了 ChatGPT 與癲癇專家的表現，使用了852組公開數據和184組台灣私有數據。結果顯示，ChatGPT 在額葉和顳葉的敏感性高達80-90%，且在常見病灶區的表現顯著優於專家。總體而言，ChatGPT 可成為癲癇術前評估的有用工具，未來隨著技術進步，其可靠性和有效性有望提升。 PubMed DOI

Can artificial intelligence diagnose seizures based on patients' descriptions? A study of GPT-4.
人工智慧能否根據病患的描述診斷癲癇？一項關於 GPT-4 的研究。 Epilepsia 2025-02-27

這篇論文探討了OpenAI的GPT-4在區分癲癇發作與功能性/解離性發作的能力。測試中，GPT-4在41個案例上表現出來，最初在沒有範例的情況下準確率為57%，提供一個範例後提升至64%，但更多範例並未進一步改善。相比之下，經驗豐富的神經科醫生平均達到71%的準確率。值得注意的是，在醫生一致同意的案例中，GPT-4的準確率達到81%。這顯示GPT-4的表現仍有限，但若能獲得更多臨床數據，或許能提升其診斷能力。 PubMed DOI

Artificial intelligence (ChatGPT) ready to evaluate ECG in real life? Not yet!
人工智慧 (ChatGPT) 準備好在現實生活中評估心電圖 (ECG) 嗎？還沒有！ Digit Health 2025-03-13

這項研究評估了基於ChatGPT的AI模型在解讀心電圖（ECG）的效果，並與心臟科醫生進行比較。分析了107個不同難度的ECG案例，結果顯示心臟科醫生的準確率為92.52%，遠高於AI模型的57.94%至62.62%。雖然AI在女性患者的表現較佳，但整體上仍不如醫生。研究指出，AI模型在ECG解讀上有潛力，但目前的可靠性不足，需進一步研究以提升準確性，特別是在複雜診斷方面。 PubMed DOI

Artificial intelligence (ChatGPT 4.0) vs. Human expertise for epileptic seizure and epilepsy diagnosis and classification in Adults: An exploratory study.
人工智慧 (ChatGPT 4.0) 與人類專業在成人癲癇發作及癲癇診斷與分類中的比較：一項探索性研究。 Epilepsy Behav 2025-03-13

這項研究探討了ChatGPT在診斷成人癲癇發作的有效性，並與專家進行比較。使用37個臨床案例，結果顯示ChatGPT在識別癲癇發作上敏感度高達96.9%，但特異度較低，特別是在區分急性與非誘發性發作時。雖然在診斷癲癇綜合症和結構性原因上表現良好，但在處理模糊案例時仍有困難。相比之下，人類專家的準確性更高。研究建議未來可將AI與專家結合，以提升癲癇診斷的準確性。 PubMed DOI

Evaluating ChatGPT for neurocognitive disorder diagnosis: a multicenter study.
評估 ChatGPT 在神經認知障礙診斷中的應用：一項多中心研究。 Clin Neuropsychol 2025-03-17

本研究評估ChatGPT 4 Omni在診斷神經認知障礙的準確性，並與早期版本比較。研究分為兩部分，第一部分分析其與臨床醫生的診斷一致性，涉及12,922名老年人，結果顯示有一定的關聯性，但準確性仍不足以獨立使用。第二部分則使用537名老年人的數據，未顯示顯著一致性。結論指出，雖然ChatGPT 4 Omni有潛力，但仍需改進與訓練，以提升其在臨床中的應用效果。 PubMed DOI

原始文章

站上相關主題文章列表