原始文章

深腦刺激(DBS)是一種外科手術,主要用來治療帕金森氏症等疾病,透過在特定腦區植入電極進行治療。由於患者對手術常有疑慮,像ChatGPT這樣的工具能提供易懂的資訊。一項研究評估了ChatGPT 3.5和4對80個DBS相關問題的回答,結果顯示GPT 4的準確率為83.8%,而GPT 3.5為57.5%。不過,GPT 3.5有6.3%的回答可能有害,而GPT 4則沒有。雖然表現不錯,但有害回答的存在提醒我們要謹慎,建議患者在考慮DBS手術時,不要僅依賴AI模型。 PubMed DOI


站上相關主題文章列表

研究比較了ChatGPT的GPT-3.5和GPT-4模型在解答韓國外科醫師考試問題時的表現,結果顯示GPT-4準確率高達76.4%,明顯勝過GPT-3.5的46.8%。GPT-4在各專業領域都表現穩定,但仍需搭配人類專業知識和判斷力。 PubMed DOI

研究比較了GPT-3.5、GPT-4和Google Bard在神經外科口試考題上的表現,結果發現GPT-4準確率最高達82.6%,明顯優於其他兩者。GPT-4在特定類別及影像相關問題上表現較佳,且較少出現"幻覺"情況。研究強調了LLM表現中問題特性和解決方式的重要性。 PubMed DOI

研究評估了ChatGPT在神經外科領域的應用,發現GPT-3.5像資歷較低醫師,GPT-4.0則像資歷高醫師。雖然ChatGPT還不及經驗豐富醫師,但未來改進或許會提升其效能。 PubMed DOI

研究比較了ChatGPT-4和ChatGPT-3.5在提供癲癇相關資訊的表現,結果顯示ChatGPT-4較佳,回答具教育價值。這模型可提供可靠資訊支援醫護人員,但仍需進一步研究其應用潛力。 PubMed DOI

研究發現ChatGPT在回答癲癇相關問題和提供情緒支持方面有一定準確性和一致性,但在預後問題上表現較差。雖可提供資訊和情緒支持,但可能給出不正確建議,謹慎使用,不宜當醫療指導。更適合用於患者教育。 PubMed DOI

研究評估了在神經外科中使用ChatGPT的效果,分析AI生成的回答對手術後問題的幫助程度。1080個回答來自ChatGPT-3.0、3.5和4.0,由醫師評估後發現回答準確,但幫助程度較低。ChatGPT-4.0的可讀性較前版本提升。 PubMed DOI

研究指出,ChatGPT-4在神經腫瘤學案例中比ChatGPT-3.5表現更好。ChatGPT-4的診斷準確率為85%,治療計劃準確率為75%,明顯高於ChatGPT-3.5的65%和10%。神經外科醫生認為ChatGPT-4準確性較佳,有潛力成為神經腫瘤學的診斷工具。 PubMed DOI

自2023年以來,ChatGPT一直是語言模型研究的領頭羊。研究發現,ChatGPT/GPT-4在口腔手術後追蹤病人方面有潛力,能提供準確知識和安慰。儘管如此,仍需謹慎使用,並在醫師指導下應用。 PubMed DOI

研究評估了AI聊天機器人ChatGPT-4在提供耳硬化手術資訊的表現,結果顯示回答品質不一。專家使用DISCERN系統評估後發現,回答有時超出一般讀者理解範圍,且可能不完整或誤導。建議改善AI系統以提供準確易懂的資訊,並建議醫護人員監督其應用於病患教育和護理。 PubMed DOI

這項研究評估了ChatGPT 3.5和4在回答骨科考試問題的表現,使用了來自首爾國立大學醫院的160道問題,分為11個子類別。結果顯示,ChatGPT 3.5的正確率為37.5%,而ChatGPT 4提升至60.0%(p < 0.001)。大部分類別中,ChatGPT 4表現較佳,唯獨在腫瘤相關問題上不如3.5。此外,ChatGPT 4的回答不一致率顯著低於3.5(9.4%對比47.5%)。雖然ChatGPT 4在骨科考試中表現不錯,但仍需謹慎對待其不一致的回答和錯誤解釋。 PubMed DOI