原始文章

這項研究評估了兩個人工智慧平台,ChatGPT-4 和 Claude 2,對前庭神經瘤管理資訊的品質。由19位側顱底外科醫生組成的評估小組使用醫療人工智慧品質評估問卷(QAMAI)來檢視36個問題的回答。結果顯示,ChatGPT-4在38.9%的問題上表現優於Claude 2,而Claude 2僅在5.6%的問題上得分較高。雖然ChatGPT-4在大多數方面表現較佳,但兩者在提供準確資訊上仍有困難,顯示患者使用這些工具時面臨錯誤資訊的風險。 PubMed DOI


站上相關主題文章列表

研究發現,ChatGPT提供的神經外科資訊品質尚可,但比起官方網站,回答較為簡短且不易閱讀,且缺乏參考資料和治療描述不完整。ChatGPT提供的參考資料可能不準確且虛假,使用時應謹慎。未來隨著人工智慧技術進步,或許能成為更可靠的醫學資訊來源。 PubMed DOI

研究比較了不同AI聊天機器人在正顎手術中的表現,結果顯示回答品質高、可靠性佳,但易讀性需高學歷。ChatGPT-4有創意,OpenEvidence則回答相似。儘管聊天機器人提供高品質答案,仍建議諮詢專業醫師。 PubMed DOI

研究評估了在神經外科中使用ChatGPT的效果,分析AI生成的回答對手術後問題的幫助程度。1080個回答來自ChatGPT-3.0、3.5和4.0,由醫師評估後發現回答準確,但幫助程度較低。ChatGPT-4.0的可讀性較前版本提升。 PubMed DOI

研究評估了AI聊天機器人ChatGPT-4在提供耳硬化手術資訊的表現,結果顯示回答品質不一。專家使用DISCERN系統評估後發現,回答有時超出一般讀者理解範圍,且可能不完整或誤導。建議改善AI系統以提供準確易懂的資訊,並建議醫護人員監督其應用於病患教育和護理。 PubMed DOI

這項研究評估了三款AI聊天機器人—ChatGPT、Gemini和Claude—對鼻整形手術常見問題的回答。七位經驗豐富的整形外科醫生根據準確性、質量、完整性等指標進行評分。結果顯示,ChatGPT在準確性和整體質量上表現較佳,但完整性不如Gemini和Claude。三者的回應普遍被評為中立且不完整,醫學術語使用普遍,且可讀性達大學程度。研究強調聊天機器人生成的醫療資訊需謹慎檢查,但仍具提升醫療教育的潛力。 PubMed DOI

這項研究評估了兩個AI聊天機器人,ChatGPT-3.5和Google Bard,提供的青光眼手術資訊的質量與可讀性。研究發現,ChatGPT-3.5的適當回答率高達96%,而Google Bard則為68%。不過,在可讀性方面,Google Bard的回答更易於理解,Flesch可讀性評分顯示其得分為57.6,遠高於ChatGPT-3.5的22.6。這顯示出準確性與可讀性之間的權衡,強調了清晰且準確的醫療資訊對患者的重要性,並呼籲進一步研究AI工具在醫療領域的有效性。 PubMed DOI

這項研究評估了AI聊天機器人ChatGPT在提供法語術前病患面對面醫療資訊的效果,並與法國耳鼻喉科學會的內容進行比較。二十位耳鼻喉科醫生和二十四位非醫療人員針對16個耳鼻喉科手術問題的回答進行評估。結果顯示,醫生對ChatGPT和SFORL的評價差異不大,但非醫療人員對ChatGPT的清晰度評價較高,且更偏好ChatGPT作為資訊來源。總體而言,ChatGPT的表現與SFORL相當,顯示其在提供高品質醫療資訊上的潛力,建議可作為傳統資源的補充。 PubMed DOI

本研究評估六款生成式AI聊天機器人在鎖骨骨折管理教育中的效果,包括ChatGPT 4、Gemini 1.0等。雖然可讀性分數無顯著差異,但Microsoft Copilot和Perplexity的回答質量明顯優於其他模型。整體來看,這些AI模型在病患教育中表現良好,特別是Microsoft Copilot和Perplexity,適合用於提供鎖骨骨折相關資訊。 PubMed DOI

這項研究評估了基於人工智慧的聊天機器人,特別是ChatGPT 3.5和Claude-instant,在複雜口腔外科案例中輔助臨床決策的效果。口腔及顏面外科醫生設計了一系列問題,並透過專業評估工具來檢視聊天機器人的回應質量。結果顯示,ChatGPT和Claude-instant都提供高質量的回應,ChatGPT的質量評分分別為86%和79.6%,而Claude-instant則為81.25%和89%。這些結果顯示聊天機器人技術的進步,可能提升醫療效率並降低成本。 PubMed DOI

這項研究評估了兩個人工智慧平台,ChatGPT-4 和 Claude 3.5 Sonet,在管理接受後頸椎融合手術患者的術後護理的有效性。結果顯示,Claude 3.5 Sonet在準確性、回應時間、清晰度和相關性上均顯著優於ChatGPT-4。李克特量表的評分也顯示Claude在滿意度和質量上有明顯優勢。整體而言,Claude 3.5 Sonet被證明是一個有效的術後問題解決工具,對提升患者護理和滿意度有很大潛力。 PubMed DOI