原始文章

這項研究比較了Google和ChatGPT(3.5版)對肩袖手術的常見問題及回答。使用「rotator cuff repair」作為搜尋詞,發現兩者只有30%的問題相似。Google的答案多來自醫療實踐(40%),而ChatGPT則主要依賴學術來源(90%)。在數字問題上,兩者的相似答案也僅有30%。大部分回答被評為「優秀」或「滿意」,但Google有一個回答需中等澄清,ChatGPT則有兩個不滿意的回答。整體而言,兩者的回答質量良好,但ChatGPT顯示出潛在的不準確性,強調了評估AI醫療信息質量的重要性。 PubMed DOI


站上相關主題文章列表

人工智慧和大型語言模型在手術前的患者教育中扮演重要角色。研究比較了ChatGPT和Google搜尋在全肩關節置換術(TSA)和全肘關節置換術(TEA)常見問題回答的表現,兩者提供相似資訊。ChatGPT參考學術來源,Google則著重醫學實踐。人工智慧語言模型可補充患者和醫師討論,提升健康知識。了解人工智慧對醫學患者教育的影響至關重要,因為這些工具越來越普及。 PubMed DOI

研究評估了ChatGPT回答ACL手術問題的表現,結果顯示大部分回答需要更清楚的說明,平均水準為41分,閱讀難度相當於大學二年級。回答多為過時且缺乏病人資訊,ChatGPT無法有效處理資訊,外科醫生需了解AI限制,更好地支持ACL手術病人。 PubMed DOI

這項研究評估了ChatGPT-3.5對於關於旋轉袖修復手術常見問題的回答。研究發現這些回答缺乏可靠的引用來源,閱讀難度高,並且在質量上被認為是尚可的。該研究暗示ChatGPT-3.5可能無法有效地提供與外科醫師建議相符的手術前患者資訊。 PubMed DOI

這項研究比較了Google網頁搜尋和ChatGPT對於關於前十字韌帶重建手術的常見病人問題的回答。相較於Google搜尋結果,ChatGPT提供了更準確和完整的答案。這項研究凸顯了像ChatGPT這樣的人工智慧在向病人提供可靠資訊方面的潛力。 PubMed DOI

這項研究評估了ChatGPT-4在回答有關尺側韌帶(UCL)損傷的問題時的有效性,並與Google進行比較。研究發現,ChatGPT-4的學術來源比例高達90%,而Google僅50%。兩者在常見問題上有40%的重疊,但在數字回答中,只有20%的答案完全相同。ChatGPT-4的答案準確性顯著高於Google,顯示其在提供臨床相關資訊方面的潛力。不過,在完全應用於臨床前,仍需進一步驗證。 PubMed DOI

這項研究評估了ChatGPT在肩袖修復手術患者資源中的有效性,並比較了3.5和4.0版本的資訊內容與可讀性。三位外科醫生在2023年8月提出了13個常見問題,分析結果顯示兩個版本的資訊質量高,但可讀性較差,且缺乏引用影響可靠性。雖然4.0版本的可讀性優於3.5,但整體仍需改進。總之,ChatGPT提供的資訊有價值,但在可讀性和引用方面仍有待加強。 PubMed DOI

這項研究評估了ChatGPT對反向肩關節置換術(RSA)常見問題的回答準確性。研究從病人教育網站收集了十個問題,並由兩位骨科醫生分析回答的清晰度和準確性。結果顯示,平均DISCERN評分為44,七個回答質量中等,三個則較差。所有回答在JAMA標準上得分為0,平均可讀性為14.35,顯示需具備大學程度的閱讀能力。雖然ChatGPT的回答中等,但缺乏可靠引用和可讀性限制了其在病人教育中的有效性,強調了創建可靠資源的重要性及醫生的角色。 PubMed DOI

這項研究評估了ChatGPT在回答有關全肩關節置換術的病人常見問題的效果。研究者提出十個問題,並用評分系統來檢視回答的準確性和清晰度。結果顯示,平均回答質量尚可,但仍需進一步澄清,Mika分數為2.93,DISCERN分數為46.60,屬於「尚可」等級。可讀性分析顯示,回答水平達到大學畢業生程度,超過病人教育材料的理想標準。結論指出,ChatGPT可作為病人教育的輔助工具,但不應取代醫療專業人員的諮詢。 PubMed DOI

這項研究評估了ChatGPT對全肩關節置換術(TSA)常見病人問題的回答質量。研究人員整理了15個問題,並直接詢問ChatGPT,三位認證的骨科醫生用A-F評分系統對其回答進行評分。結果顯示,ChatGPT的整體評分為B-,在術前和術後問題上也相似。雖然它提供了合理建議,並承認自身限制,但常常忽略最新研究,且回答有時超出問題範疇。研究指出,人工智慧可作為病人初步詢問的工具,但無法取代骨科醫生的專業知識。 PubMed DOI

這項研究評估了ChatGPT對於常見肩部病理問題的回答準確性和完整性,包括二頭肌腱炎、旋轉袖撕裂等。三位經驗豐富的骨科醫生使用李克特量表進行評估,結果顯示ChatGPT的答案通常準確且完整,準確性分數介於5.1到5.8之間,完整性分數則在2.3到2.9之間。雖然ChatGPT可作為病患的有用資源,但仍建議病患應與醫療提供者確認線上資訊。 PubMed DOI