原始文章

隨著人工智慧和機器學習的進步,像ChatGPT這樣的工具對現代醫學和病人教育產生影響。本研究評估了ChatGPT對全膝關節置換術(TKA)和全髖關節置換術(THA)術前問題的回答有效性。結果顯示,ChatGPT引用的109個來源中,只有36%是準確的,且大多數來源的出版時間集中在2011至2015年。雖然其準確性評分為4.4/6,但引用不準確文獻的比例高達64.22%。因此,使用ChatGPT進行醫學查詢時需謹慎。 PubMed DOI


站上相關主題文章列表

這項研究指出,網路醫療資訊在骨科領域的使用越來越普遍,但也面臨品質挑戰。研究評估了25個網站,並針對10個網站使用髖部資訊評分系統(HISS)進行分析。最初的平均分數為9.5,顯示品質不佳。經過ChatGPT的建議後,分數提升至21.5,顯示出優秀的品質。結果顯示,ChatGPT能顯著改善線上病人資訊的品質,成為骨科醫生創建教育材料的有力工具,雖然無法取代專業知識,但能提升醫療資訊的可及性與品質。 PubMed DOI

2022年11月,OpenAI推出了ChatGPT,引發了對其在醫學領域有效性的討論。研究專注於ChatGPT對髕股疼痛的回答能力,並比較一般民眾、非骨科醫生及專家的評價。使用12個問題進行評估,結果顯示專家對ChatGPT的評分普遍較低,尤其在複雜問題上。雖然ChatGPT提供的資訊質量不錯,但隨著問題複雜度增加,其表現下降,顯示出人類專業知識在醫療中的重要性。 PubMed DOI

本研究評估 ChatGPT 在回答關於關節鏡半月板修復的常見問題的有效性,並與 Google 搜尋結果進行比較。結果顯示,關於恢復時間和技術細節的問題最為常見,ChatGPT 在這些問題的回答中顯示出較高的比例。ChatGPT 的回答主要來自學術網站,而 Google 則有混合來源。結論是,ChatGPT 提供的資訊更符合學術標準,若在醫療專業人員指導下使用,可能成為患者教育的有用工具。 PubMed DOI

生成式 AI 工具如 ChatGPT 在醫療查詢中越來越受歡迎,特別是在解答髕腱病相關問題上。一項研究評估了 ChatGPT-4 的表現,收集了 48 個問題並由專家評估其回應。結果顯示,只有 33% 的回應準確,但 75% 是全面的。治療相關問題的準確率僅 17%。回應的可讀性達到大學水平,且可理解性良好(83%),但可行性較低(60%)。總體而言,ChatGPT-4 提供了豐富資訊,但準確性不足,且對於低學歷者不易理解。 PubMed DOI

這項研究評估了ChatGPT-4在回答全踝關節置換術(TAA)相關問題的表現。研究人員提出十二個常見問題,並請四位專科外科醫生評分其回答的準確性和清晰度。平均得分為1.8(滿分4分),顯示在事實性問題上表現尚可,但對於術後方案等細緻問題評分較低。外科醫生的評分差異顯著,顯示出不同的解讀和期望。這強調了針對特定臨床情境設計AI工具的必要性,以提升病人教育和資訊的準確性。 PubMed DOI

這項研究比較ChatGPT和Google搜尋在回答髖關節鏡手術相關問題的表現。結果發現,兩者表現差不多,但ChatGPT提供的技術細節較多,也更常引用學術資料;Google則多引用醫療網站、醫師個人網站和政府網頁。整體來說,ChatGPT在學術參考上表現較佳。 PubMed DOI

這項研究發現,ChatGPT-4在單髁膝關節置換手術資訊的正確性和細節上勝過Google,但用詞較難懂,病人可能不易理解;Google雖然內容簡單易讀,但正確性和細節較不足。未來若能優化AI醫療資訊工具,將有助於提升病人教育與安全。 PubMed DOI

這項研究發現,ChatGPT在解釋膝關節置換手術及術後照護時,比DeepSeek更準確、讓人更滿意。不論病人還是骨科醫師,都比較推薦ChatGPT。顯示ChatGPT有機會成為病人衛教和減輕手術焦慮的好幫手。未來可再研究AI怎麼融入臨床,對治療結果有什麼影響。 PubMed DOI

這項研究測試了經過客製化訓練的ChatGPT,針對高脛骨截骨術(HTO)問題的回答能力,並以專家共識聲明為基礎。研究用10題測試AI,並由三位膝關節外科醫師評分。結果顯示,AI在正確性、相關性、清楚度和完整性方面表現都不錯,評審間一致性也高。雖然對非共識聲明的題目分數略低,但整體來說,這個AI有潛力成為外科醫師的輔助工具,也適合應用在其他醫療指引上。 PubMed DOI

這項研究發現,ChatGPT-4在回答關節置換相關問題時,正確率只有66.9%,明顯低於骨科研究員和主治醫師。特別是在有圖片的題目上,表現更差。雖然ChatGPT可當作學習輔助,但還無法取代專業醫師的臨床判斷,未來還需更多研究來提升AI在醫療領域的應用。 PubMed DOI