原始文章

這項研究發現,ChatGPT-4在單髁膝關節置換手術資訊的正確性和細節上勝過Google,但用詞較難懂,病人可能不易理解;Google雖然內容簡單易讀,但正確性和細節較不足。未來若能優化AI醫療資訊工具,將有助於提升病人教育與安全。 PubMed DOI


站上相關主題文章列表

這項研究比較了Google網頁搜尋和ChatGPT對於關於前十字韌帶重建手術的常見病人問題的回答。相較於Google搜尋結果,ChatGPT提供了更準確和完整的答案。這項研究凸顯了像ChatGPT這樣的人工智慧在向病人提供可靠資訊方面的潛力。 PubMed DOI

這項研究評估了ChatGPT-4在回答有關尺側韌帶(UCL)損傷的問題時的有效性,並與Google進行比較。研究發現,ChatGPT-4的學術來源比例高達90%,而Google僅50%。兩者在常見問題上有40%的重疊,但在數字回答中,只有20%的答案完全相同。ChatGPT-4的答案準確性顯著高於Google,顯示其在提供臨床相關資訊方面的潛力。不過,在完全應用於臨床前,仍需進一步驗證。 PubMed DOI

2022年11月,OpenAI推出了ChatGPT,引發了對其在醫學領域有效性的討論。研究專注於ChatGPT對髕股疼痛的回答能力,並比較一般民眾、非骨科醫生及專家的評價。使用12個問題進行評估,結果顯示專家對ChatGPT的評分普遍較低,尤其在複雜問題上。雖然ChatGPT提供的資訊質量不錯,但隨著問題複雜度增加,其表現下降,顯示出人類專業知識在醫療中的重要性。 PubMed DOI

本研究評估了ChatGPT-4與Google搜尋在全肩關節置換術(TSA)醫療資訊的準確性與範圍。結果顯示,兩者在數值回答上高度一致,準確性相似,但來源上有顯著差異。Google的資訊來源多樣,包含醫療實踐與社交媒體,而ChatGPT-4則完全依賴學術來源。對於開放式問題,兩者的答案重疊率較低。整體而言,ChatGPT-4提供可靠的學術資訊,而Google則提供更廣泛的來源,顯示出AI工具在醫療資訊提供上的潛力。 PubMed DOI

隨著人工智慧和機器學習的進步,像ChatGPT這樣的工具對現代醫學和病人教育產生影響。本研究評估了ChatGPT對全膝關節置換術(TKA)和全髖關節置換術(THA)術前問題的回答有效性。結果顯示,ChatGPT引用的109個來源中,只有36%是準確的,且大多數來源的出版時間集中在2011至2015年。雖然其準確性評分為4.4/6,但引用不準確文獻的比例高達64.22%。因此,使用ChatGPT進行醫學查詢時需謹慎。 PubMed DOI

本研究評估 ChatGPT 在回答關於關節鏡半月板修復的常見問題的有效性,並與 Google 搜尋結果進行比較。結果顯示,關於恢復時間和技術細節的問題最為常見,ChatGPT 在這些問題的回答中顯示出較高的比例。ChatGPT 的回答主要來自學術網站,而 Google 則有混合來源。結論是,ChatGPT 提供的資訊更符合學術標準,若在醫療專業人員指導下使用,可能成為患者教育的有用工具。 PubMed DOI

這項研究評估了手部手術相關的線上醫療資訊,並比較了Google、ChatGPT-3.5和ChatGPT-4.0的回應。研究針對腕隧道症候群、網球肘和富血小板血漿用於拇指關節炎三個問題進行分析。 主要發現包括: 1. **可讀性**:Google的回應較易讀,平均在八年級水平,而ChatGPT則在大學二年級水平。低共識主題的可讀性普遍較差。 2. **可靠性與準確性**:ChatGPT-4的可靠性與3.5相似,但低共識主題的可讀性較低,準確性差異不大。 3. **覆蓋範圍**:ChatGPT-4和Google在疾病原因和程序細節的覆蓋上有所不同,但在解剖學和病理生理學上相似。 總結來說,雖然ChatGPT能提供可靠的醫療資訊,但可讀性較差,醫療提供者需注意其局限性。 PubMed DOI

這項研究比較ChatGPT和Google搜尋在回答髖關節鏡手術相關問題的表現。結果發現,兩者表現差不多,但ChatGPT提供的技術細節較多,也更常引用學術資料;Google則多引用醫療網站、醫師個人網站和政府網頁。整體來說,ChatGPT在學術參考上表現較佳。 PubMed DOI

這項研究發現,ChatGPT在解釋膝關節置換手術及術後照護時,比DeepSeek更準確、讓人更滿意。不論病人還是骨科醫師,都比較推薦ChatGPT。顯示ChatGPT有機會成為病人衛教和減輕手術焦慮的好幫手。未來可再研究AI怎麼融入臨床,對治療結果有什麼影響。 PubMed DOI

這項研究測試了經過客製化訓練的ChatGPT,針對高脛骨截骨術(HTO)問題的回答能力,並以專家共識聲明為基礎。研究用10題測試AI,並由三位膝關節外科醫師評分。結果顯示,AI在正確性、相關性、清楚度和完整性方面表現都不錯,評審間一致性也高。雖然對非共識聲明的題目分數略低,但整體來說,這個AI有潛力成為外科醫師的輔助工具,也適合應用在其他醫療指引上。 PubMed DOI