原始文章

這項研究測試了經過客製化訓練的ChatGPT,針對高脛骨截骨術(HTO)問題的回答能力,並以專家共識聲明為基礎。研究用10題測試AI,並由三位膝關節外科醫師評分。結果顯示,AI在正確性、相關性、清楚度和完整性方面表現都不錯,評審間一致性也高。雖然對非共識聲明的題目分數略低,但整體來說,這個AI有潛力成為外科醫師的輔助工具,也適合應用在其他醫療指引上。 PubMed DOI


站上相關主題文章列表

2022年11月,OpenAI推出了ChatGPT,引發了對其在醫學領域有效性的討論。研究專注於ChatGPT對髕股疼痛的回答能力,並比較一般民眾、非骨科醫生及專家的評價。使用12個問題進行評估,結果顯示專家對ChatGPT的評分普遍較低,尤其在複雜問題上。雖然ChatGPT提供的資訊質量不錯,但隨著問題複雜度增加,其表現下降,顯示出人類專業知識在醫療中的重要性。 PubMed DOI

隨著人工智慧和機器學習的進步,像ChatGPT這樣的工具對現代醫學和病人教育產生影響。本研究評估了ChatGPT對全膝關節置換術(TKA)和全髖關節置換術(THA)術前問題的回答有效性。結果顯示,ChatGPT引用的109個來源中,只有36%是準確的,且大多數來源的出版時間集中在2011至2015年。雖然其準確性評分為4.4/6,但引用不準確文獻的比例高達64.22%。因此,使用ChatGPT進行醫學查詢時需謹慎。 PubMed DOI

膝關節骨關節炎(OA)對患者生活品質影響深遠,常需手術。雖然全膝關節置換術(TKA)常見,但年輕的單側膝關節OA患者可能更適合高胫骨截骨術(HTO)。有效的患者教育至關重要,但許多線上健康資訊對一般人來說過於複雜。研究探討定制版ChatGPT是否能提升膝關節OA和HTO的教育可讀性與準確性。結果顯示,微調後的ChatGPT在可讀性和資訊質量上均有顯著改善,顯示定制AI工具能讓醫療資訊更易理解。 PubMed DOI

這項研究評估了ChatGPT-4在回答全踝關節置換術(TAA)相關問題的表現。研究人員提出十二個常見問題,並請四位專科外科醫生評分其回答的準確性和清晰度。平均得分為1.8(滿分4分),顯示在事實性問題上表現尚可,但對於術後方案等細緻問題評分較低。外科醫生的評分差異顯著,顯示出不同的解讀和期望。這強調了針對特定臨床情境設計AI工具的必要性,以提升病人教育和資訊的準確性。 PubMed DOI

這項研究評估了ChatGPT-4.0在提供全膝關節置換術病人諮詢的有效性,並與專業外科醫生進行比較。研究選擇了10個常見問題,並收集了ChatGPT和五位外科醫生的回答,透過五點李克特量表評估同理心、準確性、完整性和整體品質。結果顯示,ChatGPT在所有類別中得分顯著高於部分外科醫生,特別在同理心和準確性方面表現優異,顯示其作為病人輔助資源的潛力。 PubMed DOI

這項研究比較 ChatGPT-4o 和 DeepSeek R1 回答 ACL 手術常見問題的表現。結果顯示,兩者答案都很正確且一致。ChatGPT 的內容較完整,DeepSeek 則更清楚、好讀,對一般人來說較容易理解。整體來說,兩款 AI 都能提供高品質資訊,若能結合兩者優點,將更有助於病人衛教。 PubMed DOI

一項研究發現,ChatGPT對10個常見半月板手術問題的回答,大多正確又清楚。4個答案非常優秀,4個只需小幅補充,2個需中度補充,沒有不合格的情況。整體來說,ChatGPT能提供令人滿意且可靠的半月板手術相關資訊。 PubMed DOI

這項研究發現,ChatGPT-4在單髁膝關節置換手術資訊的正確性和細節上勝過Google,但用詞較難懂,病人可能不易理解;Google雖然內容簡單易讀,但正確性和細節較不足。未來若能優化AI醫療資訊工具,將有助於提升病人教育與安全。 PubMed DOI

這項研究發現,ChatGPT在解釋膝關節置換手術及術後照護時,比DeepSeek更準確、讓人更滿意。不論病人還是骨科醫師,都比較推薦ChatGPT。顯示ChatGPT有機會成為病人衛教和減輕手術焦慮的好幫手。未來可再研究AI怎麼融入臨床,對治療結果有什麼影響。 PubMed DOI

這項研究發現,ChatGPT-4在回答關節置換相關問題時,正確率只有66.9%,明顯低於骨科研究員和主治醫師。特別是在有圖片的題目上,表現更差。雖然ChatGPT可當作學習輔助,但還無法取代專業醫師的臨床判斷,未來還需更多研究來提升AI在醫療領域的應用。 PubMed DOI