原始文章

隨著人工智慧和機器學習的進步,像ChatGPT這樣的工具對現代醫學和病人教育產生影響。本研究評估了ChatGPT對全膝關節置換術(TKA)和全髖關節置換術(THA)術前問題的回答有效性。結果顯示,ChatGPT引用的109個來源中,只有36%是準確的,且大多數來源的出版時間集中在2011至2015年。雖然其準確性評分為4.4/6,但引用不準確文獻的比例高達64.22%。因此,使用ChatGPT進行醫學查詢時需謹慎。 PubMed DOI


站上相關主題文章列表

使用人工智慧如ChatGPT可協助外科醫師回答病人問題,但需注意其資訊來源。研究顯示ChatGPT在骨科問答方面表現優秀,但有時引用不確定來源。驗證資訊來源並交叉檢查是重要的。ChatGPT可提供可靠骨科資訊,但仍有改進空間,未來可增進病人溝通。 PubMed DOI

研究評估了ChatGPT在全膝關節置換手術問答中的表現,外科醫生認為ChatGPT提供的回答準確可靠,可幫助多樣化患者。雖然外科醫生在區分ChatGPT回答時有困難,但支持其應用。 PubMed DOI

研究評估AI語言模型ChatGPT回答全髖關節和膝關節置換手術問題的能力。結果顯示ChatGPT提供正確且詳盡資訊,但僅當作單一資料來源有限。重複問題時,ChatGPT品質穩定,且降低閱讀難度,更易理解。儘管有潛力回答病人問題,仍需進一步改進。 PubMed DOI

這項研究評估了根據骨科指引對ChatGPT對全膝關節置換手術問題的回答品質。外科醫生根據相關性、準確性、清晰度、完整性、以證據為基礎的內容和一致性評分回答。結果顯示相關性和可靠性的變異性上均獲得了高於平均水平的分數。ChatGPT能夠提供根據確立指引的準確答案,但可靠性不一致。 PubMed DOI

研究評估ChatGPT回答髖關節鏡手術問題的表現,兩位外科醫師評分結果顯示50%為A級、30%為B級,10%分別為C和D級,評分者一致性為30%。ChatGPT回答適合大學畢業生閱讀,提供滿意答案,但偶爾不準確,建議謹慎使用。在髖關節鏡手術病人教育上有潛力,但需監督。 PubMed DOI

這項研究評估了人工智慧聊天機器人ChatGPT在回答有關髖關節和膝關節置換手術後的周圍假體關節感染(PJI)常見問題的有效性。研究從十五個國際專家中心收集了十二個問題,並分析了ChatGPT的回答準確性。結果顯示,沒有回答被評為不滿意,且大多數回答需小幅或中度改進。整體而言,ChatGPT提供了無偏見且易於理解的資訊,顯示其在患者教育上的潛力,並建議進一步研究其在PJI患者中的應用與接受度。 PubMed DOI

這項研究評估了ChatGPT 4.0對25個有關髖關節鏡手術的病人問題的回答準確性,並由兩位專業的骨科運動醫學外科醫生進行評分。結果顯示,20個回答被評為「優秀」,2個則是「滿意但需少量澄清」,沒有回答被評為「中等」或「需大量澄清」。整體來看,ChatGPT 4.0在病人教育方面顯示出潛力,尤其在骨科醫生的指導下。這項研究也考量到病人對聊天機器人使用的增加。 PubMed DOI

2022年11月,OpenAI推出了ChatGPT,引發了對其在醫學領域有效性的討論。研究專注於ChatGPT對髕股疼痛的回答能力,並比較一般民眾、非骨科醫生及專家的評價。使用12個問題進行評估,結果顯示專家對ChatGPT的評分普遍較低,尤其在複雜問題上。雖然ChatGPT提供的資訊質量不錯,但隨著問題複雜度增加,其表現下降,顯示出人類專業知識在醫療中的重要性。 PubMed DOI

這項研究評估了ChatGPT在回答股骨髖臼撞擊症(FAI)及關節鏡髖關節手術相關問題的準確性,並比較了免費版(ChatGPT-3.5)和付費版(ChatGPT-4)。研究中提出十二個常見問題,由三位髖關節鏡外科醫生進行評分。結果顯示,ChatGPT-3.5的中位數準確性為2,ChatGPT-4為1.5,且兩者之間的表現差異不顯著。整體而言,兩個版本的回答大多準確,但因準確性變異及研究效能低,建議在實施時需謹慎,並進一步評估。 PubMed DOI

這項研究評估了ChatGPT-4o對髖關節鏡手術常見問題的回答。研究者創建了一個新的Google帳戶,並於2024年6月1日提出20個熱門問題給ChatGPT-4o。十位骨科醫生根據相關性、準確性、清晰度和完整性對回答進行評分,結果顯示最低分為4/5,準確性和清晰度的平均分數最高,整體平均分為4.49±0.16。不過,評分者之間的共識較低,顯示在準確性上存在分歧。研究建議,儘管ChatGPT-4o的回答品質高,仍應諮詢骨科專家以做出最終決策。 PubMed DOI