原始文章

這項研究評估了ChatGPT提供的顳顎關節疾病(TMD)資訊的可靠性與實用性。研究人員使用李克特量表來評估ChatGPT對不同TMD分類的回應,並採用修改版DISCERN(mDISCERN)和全球質量量表(GQS)。結果顯示,咀嚼肌疾病的可靠性和實用性得分最高,而顳顎關節炎症性疾病則最低。整體而言,回應被認為高度可靠且中等實用,但在mDISCERN評分上評審之間有顯著差異。GQS顯示資訊質量為中等到高。研究結論指出,ChatGPT-4可作為患者和醫生獲取TMD資訊的輔助資源。 PubMed DOI


站上相關主題文章列表

2022年11月,OpenAI推出了ChatGPT,引發了對其在醫學領域有效性的討論。研究專注於ChatGPT對髕股疼痛的回答能力,並比較一般民眾、非骨科醫生及專家的評價。使用12個問題進行評估,結果顯示專家對ChatGPT的評分普遍較低,尤其在複雜問題上。雖然ChatGPT提供的資訊質量不錯,但隨著問題複雜度增加,其表現下降,顯示出人類專業知識在醫療中的重要性。 PubMed DOI

人工智慧,特別是ChatGPT,在醫學領域的應用引起了廣泛關注。最近一項研究探討了ChatGPT-4在肌肉骨骼疾病物理治療中的表現,針對脊椎、下肢和上肢問題提出了三十個臨床問題。結果顯示,ChatGPT的回應與臨床實踐指導方針的符合率達80%,上肢疾病的準確率更是高達100%。雖然脊椎疾病的準確率較低,但整體而言,ChatGPT在物理治療決策中展現了輔助工具的潛力,仍需進一步研究以提升其臨床應用。 PubMed DOI

這項研究評估了ChatGPT 3.5和4.0在提供創傷性牙齒損傷資訊上的表現,針對40個問題進行分析。主要發現包括:ChatGPT 3.5的原創回應較多,且可讀性稍好(FRES得分39.732),而4.0在定義和診斷的質量上表現較佳。雖然兩者在可讀性和可靠性上有挑戰,但仍提供高質量資訊,建議作為牙科教育的輔助資源。 PubMed DOI

這項研究探討了ChatGPT 4.0作為手部疾病初步診斷工具的有效性,涵蓋了觸發指、杜普伊特氏攣縮、腕管症候群等疾病。結果顯示,GPT-4.0對大多數疾病的診斷準確率超過95%,但拇指掌腕關節骨關節炎的準確率僅60%。在97%的案例中,GPT-4.0建議患者尋求醫療協助。研究也分析了其使用的術語,發現某些疾病之間有重疊。總體來看,GPT-4.0作為診斷輔助工具有潛力,但仍需進一步研究以提升準確性。 PubMed DOI

這項研究評估了六款人工智慧聊天機器人在牙科修復問題上的表現,包括ChatGPT-3.5、ChatGPT-4、ChatGPT-4o、Chatsonic、Copilot和Gemini Advanced。結果顯示,ChatGPT-4、ChatGPT-4o、Chatsonic和Copilot的可靠性為「良好」,而ChatGPT-3.5和Gemini Advanced則為「尚可」。在病人相關問題中,Chatsonic表現最佳;在牙科問題中,ChatGPT-4o最突出。整體來看,這些AI在準確性和可讀性上各有優劣,顯示出在牙科領域的潛力。 PubMed DOI

這項研究評估了ChatGPT對脊柱側彎問題的回答在可靠性、有用性、品質和可讀性方面的表現。選擇了十六個常見問題,由兩位專家評分。結果顯示,可靠性平均得分4.68,有用性得分4.84,整體品質得分4.28,評價普遍正面。雖然一般資訊的回答表現不錯,但針對治療和個人化問題的回答仍需加強。可讀性方面,回答需具備高中三年級到大學程度的閱讀能力。總體來說,ChatGPT提供的脊柱側彎資訊可靠,但在特定問題上仍需謹慎使用。 PubMed DOI

這項研究評估了ChatGPT在牙齒植體及周圍表型資訊的可靠性與品質。研究透過結構化問卷,讓牙科專業人士使用修訂版全球品質量表(GQS)和DISCERN工具來審查回應。共60名來自口腔外科、牙周病學及一般牙科的參與者參與。雖然各群體評分差異不大,但口腔外科醫生的評分較低。結果顯示,ChatGPT可作為患者獲取牙齒植體資訊的輔助工具,但回應深度不足,建議專業人士謹慎使用AI內容,並協助患者理解。未來研究應探討AI回應的變異性及不同平台的整合潛力。 PubMed DOI

這項研究評估了ChatGPT在回答有關觸發指的病人問題的有效性,目的是改善病人教育並探討人工智慧的角色。研究人員整理了十個常見問題,並根據《美國醫學會雜誌》(JAMA)和DISCERN工具的標準評估ChatGPT的回答。結果顯示,ChatGPT的回答質量中等,60%被認為滿意,但40%有缺陷,主要是缺乏科學參考資料。此外,回答的可讀性達到大學水平,對健康素養較低的病人來說理解上有挑戰。結論指出,雖然ChatGPT能提供一般資訊,但在作為病人主要教育資源前,需專家監督。這是首個專門檢視ChatGPT在觸發指情境中的研究。 PubMed DOI

這項研究發現,Google Gemini 在回答顳顎關節障礙問題時正確率最高,但 ChatGPT-4o 的答案最完整、最可靠。兩者都會提供參考資料和安全建議,但參考內容不一定有實證。Gemini 會用多媒體輔助說明。整體來說,ChatGPT-4o 和 Gemini 都能給出正確又好懂的資訊,但參考資料還有改進空間。 PubMed DOI

Bagde 等人(2023)系統性回顧發現,ChatGPT 在醫學和牙醫領域的研究、教育及臨床決策上有潛力,但目前仍有準確性、可靠性和倫理等問題待解決,需更多高品質研究來驗證其效益。 PubMed DOI