原始文章

這項研究評估了ChatGPT在牙髓治療局部麻醉方面的資訊可靠性。研究者提出16個問題,發現ChatGPT的回答準確率僅有50%。在其引用的51個參考文獻中,59%是錯誤的,12%無法取得,18%則是虛構的。結論指出,雖然ChatGPT有潛力,但仍需進一步訓練以提升準確性,強調持續改進的重要性,以更好地服務醫療人員和病患。 PubMed DOI


站上相關主題文章列表

這項研究評估了ChatGPT在提供兒童牙科資訊的有效性,重點在病患和家長的教育。研究中提出60個問題,涵蓋牙齒創傷、氟化物及口腔健康。結果顯示,對於病患/家長的回應平均質量為4.3,而學術問題則為3.7,顯示質量有明顯差異。牙齒創傷的學術問題得分最低。雖然ChatGPT能提供質量資訊,但對於可讀性仍有挑戰,建議進一步改進以增強與使用者的互動。 PubMed DOI

這項研究評估了ChatGPT對常見鼻科問題的回答準確性,並與專業外科醫師的回答進行比較。ChatGPT的平均得分為1.65分(滿分3分),顯示部分回答可接受,但多數不正確或不完整。10個問題中,只有2個回答與專家一致,8個則被認為不足。評分者之間的可靠性中等,且能以97.5%的準確率區分ChatGPT和人類回答。這些結果顯示ChatGPT在醫學領域提供準確資訊的能力有限。 PubMed DOI

這項研究評估了四款人工智慧聊天機器人—ChatGPT-4o、MedGebra GPT4o、Meta Llama 3 和 Gemini Advanced,在回答牙髓學的多選題表現。從牙髓學教科書中選取100道題目,進行了兩輪測試。 結果顯示,ChatGPT-4o在兩輪測試中表現最穩定,MedGebra GPT4o在第一輪達到93%的最高準確率,而ChatGPT-4o在第二輪表現最佳(90%)。Meta Llama 3的表現較弱,正確率分別為73%和75%。總體來看,ChatGPT-4o和MedGebra GPT4o在此領域表現優異,但Meta Llama 3和Gemini Advanced仍需改進。 PubMed DOI

隨著人工智慧和機器學習的進步,像ChatGPT這樣的工具對現代醫學和病人教育產生影響。本研究評估了ChatGPT對全膝關節置換術(TKA)和全髖關節置換術(THA)術前問題的回答有效性。結果顯示,ChatGPT引用的109個來源中,只有36%是準確的,且大多數來源的出版時間集中在2011至2015年。雖然其準確性評分為4.4/6,但引用不準確文獻的比例高達64.22%。因此,使用ChatGPT進行醫學查詢時需謹慎。 PubMed DOI

這項研究評估了ChatGPT-3.5在回答口腔癌相關問題的準確性,因為早期診斷對患者結果影響重大。研究中提出20個問題,並由醫療專家評估其回答。結果顯示,51.25%的答案被評為非常好,46.25%為好,僅2.5%可接受。專家評分間無顯著差異。雖然ChatGPT提供的資訊可靠,但引用的81篇文獻中,只有13篇是合法的科學文章,10篇為假文獻,其餘則來自各種網站。總體而言,ChatGPT的資訊值得參考,但需謹慎對待其引用來源。 PubMed DOI

這項研究評估了ChatGPT 3.5和4.0在提供創傷性牙齒損傷資訊上的表現,針對40個問題進行分析。主要發現包括:ChatGPT 3.5的原創回應較多,且可讀性稍好(FRES得分39.732),而4.0在定義和診斷的質量上表現較佳。雖然兩者在可讀性和可靠性上有挑戰,但仍提供高質量資訊,建議作為牙科教育的輔助資源。 PubMed DOI

這項研究評估了兩個版本的ChatGPT—ChatGPT-4和ChatGPT-4o—在本科牙髓學教育的多選題回答準確性。共提出60個問題,結果顯示ChatGPT-4o的準確率為92.8%,明顯高於ChatGPT-4的81.7%,且p值小於0.001。雖然問題組影響準確率,但一天中的時間對兩者無影響。兩個模型的一致性無顯著差異。總體來看,ChatGPT-4o在準確性上優於ChatGPT-4,顯示AI在牙科教育中的潛在價值,但也需注意其局限性與風險。 PubMed DOI

這項研究探討了ChatGPT在提供跟腱斷裂管理資訊的準確性。研究中提出八個臨床問題,ChatGPT給出了16個回應,經骨科專家評估後發現,所有回應都有正確與不正確的資訊,最終評定為III級(部分正確)。在比較回應時,有75%的問題顯示一致性。雖然ChatGPT提供了47個參考文獻,但只有34%是正確的,40%不正確,26%則是虛構的。結論是,ChatGPT在提供跟腱斷裂相關的病人資訊或臨床決策上並不可靠。 PubMed DOI

這項研究探討了ChatGPT在植牙支撐假牙治療計畫文獻的可靠性,提出六個具體問題並進行修訂。結果顯示: 1. **冠與植體比率**:初步認為高比率會導致骨喪失,修訂後認為現代植體可減輕此問題。 2. **後牙懸臂**:最初指出懸臂可能引發併發症,修訂後認為可行的長期選擇。 3. **後上顎固定植體**:原本支持固定以提高存活率,修訂後認為並非所有情況都需固定。 4. **患者偏好**:最初認為覆蓋假牙滿意度高,修訂後指出傳統假牙也可滿意。 5. **彈性與剛性系統**:初步建議彈性系統需更換頻繁,修訂後認為剛性系統不一定併發症多。 6. **固定與可拆卸假牙**:初步偏向固定,修訂後強調患者偏好因人而異。 總結來說,ChatGPT在評估文獻時存在困難,可能導致不準確的治療建議。 PubMed DOI

Bagde 等人(2023)系統性回顧發現,ChatGPT 在醫學和牙醫領域的研究、教育及臨床決策上有潛力,但目前仍有準確性、可靠性和倫理等問題待解決,需更多高品質研究來驗證其效益。 PubMed DOI