Performance of the ChatGPT-3.5, ChatGPT-4, and Google Gemini large language models in responding to dental implantology inquiries.
ChatGPT-3.5、ChatGPT-4 和 Google Gemini 大型語言模型在回應牙科植牙問題上的表現。 J Prosthet Dent 2025-01-05

這項研究評估了三款AI聊天機器人（ChatGPT-3.5、ChatGPT-4和Google Gemini）在提供牙科植牙資訊的可靠性與實用性。研究提出75個相關問題，並由兩位專家評估回答。結果顯示，Google Gemini在可靠性和實用性上表現最佳，特別是在建議諮詢牙科專家方面，對98.7%的問題都有建議。相比之下，ChatGPT-4和ChatGPT-3.5的建議比例較低。整體而言，雖然三者皆具可接受的表現，但Google Gemini因其與專家建議的一致性而更為突出。 PubMed DOI

Evaluating ChatGPT and Google Gemini Performance and Implications in Turkish Dental Education.
評估 ChatGPT 和 Google Gemini 在土耳其牙科教育中的表現及其影響。 Cureus 2025-01-13

這項研究分析了四個先進的人工智慧模型在回答土耳其牙科專業考試問題的表現，共240題。結果顯示，Gemini 2.0 Advanced在2020年以96.80%的準確率最佳，2021年則是ChatGPT-o1以97.88%領先。整體來看，ChatGPT-o1和Gemini 2.0的準確率分別為97.46%和97.90%，明顯優於其他模型。研究也指出，使用AI評估牙科能力的倫理問題，並建議對考試知識進行更嚴格的評估，強調AI在牙科教育中的潛在應用。 PubMed DOI

Evaluation of Chatbots in the Emergency Management of Avulsion Injuries.
急救管理中聊天機器人對撕脫傷的評估。 Dent Traumatol 2025-01-26

這項研究評估了六款人工智慧應用程式在回答脫落牙齒緊急處理問題的表現。測試的應用程式包括不同版本的ChatGPT、Perplexity、Gemini和Copilot。結果顯示，ChatGPT 4.0的準確率最高，達95.6%，而Perplexity最低，僅67.2%。除了ChatGPT 4.0外，其他聊天機器人都不夠可靠。研究建議將國際牙科外傷學會的指導方針納入聊天機器人的資料庫，以提升準確性和可靠性。 PubMed DOI

Evaluating the evidence-based potential of six large language models in paediatric dentistry: a comparative study on generative artificial intelligence.
評估六種大型語言模型在兒童牙科中的循證潛力：一項關於生成式人工智慧的比較研究。 Eur Arch Paediatr Dent 2025-02-22

這項研究評估了六個大型語言模型（LLMs）在兒童牙科的有效性，包括Google的Gemini、OpenAI的ChatGPT系列和微軟的Copilot。研究者提出十個臨床問題，並由兩位評估者根據0到10的標準進行評分。結果顯示，ChatGPT-4得分最高（8.08），其次是Gemini Advanced（8.06）和ChatGPT-4o（8.01）。雖然LLMs在支持兒童牙科方面有潛力，但專業人員應批判性地使用這些工具，並不應完全依賴。 PubMed DOI

Effectiveness of various general large language models in clinical consensus and case analysis in dental implantology: a comparative study.
各種大型通用語言模型在牙科植牙臨床共識和案例分析中的有效性：一項比較研究。 BMC Med Inform Decis Mak 2025-03-27

這項研究評估了四個大型語言模型（LLMs）在牙植體問題上的表現，包括 ChatGPT-4.0、Gemini Pro 1.5(0801)、Claude 3 Opus 和 Qwen 2.0 72B。目的是幫助資源不足地區的醫生選擇最有效的模型，以提升牙科護理的可及性。結果顯示，ChatGPT-4.0 在簡單和複雜問題上表現最佳，Gemini Pro 1.5(0801) 在簡單問題上表現良好，但複雜問題不穩定。Qwen 2.0 72B 在特定案例上表現不錯，但變異性大，而 Claude 3 Opus 表現最差。建議使用多個模型組合以增強醫療決策能力。 PubMed DOI

Can Artificial Intelligence Language Models Effectively Address Dental Trauma Questions?
人工智慧語言模型能有效解決牙科創傷問題嗎？ Dent Traumatol 2025-04-02

這項研究評估了五種大型語言模型（LLMs）在回答緊急牙科創傷問題的可靠性，依據國際牙科創傷學會的指導方針進行。研究結果顯示，ChatGPT 3.5的正確回答率最高（76.7%），其次是Copilot Pro（73.3%）和Copilot Free（70%）。雖然整體成功率差異不大，但Copilot和Gemini經常提供不準確的解釋，且缺乏可靠的參考資料。因此，雖然LLMs在牙科教育上有潛力，但在實踐中需謹慎使用。 PubMed DOI

Evaluating Large Language Models in Addressing Patient Questions on Endodontic Pain: A Comparative Analysis of accessible chatbots.
可及性聊天機器人在回應病患牙髓疼痛問題之表現評估：大型語言模型的比較分析 J Endod 2025-05-07

這項研究發現，ChatGPT 3.5回答牙髓病痛問題時，內容較完整可靠，但用詞偏難懂；Gemini則較易讀，但資訊不夠完整、可靠性較低。總結來說，AI雖能輔助衛教，仍需專業人員把關，確保資訊正確又好懂。 PubMed DOI

Artificial intelligence in pediatric dental trauma: do artificial intelligence chatbots address parental concerns effectively?
兒童牙科外傷中的人工智慧：人工智慧聊天機器人能有效回應家長的疑慮嗎？ BMC Oral Health 2025-05-17

這項研究發現，ChatGPT 3.5和Google Gemini在回答家長兒童牙齒外傷問題時，表現差不多。Gemini的答案較可靠，ChatGPT 3.5則較容易懂，實用性兩者相近。不過，AI只能提供初步資訊，還是要諮詢專業牙醫。 PubMed DOI

Assessment of various artificial intelligence applications in responding to technical questions in endodontic surgery.
各種人工智慧應用於回應牙髓手術技術問題之評估 BMC Oral Health 2025-05-22

這項研究發現，ScholarGPT 在牙髓根尖手術問題的答題正確率最高，達97.7%，優於 ChatGPT-4o（90.1%）和 Google Gemini（59.5%）。主要原因是 ScholarGPT 有用學術資料庫，答案更精確。結果顯示，專為學術領域訓練的 GPT 模型在牙科主題上較可靠，但仍需更多研究來開發專門的牙髓病學模型。 PubMed DOI

Evaluation of the Performance of Artificial Intelligence Based Chatbots in Providing First Aid Information on Dental Trauma According to the ToothSOS Application.
根據 ToothSOS 應用程式，評估人工智慧聊天機器人在提供牙科外傷急救資訊方面的表現 Dent Traumatol 2025-06-09

這項研究比較ChatGPT-4o和Gemini Advanced在判斷牙齒外傷照片時的表現。結果顯示，ChatGPT-4o在複雜牙冠骨折方面較優，Gemini Advanced則在嚴重外傷如牙齒脫落時較好。兩者都有潛力協助牙傷評估，但遇到複雜情況還需專家把關。若能結合官方指引，將更可靠，也能幫助民眾獲得正確健康資訊。 PubMed DOI

原始文章

站上相關主題文章列表