原始文章

這項研究評估了兩個大型語言模型(LLMs),ChatGPT-3.5 和 ChatGPT-4,對牙齦和根管健康問題的回答效果。共提出33個問題,包含17個常識性和16個專家級問題,並以中英文呈現。三位專家對回答進行五分制評分。結果顯示,兩者在英文表現較佳,ChatGPT-4的平均得分為4.45,優於ChatGPT-3.5的4.03。常識性問題的評分普遍較高。研究強調了ChatGPT-4的優越性,並指出需進一步評估LLMs以解決其在不同語言環境中的局限性,避免口腔健康資訊誤解。 PubMed DOI


站上相關主題文章列表

討論了大型語言模型如ChatGPT在牙醫醫學中的影響。優點包括臨床決策支持和文本摘要,但也可能提供不正確資訊。牙科從業人員或許不受太大影響,但行政人員和牙科遠程醫療可能會有變化。在健康查詢中,確保準確性並防範偏見回應很重要。患者數據保密和網絡安全也是考量。在牙科教育中,LLMs可增進寫作流暢度,但在科學領域使用需明確限制。儘管在牙醫醫學有應用潛力,但需注意錯誤資訊和惡意使用風險。在牙科實務中使用LLMs的好處和限制需謹慎評估。 PubMed DOI

ChatGPT是OpenAI開發的GPT-4模型的一個對話變體,擁有數十億參數。這種大型語言模型展現了強大的自然語言處理能力,引起各界關注。研究指出大型語言模型在牙科領域的應用,包括自動牙科診斷和跨模態牙科診斷。儘管帶來許多好處,但也需面對數據隱私、質量和偏見等挑戰。總的來說,大型語言模型有望改變牙科診斷和治療,為牙科領域帶來新的研究和臨床應用途徑。 PubMed DOI

研究比較四個大型語言模型對牙科問題的回答,發現ChatGPT-4表現最好,但所有模型都有不準確和缺乏參考來源的問題。強調語言模型在牙科領域的潛力,但也提到目前的限制需要謹慎處理。建議牙醫要保持批判思考,並進一步研究如何安全地應用語言模型在牙科實務上,同時呼籲監管措施以監督技術使用。 PubMed DOI

研究比較Google Bard、ChatGPT-3.5和ChatGPT-4對口腔健康問題的建議效果,結果發現Google Bard易讀性高,但適當性稍差;ChatGPT-3.5和ChatGPT-4在適當性表現較好,尤其ChatGPT-4更穩定。這些模型被認為無害,對幫助性和意圖捕捉也相當。顯示大型語言模型在口腔健康護理有潛力,但仍需改進和考慮道德問題,未來研究應著重於安全整合策略。 PubMed DOI

大型語言模型如ChatGPT在醫療保健,包括牙科領域可能有用。研究發現ChatGPT在過敏問題上表現較佳。Priming可提升模型表現,但在不同問題上效果不同。訓練數據對模型表現至關重要。儘管技術進步,醫療保健等關鍵領域仍需謹慎對待。 PubMed DOI

這研究指出人工智慧(AI)在醫療保健領域的重要性,特別是大型語言模型(LLMs)在牙科護理中的應用。比較了嵌入式GPT模型和ChatGPT-3.5 turbo在應對患者問題和協助牙科決策的效果。結果顯示,嵌入式GPT模型在回答問題的準確性和清晰度方面優於ChatGPT,兩者在相關性和知識更新方面同樣有效。這研究顯示,嵌入GPT模型有助於提升牙科護理品質,AI在醫療領域前景看好。 PubMed DOI

這項研究分析了三個大型語言模型(LLMs)—ChatGPT(4和3.5版)及Google Gemini—在回答美國牙周病學會的考試問題時的準確性,並與人類研究生的表現進行比較。結果顯示,ChatGPT-4的準確率達79.57%,表現最佳;Google Gemini的準確率介於70.65%到75.73%之間,優於ChatGPT-3.5,但仍低於三年級住院醫師。ChatGPT-3.5的表現最差,準確率在59.27%到69.83%之間。研究指出LLMs在牙周病學教育上的潛力,但也需進一步研究以克服其限制。 PubMed DOI

這項研究評估了三種大型語言模型(LLMs)在幽門螺旋桿菌感染諮詢中的有效性,重點分析其在英語和中文的表現。研究期間為2023年11月20日至12月1日,針對15個H. pylori相關問題進行評估。結果顯示,準確性得分為4.80,顯示良好,但完整性和可理解性得分較低,分別為1.82和2.90。英語回應在完整性和準確性上普遍優於中文。結論指出,雖然LLMs在提供資訊上表現不錯,但在完整性和可靠性方面仍需改進,以提升其作為醫療諮詢工具的效能。 PubMed DOI

這項研究探討了ChatGPT 3.5在回答牙科問題的準確性和完整性。十位專家提出30個問題,並用李克特量表評估ChatGPT的回答。結果顯示,雖然ChatGPT的準確性(中位數5.50)和完整性(中位數2.00)表現不錯,但仍有改進空間。經過重新評估後,其表現顯著提升,顯示機器學習的潛力。不過,研究也指出仍有不準確之處,特別是參考資料,強調人類判斷在臨床決策中的重要性,以及基於證據的醫療實踐的必要性。 PubMed DOI

這項研究評估了大型語言模型(LLMs)在回答結膜炎相關問題的有效性,於復旦大學眼耳鼻喉醫院進行。研究分為兩階段,第一階段四個LLM(GPT-4、Qwen、Baichuan 2和PaLM 2)回答22個問題,專家評估其正確性、完整性等。結果顯示GPT-4表現最佳,Qwen在有用性和安全性上也不錯。第二階段中,30名結膜炎患者與GPT-4或Qwen互動,滿意度高。研究結論認為LLMs能提升患者教育,但需改善個性化和複雜性處理能力。 PubMed DOI