Assessing the Quality, Usefulness, and Reliability of Large Language Models (ChatGPT, DeepSeek, and Gemini) in Answering General Questions Regarding Dyslexia and Dyscalculia.
大型語言模型(ChatGPT、DeepSeek 與 Gemini)在回答有關 Dyslexia 與 Dyscalculia 一般問題時的品質、實用性與可靠性評估
Psychiatr Q 2025-06-12
Assessing the Responses of Large Language Models (ChatGPT-4, Claude 3, Gemini, and Microsoft Copilot) to Frequently Asked Questions in Retinopathy of Prematurity: A Study on Readability and Appropriateness.
評估大型語言模型(ChatGPT-4、Claude 3、Gemini 和 Microsoft Copilot)對早產兒視網膜病常見問題的回應:可讀性和適當性的研究。
J Pediatr Ophthalmol Strabismus 2024-10-28
Preliminary assessment of large language models' performance in answering questions on developmental dysplasia of the hip.
大型語言模型在回答發育性髖關節發育不良(developmental dysplasia of the hip)相關問題之表現的初步評估
J Child Orthop 2025-04-18
這項研究比較了ChatGPT-4o、Gemini 和 Claude 3.5 Sonnet 三款大型語言模型,用中文和英文回答小兒髖關節發育不良臨床問題的準確性。結果發現,三款模型在中英文的回答都很準確,彼此之間沒有明顯差異,顯示這些AI能可靠提供相關醫療資訊。
PubMedDOI
Large Language Models: Pioneering New Educational Frontiers in Childhood Myopia.
大型語言模型:開創兒童近視教育新前沿
Ophthalmol Ther 2025-04-21
這項研究比較 ChatGPT-3.5、ChatGPT-4o 和 Google Gemini 在製作兒童近視衛教資料的表現。結果發現,三款 AI 都能產出正確、易懂的內容,但只有 ChatGPT-3.5 和 4o 能穩定達到國小六年級的閱讀程度。ChatGPT-4o 在內容品質和易讀性上表現最好,但三者都缺乏高度可執行的建議。整體來說,ChatGPT-4o 最有潛力用來優化兒童近視衛教資料。
PubMedDOI
Evaluating Accuracy and Readability of Responses to Midlife Health Questions: A Comparative Analysis of Six Large Language Model Chatbots.
六種大型語言模型聊天機器人對中年健康問題回答之準確性與可讀性評估:比較分析
J Midlife Health 2025-05-07
研究比較六款聊天機器人回答中年健康問題的表現,發現 Meta AI 答案最準確、最有條理,Perplexity 最容易閱讀。整體來說,這些聊天機器人對中年健康教育有幫助,但表現有差異,選擇合適的工具很重要。
PubMedDOI
The actual performance of large language models in providing liver cirrhosis-related information: A comparative study.
大型語言模型在提供肝硬化相關資訊時的實際表現:一項比較研究
Int J Med Inform 2025-05-07
Evaluating Large Language Models in Addressing Patient Questions on Endodontic Pain: A Comparative Analysis of accessible chatbots.
可及性聊天機器人在回應病患牙髓疼痛問題之表現評估:大型語言模型的比較分析
J Endod 2025-05-07
Parental education in pediatric dysphagia: A comparative analysis of three large language models.
兒童吞嚥困難的家長教育:三種大型語言模型的比較分析
J Pediatr Gastroenterol Nutr 2025-05-09
這項研究發現,ChatGPT-4 回答小兒吞嚥困難問題最準確可靠,Gemini 的答案則最容易閱讀。不過,三款 AI 在資訊品質上都有不一致的地方,顯示大型語言模型雖然有幫助,但還需要再加強,才能穩定提供正確又好懂的資訊。
PubMedDOI
Competencies of Large Language Models About Piriformis Syndrome: Quality, Accuracy, Completeness, and Readability Study.
大型語言模型對於梨狀肌症候群的能力:品質、準確性、完整性與可讀性之研究
HSS J 2025-05-23