A comparison of quality and readability of Artificial Intelligence chatbots in triage for head and neck cancer.
人工智慧聊天機器人在頭頸癌分診中的品質與可讀性比較
Am J Otolaryngol 2025-08-06
Classifying Patient Complaints Using Artificial Intelligence-Powered Large Language Models: Cross-Sectional Study.
利用人工智慧大型語言模型分類病人主訴:橫斷面研究
J Med Internet Res 2025-08-06
這項研究評估 AI 語言模型在新加坡基層診所分類病人申訴的表現,發現 GPT-4o mini 和 Claude 3.5 Sonnet 準確度比 GPT-3.5 turbo 好。常見申訴有等太久、員工態度差和預約問題。結果顯示 LLMs 能提升申訴分析效率,但還需要再優化才能更精準。
相關文章PubMedDOI推理
Can AI grade like a professor? comparing artificial intelligence and faculty scoring of medical student short-answer clinical reasoning exams.
AI能像教授一樣評分嗎?比較人工智慧與教師對醫學生簡答臨床推理考試的評分結果
Adv Health Sci Educ Theory Pract 2025-08-06
這項研究發現,GPT-4o 在醫學院簡答題批改上,和老師的分數差異大多在±5%以內,準確度很高。AI 對記憶、應用、分析題目特別精準,但理解和評估題型就比較弱。遇到難題時,AI 和老師的評分落差也會變大。建議 AI 批改還是要搭配老師一起使用,尤其是複雜題目。
相關文章PubMedDOI推理
Toward standardization of GenAI-driven agentic architectures for radio access networks.
邁向 GenAI 驅動之行動式架構於無線接取網路的標準化
Front Artif Intell 2025-08-06
Implementation of generative AI for the assessment and treatment of autism spectrum disorders: a scoping review.
生成式 AI 在自閉症光譜障礙評估與治療中的應用:一項範疇性回顧
Front Psychiatry 2025-08-06
Advancing plant metabolic research by using large language models to expand databases and extract labeled data.
利用大型語言模型擴充資料庫與擷取標註資料,推進植物代謝研究
Appl Plant Sci 2025-08-06
The assessment of ChatGPT-4's performance compared to expert's consensus on chronic lateral ankle instability.
ChatGPT-4 在慢性外側踝關節不穩定性評估上與專家共識的表現比較
J Exp Orthop 2025-08-06