Disability Ethics and Education in the Age of Artificial Intelligence: Identifying Ability Bias in ChatGPT and Gemini.
人工智慧時代的殘疾倫理與教育:識別 ChatGPT 和 Gemini 中的能力偏見。
Arch Phys Med Rehabil 2024-08-31
PRO-READ IR:Enhanced PROcedural Information READability for Patient-Centered Care in Interventional Radiology with Large Language Models.
PRO-READ IR:利用大型語言模型增強介入放射學中以病人為中心的程序資訊可讀性。
J Am Coll Radiol 2024-08-31
Large Language Models Like ChatGPT Show Promise, but Clinical Use of Artificial Intelligence Requires Physician Partnership to Enable Patient Care, Minimize Administrative Burden, Maximize Efficiency, and Minimize Risk.
大型語言模型如 ChatGPT 顯示出潛力,但人工智慧在臨床上的應用需要醫師合作,以促進病人護理、減少行政負擔、提高效率並降低風險。
Arthroscopy 2024-08-31
Frail Older Adults' Needs and Preferences for Mobile Health Exercise Interventions Guided by Nudge Theory: AQualitative Analysis.
脆弱老年人對於基於推動理論的移動健康運動介入的需求與偏好:質性分析。
J Clin Nurs 2024-08-31
A Novel Evaluation Framework for Medical LLMs: Combining Fuzzy Logic and MCDM for Medical Relation and Clinical Concept Extraction.
醫療 LLMs 的新評估框架:結合模糊邏輯和多準則決策方法進行醫療關係和臨床概念提取。
J Med Syst 2024-08-30
這項研究針對醫療領域的大型語言模型(LLMs)開發了一個全面的評估框架,旨在評估其效能、安全性和倫理合規性。研究採用多準則決策方法(MCDM)及模糊加權零不一致性(FWZIC)來處理醫療決策中的不確定性,並使用多屬性理想-現實比較分析(MAIRCA)來評估不同的醫療LLMs。結果顯示,「醫療關係提取」的重要性略高於「臨床概念提取」,「GatorTron S 10B」表現最佳,而「GatorTron 90B」則最低。這項研究對醫療實務具有重要意義,能幫助專業人士做出明智的LLM採用決策。
相關文章PubMedDOI
Performance Evaluation of the Generative Pre-trained Transformer (GPT-4) on the Family Medicine In-Training Examination.
Generative Pre-trained Transformer (GPT-4) 在家庭醫學訓練考試中的表現評估。
J Am Board Fam Med 2024-08-30