Assessing the Efficacy of Large Language Models in Health Literacy: A Comprehensive Cross-Sectional Study.
評估大型語言模型在健康識字能力中的功效：一項全面的橫斷面研究。 Yale J Biol Med 2024-04-03

研究使用LLMs提升兒童健康識字能力，結果顯示LLMs能根據年級提供定制回應，但在六年級以下表現不佳。然而，它們可提供各種資訊，有助青少年了解健康資訊。需要進一步研究驗證其準確性和有效性。 PubMed DOI

Using Large Language Models to Generate Educational Materials on Childhood Glaucoma.
運用大型語言模型生成有關兒童青光眼的教育資料。 Am J Ophthalmol 2024-04-13

研究發現，大型語言模型（LLMs）生成的兒童青光眼患者教育資料（PEMs）質量高、易讀且準確。其中，ChatGPT-4生成的PEMs最易讀。在改進現有線上資訊方面，只有ChatGPT-4達到六年級閱讀水平。總結來說，LLMs是提升PEMs品質和兒童青光眼資訊易讀性的寶貴工具。 PubMed DOI

Assessing the Application of Large Language Models in Generating Dermatologic Patient Education Materials According to Reading Level: Qualitative Study.
評估大型語言模型在生成皮膚科患者教育資料方面的應用，根據閱讀水平：質性研究。 JMIR Dermatol 2024-05-16

研究發現大型語言模型（LLMs）如ChatGPT-3.5、GPT-4、DermGPT和DocsGPT在製作皮膚科患者教育資料（PEMs）方面表現良好，能提供易讀易懂的資訊，且大多數情況下準確無誤。其中，GPT-4在常見和罕見疾病的解釋上表現優秀，而ChatGPT-3.5和DocsGPT在罕見疾病的說明方面更為出色。總結來說，LLMs對於提升健康知識和提供易懂的PEMs具有潛力。 PubMed DOI

Clinical Accuracy, Relevance, Clarity, and Emotional Sensitivity of Large Language Models to Surgical Patient Questions: Cross-Sectional Study.
大型語言模型對外科患者問題的臨床準確性、相關性、清晰度和情感敏感度：橫斷面研究。 JMIR Form Res 2024-06-07

研究發現大型語言模型（LLMs）像Anthropic的Claude 2在手術前回應病人問題時表現優異，比起其他模型如OpenAI的ChatGPT和Google的Bard更準確、相關、清晰且情感敏感。這顯示LLMs可能有助於改善手術前病人溝通和教育。 PubMed DOI

Using large language model to guide patients to create efficient and comprehensive clinical care message.
使用大型語言模型指導患者創建高效且全面的臨床護理訊息。 J Am Med Inform Assoc 2024-06-25

研究使用大型語言模型幫助病人提出問題，提升溝通效率。以范德堡大學醫學中心數據測試三個模型，CLAIR在清晰度、完整性和簡潔性表現最佳。GPT4在效用和完整性較高，但清晰度和簡潔性較差。CLAIR生成的問題與醫療者相符，有助改善溝通。 PubMed DOI

Large Language Models in Pediatric Education: Current Uses and Future Potential.
大型語言模型在兒科教育中的應用：當前使用情況與未來潛力。 Pediatrics 2024-08-07

生成式人工智慧，特別是大型語言模型（LLMs），在兒科教育和訓練上有很大潛力。這些模型能幫助教育者改善課程設計、制定個性化學習計畫，並提供即時反饋，還能協助醫生簡化資訊搜尋，提升診所效率。不過，LLMs也可能產生不準確資訊，並引發偏見和倫理問題。因此，專業人士需謹慎使用並審查其輸出。為確保安全有效的應用，相關方應建立明確的指導方針和政策。本文探討了LLMs在兒科教育中的歷史、應用及挑戰。 PubMed DOI

The Potential Impact of Large Language Models on Doctor-Patient Communication: A Case Study in Prostate Cancer.
大型語言模型對醫生與病人溝通的潛在影響：前列腺癌的案例研究。 Healthcare (Basel) 2024-08-09

近年來，大型語言模型（LLMs）已被應用於醫療領域，特別是在前列腺癌的病患溝通上。我們的研究評估了三種LLM的效果，包括ChatGPT（3.5）、Gemini（Pro）和Co-Pilot（免費版），並與官方的羅馬尼亞前列腺癌病患指南進行比較。透過隨機和盲測，八位醫療專業人員根據準確性、及時性、全面性和使用友好性進行評估。結果顯示，LLM，尤其是ChatGPT，通常提供比指南更準確且友好的資訊，顯示出其在改善醫療溝通上的潛力。不過，不同模型的表現差異也顯示出需要量身定制的實施策略。 PubMed DOI

Evaluating large language models on medical, lay language, and self-reported descriptions of genetic conditions.
評估大型語言模型在醫學、通俗語言和自我報告的遺傳疾病描述上的表現。 Am J Hum Genet 2024-08-15

這項研究分析了不同大型語言模型（LLMs）在識別遺傳疾病時的表現，對比了開源模型（如Llama-2-chat和Vicuna）與封閉源模型（如ChatGPT-4）。結果顯示，開源模型的準確率在54%-68%之間，而ChatGPT-4則高達89%-90%。研究還指出，臨床醫生和一般民眾的提問對模型表現有顯著影響，且使用列表型提示能提升準確性。整體而言，這項研究揭示了LLMs在醫療領域的潛力與挑戰。 PubMed DOI

A pilot feasibility study comparing large language models in extracting key information from ICU patient text records from an Irish population.
一項針對愛爾蘭人群 ICU 患者文本記錄中提取關鍵信息的大型語言模型比較的初步可行性研究。 Intensive Care Med Exp 2024-08-15

這項研究探討大型語言模型（LLMs）在生成重症監護病房（ICU）病人出院摘要的表現，分析了匿名臨床筆記。三個模型中，GPT-4 API的表現最佳，準確識別41.5%的關鍵臨床事件，ChatGPT和Llama 2則分別為19.2%和16.5%。雖然GPT-4在資訊組織和清晰度上表現優異，但仍有小錯誤，且所有模型在敘事連貫性和重要數據的捕捉上存在挑戰。總體來看，這些LLM在生成出院摘要上有潛力，但仍需改進。 PubMed DOI

Large language models: a new frontier in paediatric cataract patient education.
大型語言模型：小兒白內障病患教育的新前沿。 Br J Ophthalmol 2024-08-22

這項研究評估了三個大型語言模型（LLMs）—ChatGPT-3.5、ChatGPT-4 和 Google Bard 在製作小兒白內障病人教育材料的效果。研究使用三個提示來測試模型的表現，並根據質量、可理解性、準確性和可讀性進行評估。結果顯示，所有模型的回應質量都很高，但沒有一個被認為是可行的。特別是，ChatGPT-4 生成的內容最易讀，並能有效將材料調整至六年級的閱讀水平。總體來看，ChatGPT-4 是生成高質量病人教育材料的有效工具。 PubMed DOI

原始文章

站上相關主題文章列表