The Emerging Role of Large Language Models in Improving Prostate Cancer Literacy.
大型語言模型在提升前列腺癌知識中的新興角色。 Bioengineering (Basel) 2024-07-27

這項研究評估了大型語言模型（LLMs）驅動的聊天機器人，如ChatGPT 3.5、CoPilot和Gemini，在提供前列腺癌資訊的有效性，並與官方病人指南進行比較。研究使用25個專家驗證的問題，根據準確性、及時性、完整性和可理解性進行評估。結果顯示，ChatGPT 3.5的表現優於其他模型，證明其為可靠的資訊來源。研究強調在健康領域持續創新AI應用的重要性，並建議未來探討AI回應中的潛在偏見及其對病人結果的影響。 PubMed DOI

Prompt matters: evaluation of large language model chatbot responses related to Peyronie's disease.
Prompt Matters: 評估大型語言模型聊天機器人對於 Peyronie's disease 的回應。 Sex Med 2024-09-11

越來越多患者在網上尋找健康資訊，尤其是像佩羅尼氏病這種敏感疾病。大型語言模型（LLM）聊天機器人展現了提供資訊的潛力，但對於PD的準確性和可讀性仍不明朗。研究評估了四個LLM在回答PD查詢時的資訊質量，結果顯示在有提示的情況下，資訊質量提升至高水平，但平均閱讀水平為12.9年級，超過大多數患者的理解能力。雖然LLM在患者教育上有潛力，但仍需臨床背景和人類提示來提升效果，並需教育患者與醫生如何有效互動。 PubMed DOI

Application of Large Language Models in Medical Training Evaluation-Using ChatGPT as a Standardized Patient: Multimetric Assessment.
大型語言模型在醫學訓練評估中的應用 - 使用 ChatGPT 作為標準化病人：多指標評估。 J Med Internet Res 2025-01-01

這項研究探討了使用ChatGPT作為醫學教育中的標準化病人，特別是在病史採集方面。研究分為兩個階段：第一階段評估其可行性，模擬炎症性腸病的對話並將回應分為好、中、差三類。第二階段則評估其擬人化、臨床準確性和適應性，並調整提示以增強回應。結果顯示，ChatGPT能有效區分不同質量的回應，經過修訂的提示使其準確性提高了4.926倍。整體而言，研究表明ChatGPT可作為模擬醫學評估的工具，並有潛力改善醫學訓練。 PubMed DOI

Patient- and clinician-based evaluation of large language models for patient education in prostate cancer radiotherapy.
以病人和臨床醫師為基礎的評估大型語言模型在前列腺癌放射治療中的病人教育效果。 Strahlenther Onkol 2025-01-10

這項研究評估大型語言模型（LLMs）在提供前列腺癌放射治療病人教育的有效性，並納入臨床醫生和病人的反饋。研究中針對六個常見問題，評估了ChatGPT-4、Gemini、Copilot和Claude的回答。結果顯示，雖然所有模型的回答被認為相關且正確，但可讀性較差。病人對ChatGPT-4的評價較高，認為其回答易懂且有信心。整體而言，LLMs在病人教育上有潛力，但準確性和可讀性仍需改進，未來需進一步研究以提升其效益。 PubMed DOI

Bots in white coats: are large language models the future of patient education? a multi-center cross-sectional analysis.
白袍中的機器人：大型語言模型是否是病人教育的未來？一項多中心橫斷面分析。 Int J Surg 2025-01-29

這項研究顯示ChatGPT-4o在提升病人手術教育方面的潛力。每年全球有約3億次手術，手術後30天內死亡人數達420萬，因此有效的病人教育非常重要。研究針對六種手術程序的常見問題進行音頻回應，並由外科醫生評估。主要發現包括： - ChatGPT-4o在準確性（4.12/5）和相關性（4.46/5）上表現優異，潛在危害性低（0.22/5）。 - 手術後的回應準確性和相關性優於手術前。 - 小型手術的回應雖少，但準確性高於大型手術。研究建議將GPT-4o整合進醫院系統，以提供即時可靠的信息，提升病人滿意度和知情決策能力。 PubMed DOI

MedBot vs RealDoc: efficacy of large language modeling in physician-patient communication for rare diseases.
MedBot 與 RealDoc：大型語言模型在罕見疾病的醫生-病人溝通中的效能。 J Am Med Inform Assoc 2025-02-25

這項研究評估了GPT-4和BioMistral 7B兩個大型語言模型在回答罕見疾病病人詢問的表現，並與醫生的回應進行比較。結果顯示，GPT-4的表現優於醫生和BioMistral 7B，回應被認為正確且具同理心。BioMistral 7B的回應則部分正確，而醫生的表現介於兩者之間。專家指出，雖然LLMs能減輕醫生負擔，但仍需嚴格驗證其可靠性。GPT-4在溝通上表現佳，但需注意回應的變異性和準確性。 PubMed DOI

A Future of Self-Directed Patient Internet Research: Large Language Model-Based Tools Versus Standard Search Engines.
自我導向病患網路研究的未來：大型語言模型工具與標準搜尋引擎的比較。 Ann Biomed Eng 2025-03-02

這項研究評估了幾個大型語言模型（LLM）聊天機器人，包括Google、Bard、GPT-3.5和GPT-4，對於慢性健康狀況的病人教育效果。研究針對高血壓、高脂血症、糖尿病、焦慮和情緒障礙等五個常見健康問題進行評分。結果顯示，GPT-3.5和GPT-4在內容的全面性和質量上表現優於Bard和Google，但後者的回應更易讀。整體來看，這項研究建議LLM工具在健康查詢中可能比傳統搜尋引擎提供更準確的信息，適合用於病人教育。 PubMed DOI

Online Health Information-Seeking in the Era of Large Language Models: Cross-Sectional Web-Based Survey Study.
大型語言模型時代的線上健康資訊搜尋：橫斷面網路調查研究。 J Med Internet Res 2025-03-31

這項研究探討使用者對大型語言模型（LLM）驅動的聊天機器人（如ChatGPT）提供的健康資訊的看法，與傳統線上資源相比。結果顯示，98%的參與者仍主要依賴搜尋引擎尋找健康資訊，只有21.2%使用聊天機器人。大多數人尋求健康狀況資訊，但對於用藥建議和自我診斷的需求較低。雖然LLM聊天機器人逐漸受到年輕族群的青睞，但使用者在遵循建議時仍較為謹慎。研究強調提高準確性和透明度對於健康資訊的安全性至關重要。 PubMed DOI

Ability of ChatGPT to Replace Doctors in Patient Education: Cross-Sectional Comparative Analysis of Inflammatory Bowel Disease.
ChatGPT 在病人教育中取代醫生的能力：炎症性腸病的橫斷面比較分析。 J Med Internet Res 2025-03-31

這項研究評估了ChatGPT在提供慢性疾病患者教育方面的表現，特別針對炎症性腸病（IBD），並與專科醫生的回應進行比較。結果顯示，ChatGPT的整體品質評分與專科醫生相似，且在信息完整性上有明顯優勢。雖然準確性無顯著差異，但在患者和醫生共同回應時，ChatGPT表現較差。研究建議在健康信息創建和評估中，應納入患者的參與，以提升質量和相關性。 PubMed DOI

Evaluating large language models as an educational tool for meningioma patients: patient and clinician perspectives.
作為腦膜瘤患者教育工具的大型語言模型評估：患者與臨床醫師的觀點 Radiat Oncol 2025-06-14

這項研究發現，ChatGPT能幫助腦膜瘤患者了解診斷和治療，特別是在放射線治療後的衛教上。大多數患者覺得ChatGPT的回答清楚又正確，六成願意未來再用。醫師也認同內容大致正確，但提醒部分細節、尤其副作用說明還不夠完整。整體來說，ChatGPT適合當作衛教輔助工具，但還是需要醫師把關。 PubMed DOI

原始文章

站上相關主題文章列表