Investigating the impact of innovative AI chatbot on post-pandemic medical education and clinical assistance: a comprehensive analysis.
探討創新人工智慧聊天機器人對後疫情醫學教育和臨床協助的影響：全面分析。 ANZ J Surg 2024-02-27

研究發現三款大型語言模型在醫療決策上的表現，ChatGPT最優，其次是Google的Bard和Bing的AI。結果顯示ChatGPT提供更易懂且符合指引的醫療建議，對初級醫生學習和臨床決策有潛力，但還需更多整合到教育中。 PubMed DOI

The role of artificial intelligence in informed patient consent for radiotherapy treatments-a case report.
人工智慧在放射治療知情同意中的角色-一個案例報告。 Strahlenther Onkol 2024-01-05

LLM如ChatGPT在醫療領域應用廣泛，但需謹慎。研究發現在放射腫瘤學中使用LLM時，患者偏好醫師在場，擔心資訊來源。強調LLM需配合醫療指南，AI支持重要，但人文關懷仍不可或缺。 PubMed DOI

Comparison of large language models in management advice for melanoma: Google's AI BARD, BingAI and ChatGPT.
大型語言模型在黑色素瘤管理建議中的比較：Google 的 AI BARD、BingAI 和 ChatGPT。 Skin Health Dis 2024-02-06

大型語言模型如BARD、BingAI和ChatGPT-4正被運用在醫療領域，提供醫學資訊和指導。研究顯示，ChatGPT在黑色素瘤臨床指南方面表現較佳，但所有模型仍有限制。未來研究應該著重整合專業數據和專家知識，以提升模型性能，更好地支援患者護理。 PubMed DOI

Assessing large language models' accuracy in providing patient support for choroidal melanoma.
評估大型語言模型在提供脈絡膜黑色素瘤患者支持方面的準確性。 Eye (Lond) 2024-07-13

研究評估大型語言模型（LLMs）提供脈絡膜黑色素瘤資訊的準確性，比較三個LLMs，專家審查結果顯示ChatGPT在醫療建議上最準確，手術前後問題上與Bing AI相似。回答長度不影響準確性，LLMs可引導患者尋求專業建議，但在臨床應用前仍需更多微調和監督。 PubMed DOI

The Emerging Role of Large Language Models in Improving Prostate Cancer Literacy.
大型語言模型在提升前列腺癌知識中的新興角色。 Bioengineering (Basel) 2024-07-27

這項研究評估了大型語言模型（LLMs）驅動的聊天機器人，如ChatGPT 3.5、CoPilot和Gemini，在提供前列腺癌資訊的有效性，並與官方病人指南進行比較。研究使用25個專家驗證的問題，根據準確性、及時性、完整性和可理解性進行評估。結果顯示，ChatGPT 3.5的表現優於其他模型，證明其為可靠的資訊來源。研究強調在健康領域持續創新AI應用的重要性，並建議未來探討AI回應中的潛在偏見及其對病人結果的影響。 PubMed DOI

Clinical application potential of large language model: a study based on thyroid nodules.
大型語言模型的臨床應用潛力：基於甲狀腺結節的研究。 Endocrine 2024-07-30

這項研究評估了大型語言模型（LLMs），特別是ChatGPT-3.5和New Bing Chat，在模擬醫生角色管理甲狀腺結節的表現。研究中提出145個病人的問題，並與初級醫生和資深醫生的回答進行比較。結果顯示，這兩個LLMs在某些問題上表現接近初級醫生，但整體準確性較低。雖然ChatGPT-3.5在特定問題上表現較好，但New Bing Chat在甲狀腺結節的決策準確性較高。總體而言，這些LLMs尚未達到人類醫生的臨床決策能力。 PubMed DOI

The Potential Impact of Large Language Models on Doctor-Patient Communication: A Case Study in Prostate Cancer.
大型語言模型對醫生與病人溝通的潛在影響：前列腺癌的案例研究。 Healthcare (Basel) 2024-08-09

近年來，大型語言模型（LLMs）已被應用於醫療領域，特別是在前列腺癌的病患溝通上。我們的研究評估了三種LLM的效果，包括ChatGPT（3.5）、Gemini（Pro）和Co-Pilot（免費版），並與官方的羅馬尼亞前列腺癌病患指南進行比較。透過隨機和盲測，八位醫療專業人員根據準確性、及時性、全面性和使用友好性進行評估。結果顯示，LLM，尤其是ChatGPT，通常提供比指南更準確且友好的資訊，顯示出其在改善醫療溝通上的潛力。不過，不同模型的表現差異也顯示出需要量身定制的實施策略。 PubMed DOI

Comparative Evaluation of LLMs in Clinical Oncology.
臨床腫瘤學中大型語言模型的比較評估。 NEJM AI 2024-08-12

隨著人工智慧工具的普及，患者和醫療專業人員越來越依賴這些工具提供的醫療資訊。本研究評估了五個大型語言模型（LLaMA 1、PaLM 2、Claude-v1、GPT-3.5和GPT-4）在2044個腫瘤學相關問題上的表現。結果顯示，GPT-4在與人類基準比較中表現最佳，達到第50百分位以上。雖然GPT-4的準確率高達81.1%，但所有模型仍存在顯著錯誤率，顯示出持續評估這些AI工具的重要性，以確保其安全應用於臨床實踐。 PubMed DOI

Accuracy and consistency of publicly available Large Language Models as clinical decision support tools for the management of colon cancer.
公開可用的大型語言模型在結腸癌管理中的準確性和一致性作為臨床決策支持工具。 J Surg Oncol 2024-08-19

這項研究評估了 OpenAI 的 ChatGPT 和 Microsoft 的 Copilot 兩個大型語言模型在結腸癌管理建議上的準確性。結果顯示，兩者在 36% 的情境中提供正確回應。ChatGPT 有 39% 的回應缺乏資訊，24% 不準確；Copilot 則有 37% 缺少資訊，28% 不準確。兩者表現差異不顯著。此外，臨床醫師的回應明顯較短，平均 34 字，而 ChatGPT 和 Copilot 分別為 251 和 271 字。研究指出，雖然 LLM 可協助臨床決策，但仍需優化以確保準確性。 PubMed DOI

Performance of large language models (LLMs) in providing prostate cancer information.
大型語言模型 (LLMs) 在提供前列腺癌資訊中的表現。 BMC Urol 2024-08-23

這項研究評估了AI聊天機器人，特別是ChatGPT和Google Bard在提供前列腺癌教育資訊的表現。研究發現，所有大型語言模型的準確性相似，但ChatGPT-3.5在一般知識上表現優異。ChatGPT-4的回答則更全面，而Bard的回答最易讀，獲得最高的易讀性分數。總體來說，這些AI模型雖無法取代醫療專業人員，但能有效協助病人了解前列腺癌的相關知識。 PubMed DOI

原始文章

站上相關主題文章列表