Embracing the future-is artificial intelligence already better? A comparative study of artificial intelligence performance in diagnostic accuracy and decision-making.
掌握未來-人工智慧已經更好了嗎？人工智慧在診斷準確性和決策表現的比較研究。 Eur J Neurol 2024-03-14

研究比較了基於GPT-3.5的AI聊天機器人和神經學醫師在臨床案例中的診斷和決策表現。結果顯示，AI聊天機器人在神經學領域的表現相當不錯，正確率高達85%，並能提供96.1%的案例充分理由。研究指出AI可作為神經學臨床推理的輔助工具，未來應用前景廣闊。 PubMed DOI

[The spring of artificial intelligence: AI vs. expert for internal medicine cases].
人工智慧之春：AI 對內科病例與專家的比較。 Rev Med Interne 2024-02-08

研究比較了ChatGPT-4和Bard兩個語言模型在處理臨床案例時的表現。結果顯示人類醫學專家在診斷上較準確，但AI模型回應速度快。AI模型在處理複雜案例上仍需提升，但潛力巨大。建議未來培訓需調整以避免AI模型處理這些案例。 PubMed DOI

Evaluation of artificial intelligence-generated drug therapy communication skill competencies in medical education.
人工智慧生成的藥物治療溝通技能能力在醫學教育中的評估。 Br J Clin Pharmacol 2024-07-02

研究比較了三個人工智慧平台在醫療溝通能力上的表現，發現它們在某些方面有相似之處，但措辭不同。在患者指示、副作用等議題上存在差異，需要人類介入進行評估。結論是人工智慧需要人類監督，以確保準確性和適切性。 PubMed DOI

The potential, limitations, and future of diagnostics enhanced by generative artificial intelligence.
生成人工智慧增強診斷的潛力、限制和未來。 Diagnosis (Berl) 2024-07-10

討論了生成式人工智慧在醫學診斷中的應用，包括支援訪談、協助鑑別診斷和強化臨床推理。雖然GAI有助於轉換患者描述為圖像和提供診斷，但也有風險，如產生錯誤資訊。整合GAI與人類決策可提升診斷速度和正確性，未來應該強調結合人類診斷推理，增進而非取代醫療專業知識。 PubMed DOI

Doctor AI? A pilot study examining responses of artificial intelligence to common questions asked by geriatric patients.
Doctor AI？一項針對老年患者常見問題的人工智慧反應的初步研究。 Front Artif Intell 2024-08-09

人工智慧技術在病患照護上有很大潛力，尤其在診斷、精神疾病治療和認知測試解讀等方面。雖然進展顯著，但仍需進一步研究其在醫療中的優缺點。一項研究比較了人工智慧（Chat-GPT 3.5）和臨床醫師對癡呆症相關問題的回答，結果顯示人工智慧在易懂性和深度上表現更佳，平均評分為4.6/5，而臨床醫師則為4.3、4.2和3.9。儘管人工智慧的回答質量高，但仍需注意錯誤資訊和數據安全等問題。總之，人工智慧在醫療溝通上有潛力，但需謹慎對待其限制。 PubMed DOI

CLINICAL REASONING AND ARTIFICIAL INTELLIGENCE: CAN AI REALLY THINK?
臨床推理與人工智慧：AI 真的能思考嗎？ Trans Am Clin Climatol Assoc 2024-08-13

人工智慧（AI）如ChatGPT的迅速發展，引起醫療和教育界的關注。雖然AI在日常醫療任務和影像評估上展現潛力，但其依賴的模式識別演算法也帶來挑戰。這篇評論探討AI對醫學教育的影響，特別是在批判性思維和臨床推理的培養上。將比較假設演繹推理與歸納推理，並討論認知偏見對診斷錯誤的影響。透過案例分析，指出AI在醫療中的局限性，並建議未來醫學教育應重視批判性思維與臨床推理。 PubMed DOI

Enhancing Medical Interview Skills Through AI-Simulated Patient Interactions: Nonrandomized Controlled Trial.
透過 AI 模擬病人互動提升醫學面試技巧：非隨機對照試驗。 JMIR Med Educ 2024-09-23

這項研究探討AI模擬病人對日本四年級醫學生醫療面談技巧的提升。參與者中，35名學生使用AI模擬程式進行練習，110名前一年學生作為對照組。結果顯示，AI介入組的考試得分顯著高於對照組（28.1對27.1，P=.01）。雖然學生對訓練質量的評價越高，OSCE分數卻可能越低，但整體未發現安全問題。這顯示AI模擬病人是一種安全有效的教育工具，建議作為傳統模擬教育的補充資源。 PubMed DOI

Accuracy is inaccurate: Why a focus on diagnostic accuracy for medical chatbot AIs will not lead to improved health outcomes.
準確性是不準確的：為什麼專注於醫療聊天機器人 AI 的診斷準確性不會導致健康結果的改善。 Bioethics 2024-10-30

自從2022年11月ChatGPT推出以來，聊天機器人AI在醫療領域的應用引起了廣泛關注。雖然這些AI在診斷上表現不錯，甚至通過了美國的醫學執照考試，但在實際醫療中使用卻引發了健康結果的疑慮。文章指出，過度強調診斷準確性忽略了醫生與病人之間信任、同理心和溝通的重要性，這些都是良好醫療的關鍵。依賴AI可能會削弱這些人際互動，影響健康結果。文章建議應增強AI的功能，以支持而非取代醫生，最終改善健康結果。 PubMed DOI

Language Artificial Intelligence Models as Pioneers in Diagnostic Medicine? A Retrospective Analysis on Real-Time Patients.
語言人工智慧模型作為診斷醫學的先驅？對即時患者的回顧性分析。 J Clin Med 2025-02-26

本研究探討AI模型（如GPT-3.5和GPT-4）在急診科生成病症鑑別診斷的表現，並與急診科醫師的準確性進行比較。結果顯示，ChatGPT-4的準確率為85.5%，略高於ChatGPT-3.5的84.6%和醫師的83%。特別是在腸胃主訴方面，ChatGPT-4的準確性達87.5%。研究顯示AI模型在臨床決策中具潛在應用價值，建議未來進一步探索AI在醫療中的應用。 PubMed DOI

Towards accurate differential diagnosis with large language models.
利用大型語言模型進行準確的鑑別診斷。 Nature 2025-04-09

這項研究介紹了Articulate Medical Intelligence Explorer (AMIE)，一個大型語言模型，旨在提升醫療診斷推理。研究評估AMIE在生成鑑別診斷的有效性，並與傳統方法比較。二十位臨床醫師針對302個複雜案例進行評估，結果顯示AMIE的準確率達59.1%，遠超過未經協助的醫師33.6%。使用AMIE的醫師準確率為51.7%，也高於僅依賴傳統資源的醫師。這些結果顯示AMIE有潛力提升診斷準確性，並強調在真實環境中進一步評估的必要性。 PubMed DOI

原始文章

站上相關主題文章列表