Assessing ChatGPT's theoretical knowledge and prescriptive accuracy in bacterial infections: a comparative study with infectious diseases residents and specialists.
評估 ChatGPT 在細菌感染的理論知識和處方準確性：與感染症住院醫師和專家進行比較研究。 Infection 2024-07-12

研究評估了ChatGPT在處理細菌感染和抗生素敏感性相關問題以及臨床案例中的效果。結果顯示ChatGPT在回答理論問題表現不錯，但在臨床案例管理上有限制，例如識別抗藥機制和抗生素處方。ChatGPT可作為醫學教育和分析工具，但不宜取代專家諮詢在複雜決策中的重要性。 PubMed DOI

ChatGPT vs Medical Professional: Analyzing Responses to Laboratory Medicine Questions on Social Media.
ChatGPT 對抗醫學專業人士：分析社群媒體上對實驗室醫學問題的回答。 Clin Chem 2024-07-16

研究發現ChatGPT在提供實驗室醫學資訊上表現優異，75.9%的評估者偏好它的回答，認為提供全面且正確的資訊。相較之下，醫學專業人士的回答則以簡潔見長。ChatGPT可能在回答醫學問題上勝過專業人士，但仍需進一步研究確認其實用性，並探索整合到醫療保健中的可能性。 PubMed DOI

The potential and pitfalls of using a large language model such as ChatGPT, GPT-4, or LLaMA as a clinical assistant.
使用大型語言模型如ChatGPT、GPT-4或LLaMA作為臨床助手的潛力與陷阱。 J Am Med Inform Assoc 2024-07-17

研究評估了大型語言模型在醫療保健領域的應用，尤其是在改善患者護理方面。使用MIMIC-III數據庫的電子健康記錄，測試了這些模型在識別特定疾病患者方面的效能。GPT-4在辨識COPD、CKD、PBC和Cancer Cachexia患者方面表現優異，而ChatGPT和LLaMA3則稍遜。儘管LLMs有潛力，但在臨床應用前仍需解決錯誤、解釋不足和倫理問題。進一步研究將有助於提升模型訓練和設計，以更好地應用於醫療保健。 PubMed DOI

Comparative analysis of large language models in medical counseling: A focus on Helicobacter pylori infection.
醫療諮詢中大型語言模型的比較分析：聚焦於 Helicobacter pylori 感染。 Helicobacter 2024-07-30

這項研究評估了三種大型語言模型（LLMs）在幽門螺旋桿菌感染諮詢中的有效性，重點分析其在英語和中文的表現。研究期間為2023年11月20日至12月1日，針對15個H. pylori相關問題進行評估。結果顯示，準確性得分為4.80，顯示良好，但完整性和可理解性得分較低，分別為1.82和2.90。英語回應在完整性和準確性上普遍優於中文。結論指出，雖然LLMs在提供資訊上表現不錯，但在完整性和可靠性方面仍需改進，以提升其作為醫療諮詢工具的效能。 PubMed DOI

Assessing Accuracy of ChatGPT on Addressing Helicobacter pylori Infection-Related Questions: A National Survey and Comparative Study.
評估 ChatGPT 在解答與 Helicobacter pylori 感染相關問題的準確性：一項全國性調查與比較研究。 Helicobacter 2024-07-31

這項研究評估了ChatGPT在回答幽門螺旋桿菌感染問題的準確性，並與腸胃科醫生進行比較。研究選取了25個問題，測試了ChatGPT3.5和ChatGPT4，結果顯示兩者準確率均高達92%，超過腸胃科醫生的80%。ChatGPT4的回答更簡潔，且在診斷和胃癌預防方面表現優於ChatGPT3.5。整體來看，ChatGPT在H. pylori相關問題上展現高準確性，對患者和醫生皆具價值。 PubMed DOI

Assessing ChatGPT as a Medical Consultation Assistant for Chronic Hepatitis B: Cross-Language Study of English and Chinese.
評估 ChatGPT 作為慢性乙型肝炎的醫療諮詢助手：英語和中文的跨語言研究。 JMIR Med Inform 2024-08-08

慢性乙型肝炎（CHB）在全球造成重大挑戰，尤其在中國等高盛行率地區。本研究探討AI助手ChatGPT-3.5在CHB管理中的潛力，特別是其提供個性化醫療諮詢的能力。研究發現，ChatGPT-4.0在資訊量和一致性上表現優於3.5，準確率達93.3%。然而，兩者在情感管理上表現不佳，需改進。研究建議針對情感管理進行專門訓練，並進一步探討免責聲明對病人經驗的影響。 PubMed DOI

Application of Large Language Models in Medical Training Evaluation-Using ChatGPT as a Standardized Patient: Multimetric Assessment.
大型語言模型在醫學訓練評估中的應用 - 使用 ChatGPT 作為標準化病人：多指標評估。 J Med Internet Res 2025-01-01

這項研究探討了使用ChatGPT作為醫學教育中的標準化病人，特別是在病史採集方面。研究分為兩個階段：第一階段評估其可行性，模擬炎症性腸病的對話並將回應分為好、中、差三類。第二階段則評估其擬人化、臨床準確性和適應性，並調整提示以增強回應。結果顯示，ChatGPT能有效區分不同質量的回應，經過修訂的提示使其準確性提高了4.926倍。整體而言，研究表明ChatGPT可作為模擬醫學評估的工具，並有潛力改善醫學訓練。 PubMed DOI

Exploring the performance of large language models on hepatitis B infection-related questions: A comparative study.
探討大型語言模型在與肝炎 B 感染相關問題上的表現：一項比較研究。 World J Gastroenterol 2025-01-22

這項研究評估了三個大型語言模型（LLMs）—ChatGPT-3.5、ChatGPT-4.0 和 Google Gemini 在回答乙型肝炎病毒（HBV）相關問題的表現。醫療專業人員對其準確性進行評分，並評估可讀性。主要發現包括： - 所有 LLM 在主觀問題上得分高，ChatGPT-4.0 準確性最高。 - 在客觀問題上，ChatGPT-4.0 準確率為 80.8%，優於其他兩者。 - ChatGPT-4.0 在診斷上表現佳，Google Gemini 在臨床表現強勁。 - 所有 LLM 的可讀性分數高於標準八級，對一般讀者來說可能過於複雜。結果顯示，LLMs，特別是 ChatGPT-4.0，可能成為有關 HBV 的資訊工具，但不應取代醫生的個人化建議。 PubMed DOI

Ability of ChatGPT to Replace Doctors in Patient Education: Cross-Sectional Comparative Analysis of Inflammatory Bowel Disease.
ChatGPT 在病人教育中取代醫生的能力：炎症性腸病的橫斷面比較分析。 J Med Internet Res 2025-03-31

這項研究評估了ChatGPT在提供慢性疾病患者教育方面的表現，特別針對炎症性腸病（IBD），並與專科醫生的回應進行比較。結果顯示，ChatGPT的整體品質評分與專科醫生相似，且在信息完整性上有明顯優勢。雖然準確性無顯著差異，但在患者和醫生共同回應時，ChatGPT表現較差。研究建議在健康信息創建和評估中，應納入患者的參與，以提升質量和相關性。 PubMed DOI

Comparative evaluation of the accuracy and reliability of ChatGPT versions in providing information on <i>Helicobacter pylori</i> infection.
ChatGPT 各版本在提供有關 Helicobacter pylori 感染資訊之準確性與可靠性的比較評估 Front Public Health 2025-05-30

這項研究比較了三種ChatGPT版本在回答幽門螺旋桿菌相關問題的表現。結果顯示，ChatGPT-4o答得最準確但穩定性較差，3.5版則最穩定但偶有錯誤。整體來說，AI聊天機器人能有效協助病患衛教，也能幫醫師提供可靠醫療資訊。 PubMed DOI

原始文章

站上相關主題文章列表