Assessing ChatGPT's theoretical knowledge and prescriptive accuracy in bacterial infections: a comparative study with infectious diseases residents and specialists.
評估 ChatGPT 在細菌感染的理論知識和處方準確性：與感染症住院醫師和專家進行比較研究。 Infection 2024-07-12

研究評估了ChatGPT在處理細菌感染和抗生素敏感性相關問題以及臨床案例中的效果。結果顯示ChatGPT在回答理論問題表現不錯，但在臨床案例管理上有限制，例如識別抗藥機制和抗生素處方。ChatGPT可作為醫學教育和分析工具，但不宜取代專家諮詢在複雜決策中的重要性。 PubMed DOI

Exploring the performance of large language models on hepatitis B infection-related questions: A comparative study.
探討大型語言模型在與肝炎 B 感染相關問題上的表現：一項比較研究。 World J Gastroenterol 2025-01-22

這項研究評估了三個大型語言模型（LLMs）—ChatGPT-3.5、ChatGPT-4.0 和 Google Gemini 在回答乙型肝炎病毒（HBV）相關問題的表現。醫療專業人員對其準確性進行評分，並評估可讀性。主要發現包括： - 所有 LLM 在主觀問題上得分高，ChatGPT-4.0 準確性最高。 - 在客觀問題上，ChatGPT-4.0 準確率為 80.8%，優於其他兩者。 - ChatGPT-4.0 在診斷上表現佳，Google Gemini 在臨床表現強勁。 - 所有 LLM 的可讀性分數高於標準八級，對一般讀者來說可能過於複雜。結果顯示，LLMs，特別是 ChatGPT-4.0，可能成為有關 HBV 的資訊工具，但不應取代醫生的個人化建議。 PubMed DOI

Preliminary exploration of ChatGPT-4 shows the potential of generative artificial intelligence for culturally tailored, multilingual antimicrobial resistance awareness messaging.
初步探索 ChatGPT-4 顯示生成式人工智慧在文化量身訂做的多語言抗微生物抗藥性宣導訊息中的潛力。 Am J Vet Res 2025-01-29

抗微生物抗藥性（AMR）對全球健康構成嚴重威脅，預計到2050年每年可能造成1000萬人死亡。為了有效應對，公共衛生訊息需針對不同受眾調整。本研究評估了ChatGPT-4生成適合文化和語言的AMR意識內容的能力。專家們識別了AMR的主要貢獻者，並開發了多語言的內容。雖然ChatGPT-4在生成定制內容方面顯示潛力，但質量差異顯著，需專業審查。未來研究應聚焦於完善提示和整合反饋，以提升內容有效性。 PubMed DOI

Evaluating the Accuracy of Responses by Large Language Models for Information on Disease Epidemiology.
評估大型語言模型對疾病流行病學資訊回應的準確性。 Pharmacoepidemiol Drug Saf 2025-02-04

這項研究評估了大型語言模型（LLMs），如ChatGPT-3.5、ChatGPT-4和Google Bard，在提供疾病流行病學數據的準確性。研究設計了21個問題，並將其提交給每個模型兩次。結果顯示，ChatGPT-4的準確率最高，達76.2%，其次是Bard的50.0%和ChatGPT-3.5的45.2%。雖然ChatGPT-4表現較佳，但三者皆存在不準確性和參考文獻問題，限制了它們在醫藥和學術界的實用性。 PubMed DOI

Chatting new territory: large language models for infection surveillance from pilot to deployment.
聊天新領域：大型語言模型在感染監測中的應用從試點到部署。 Infect Control Hosp Epidemiol 2025-02-14

Rodriguez-Nava 等人進行了一項概念驗證研究，探討如何利用安全的大型語言模型（LLM）來獲得醫療數據的批准。他們的研究專注於回顧性識別中心靜脈導管相關血流感染（CLABSIs），這是一種特定的醫療相關感染（HAI），並使用真實病人的數據進行監測。研究結果顯示，LLMs 有潛力顯著提升 HAI 監測的效率，並能部分自動化或簡化這個過程。 PubMed DOI

PH-LLM: Public Health Large Language Models for Infoveillance.
公共衛生大型語言模型在資訊監測中的應用。 medRxiv 2025-02-24

公共衛生干預措施如疫苗接種和社交距離的成效，依賴於公眾的支持與遵守。社交媒體成為評估公眾參與的重要工具，但在緊急情況下，缺乏即時監測可能導致反應延遲。為此，我們開發了PH-LLM（公共衛生大型語言模型），專注於即時公共衛生監測，並建立了多語言數據集。PH-LLM在多項任務中表現優於其他模型，顯示其在公共衛生資訊監測上的潛力，能有效增強政策制定與危機應對。此研究部分由NIH贈款支持。 PubMed DOI

A comparative analysis of large language models on clinical questions for autoimmune diseases.
自體免疫疾病臨床問題的大型語言模型比較分析。 Front Digit Health 2025-03-18

這項研究評估了大型語言模型（LLMs），如ChatGPT 3.5、ChatGPT 4.0和Gemini，對自體免疫疾病臨床問題的回答效果。共提出46個問題，並由專家根據五個質量維度進行評估。結果顯示，ChatGPT 4.0在所有維度上表現優於其他兩者，平均得分為199.8，顯示其在相關性、正確性、完整性、有用性和安全性方面的顯著優勢。整體而言，ChatGPT 4.0在提供準確且有用的醫療資訊上，顯示出更高的效能，顯示大型語言模型在醫療服務中的潛力。 PubMed DOI

Large Language Models in Action: Supporting Clinical Evaluation in an Infectious Disease Unit.
大型語言模型的應用：支援感染症單位的臨床評估 Healthcare (Basel) 2025-04-26

這項研究發現，ChatGPT-4o在分析敗血症患者臨床紀錄、評估抗生素和導管管理上表現不錯，但在隔離措施和壓瘡辨識上有失誤。整體來說，LLMs有潛力成為臨床感染控制的輔助工具。 PubMed DOI

Large language models' capabilities in responding to tuberculosis medical questions: testing ChatGPT, Gemini, and Copilot.
大型語言模型在回應結核病醫學問題的能力：測試 ChatGPT、Gemini 與 Copilot Sci Rep 2025-05-23

這項研究比較了ChatGPT、Gemini和Copilot在回答結核病問題的表現。ChatGPT整體表現最佳，資訊最相關；Gemini在預防控制方面較強；Copilot在疾病管理上較弱。三者在診斷表現差不多。共同缺點是缺乏來源和不確定性標註。總結來說，三款AI都能回答結核病問題，但資訊透明度和參考來源還有待加強，這對醫療應用很重要。 PubMed DOI

Comparative analysis of language models in addressing syphilis-related queries.
針對梅毒相關問題之語言模型的比較分析 Med Oral Patol Oral Cir Bucal 2025-05-27

這項研究比較了10款大型語言模型在提供梅毒資訊的表現，發現ChatGPT 4.0和Claude的正確率最高，但有些模型在複雜議題上表現不佳，還會出現過時或錯誤的資訊。只有六成AI生成內容能直接用於臨床，顯示專家審核仍不可或缺。 PubMed DOI

原始文章

站上相關主題文章列表