原始文章

傳染病對公共健康造成重大挑戰,因此需要主動監測來保護社會健康。像世界衛生組織(WHO)等機構主要以英語分享數據,這對非英語使用者,特別是中東地區的人來說,理解上有困難。為了解決這個問題,我們推出了InfectA-Chat,一個專為阿拉伯語設計的語言模型,具備英語問答能力。該模型經過大量數據微調,並採用檢索增強生成(RAG)方法,能夠獲取最新的傳染病資訊,顯示出優越的性能,並促進公共健康倡議。 PubMed DOI


站上相關主題文章列表

研究評估了ChatGPT在處理細菌感染和抗生素敏感性相關問題以及臨床案例中的效果。結果顯示ChatGPT在回答理論問題表現不錯,但在臨床案例管理上有限制,例如識別抗藥機制和抗生素處方。ChatGPT可作為醫學教育和分析工具,但不宜取代專家諮詢在複雜決策中的重要性。 PubMed DOI

這項研究評估了三個大型語言模型(LLMs)—ChatGPT-3.5、ChatGPT-4.0 和 Google Gemini 在回答乙型肝炎病毒(HBV)相關問題的表現。醫療專業人員對其準確性進行評分,並評估可讀性。 主要發現包括: - 所有 LLM 在主觀問題上得分高,ChatGPT-4.0 準確性最高。 - 在客觀問題上,ChatGPT-4.0 準確率為 80.8%,優於其他兩者。 - ChatGPT-4.0 在診斷上表現佳,Google Gemini 在臨床表現強勁。 - 所有 LLM 的可讀性分數高於標準八級,對一般讀者來說可能過於複雜。 結果顯示,LLMs,特別是 ChatGPT-4.0,可能成為有關 HBV 的資訊工具,但不應取代醫生的個人化建議。 PubMed DOI

抗微生物抗藥性(AMR)對全球健康構成嚴重威脅,預計到2050年每年可能造成1000萬人死亡。為了有效應對,公共衛生訊息需針對不同受眾調整。本研究評估了ChatGPT-4生成適合文化和語言的AMR意識內容的能力。專家們識別了AMR的主要貢獻者,並開發了多語言的內容。雖然ChatGPT-4在生成定制內容方面顯示潛力,但質量差異顯著,需專業審查。未來研究應聚焦於完善提示和整合反饋,以提升內容有效性。 PubMed DOI

這項研究評估了大型語言模型(LLMs),如ChatGPT-3.5、ChatGPT-4和Google Bard,在提供疾病流行病學數據的準確性。研究設計了21個問題,並將其提交給每個模型兩次。結果顯示,ChatGPT-4的準確率最高,達76.2%,其次是Bard的50.0%和ChatGPT-3.5的45.2%。雖然ChatGPT-4表現較佳,但三者皆存在不準確性和參考文獻問題,限制了它們在醫藥和學術界的實用性。 PubMed DOI

Rodriguez-Nava 等人進行了一項概念驗證研究,探討如何利用安全的大型語言模型(LLM)來獲得醫療數據的批准。他們的研究專注於回顧性識別中心靜脈導管相關血流感染(CLABSIs),這是一種特定的醫療相關感染(HAI),並使用真實病人的數據進行監測。研究結果顯示,LLMs 有潛力顯著提升 HAI 監測的效率,並能部分自動化或簡化這個過程。 PubMed DOI

公共衛生干預措施如疫苗接種和社交距離的成效,依賴於公眾的支持與遵守。社交媒體成為評估公眾參與的重要工具,但在緊急情況下,缺乏即時監測可能導致反應延遲。為此,我們開發了PH-LLM(公共衛生大型語言模型),專注於即時公共衛生監測,並建立了多語言數據集。PH-LLM在多項任務中表現優於其他模型,顯示其在公共衛生資訊監測上的潛力,能有效增強政策制定與危機應對。此研究部分由NIH贈款支持。 PubMed DOI

這項研究評估了大型語言模型(LLMs),如ChatGPT 3.5、ChatGPT 4.0和Gemini,對自體免疫疾病臨床問題的回答效果。共提出46個問題,並由專家根據五個質量維度進行評估。結果顯示,ChatGPT 4.0在所有維度上表現優於其他兩者,平均得分為199.8,顯示其在相關性、正確性、完整性、有用性和安全性方面的顯著優勢。整體而言,ChatGPT 4.0在提供準確且有用的醫療資訊上,顯示出更高的效能,顯示大型語言模型在醫療服務中的潛力。 PubMed DOI

這項研究發現,ChatGPT-4o在分析敗血症患者臨床紀錄、評估抗生素和導管管理上表現不錯,但在隔離措施和壓瘡辨識上有失誤。整體來說,LLMs有潛力成為臨床感染控制的輔助工具。 PubMed DOI

這項研究比較了ChatGPT、Gemini和Copilot在回答結核病問題的表現。ChatGPT整體表現最佳,資訊最相關;Gemini在預防控制方面較強;Copilot在疾病管理上較弱。三者在診斷表現差不多。共同缺點是缺乏來源和不確定性標註。總結來說,三款AI都能回答結核病問題,但資訊透明度和參考來源還有待加強,這對醫療應用很重要。 PubMed DOI

這項研究比較了10款大型語言模型在提供梅毒資訊的表現,發現ChatGPT 4.0和Claude的正確率最高,但有些模型在複雜議題上表現不佳,還會出現過時或錯誤的資訊。只有六成AI生成內容能直接用於臨床,顯示專家審核仍不可或缺。 PubMed DOI