原始文章

傳染病對公共健康造成重大挑戰,因此需要主動監測來保護社會健康。像世界衛生組織(WHO)等機構主要以英語分享數據,這對非英語使用者,特別是中東地區的人來說,理解上有困難。為了解決這個問題,我們推出了InfectA-Chat,一個專為阿拉伯語設計的語言模型,具備英語問答能力。該模型經過大量數據微調,並採用檢索增強生成(RAG)方法,能夠獲取最新的傳染病資訊,顯示出優越的性能,並促進公共健康倡議。 PubMed DOI


站上相關主題文章列表

研究評估了ChatGPT在處理細菌感染和抗生素敏感性相關問題以及臨床案例中的效果。結果顯示ChatGPT在回答理論問題表現不錯,但在臨床案例管理上有限制,例如識別抗藥機制和抗生素處方。ChatGPT可作為醫學教育和分析工具,但不宜取代專家諮詢在複雜決策中的重要性。 PubMed DOI

這項研究評估了AI模型在回應英語和阿拉伯語的傳染病問題上的表現,強調多語言環境中獲得準確資訊的公平性。研究比較了ChatGPT-3.5、ChatGPT-4、Bing和Bard在15個與HIV/AIDS、結核病等疾病相關問題上的表現。結果顯示,AI在英語的表現明顯優於阿拉伯語,Bard得分最高。雖然阿拉伯語表現較低,但未達統計顯著性。研究指出,AI在英語的完整性和準確性優於阿拉伯語,建議開發者應改善阿拉伯語使用者的健康資訊獲取。 PubMed DOI

這項研究評估了兩個人工智慧模型,ChatGPT-4 和 Gemini,在回答病毒學多選題的表現,涵蓋英語和阿拉伯語。研究使用 CLEAR 工具分析了 40 道題目的回答正確性,結果顯示 ChatGPT-4 在兩種語言中均優於 Gemini,英語正確率分別為 80% 和 62.5%,阿拉伯語則為 65% 和 55%。兩者在較低認知領域表現較佳,結果顯示人工智慧在醫療教育中的潛力,並強調了提升多語言有效性的必要性。 PubMed DOI

這項研究探討了OpenAI的ChatGPT如何協助公共衛生工作者開發疾病傳播模型,以制定感染控制策略。透過案例研究,公共衛生工作者與ChatGPT合作,創建符合10天流行病學數據的數學模型,並進行代碼生成、精煉和除錯,估算基本繁殖數(Ro)和最終疫情規模。最終模型重現疫情曲線,Ro為4.19,最終疫情規模達98.3%。研究顯示,ChatGPT能加速模型開發,降低技術門檻,改善全球疫情應對能力,特別在資源有限的環境中。 PubMed DOI

針對大型語言模型(LLM)在回答感染預防問題的準確性和完整性進行的調查顯示,這些模型的準確率高達98.9%,完整性為94.6%。這顯示它們在這個領域的問題上是可靠的資源。研究結果指出,LLM可能成為感染預防諮詢的有價值補充,值得進一步探討在醫療環境中的應用,能增強決策能力,並為醫療專業人員提供額外支持。 PubMed DOI

這項研究評估了三個大型語言模型(LLMs)—ChatGPT-3.5、ChatGPT-4.0 和 Google Gemini 在回答乙型肝炎病毒(HBV)相關問題的表現。醫療專業人員對其準確性進行評分,並評估可讀性。 主要發現包括: - 所有 LLM 在主觀問題上得分高,ChatGPT-4.0 準確性最高。 - 在客觀問題上,ChatGPT-4.0 準確率為 80.8%,優於其他兩者。 - ChatGPT-4.0 在診斷上表現佳,Google Gemini 在臨床表現強勁。 - 所有 LLM 的可讀性分數高於標準八級,對一般讀者來說可能過於複雜。 結果顯示,LLMs,特別是 ChatGPT-4.0,可能成為有關 HBV 的資訊工具,但不應取代醫生的個人化建議。 PubMed DOI

這項研究評估了大型語言模型(LLMs),如ChatGPT-3.5、ChatGPT-4和Google Bard,在提供疾病流行病學數據的準確性。研究設計了21個問題,並將其提交給每個模型兩次。結果顯示,ChatGPT-4的準確率最高,達76.2%,其次是Bard的50.0%和ChatGPT-3.5的45.2%。雖然ChatGPT-4表現較佳,但三者皆存在不準確性和參考文獻問題,限制了它們在醫藥和學術界的實用性。 PubMed DOI

Rodriguez-Nava 等人進行了一項概念驗證研究,探討如何利用安全的大型語言模型(LLM)來獲得醫療數據的批准。他們的研究專注於回顧性識別中心靜脈導管相關血流感染(CLABSIs),這是一種特定的醫療相關感染(HAI),並使用真實病人的數據進行監測。研究結果顯示,LLMs 有潛力顯著提升 HAI 監測的效率,並能部分自動化或簡化這個過程。 PubMed DOI

公共衛生干預措施如疫苗接種和社交距離的成效,依賴於公眾的支持與遵守。社交媒體成為評估公眾參與的重要工具,但在緊急情況下,缺乏即時監測可能導致反應延遲。為此,我們開發了PH-LLM(公共衛生大型語言模型),專注於即時公共衛生監測,並建立了多語言數據集。PH-LLM在多項任務中表現優於其他模型,顯示其在公共衛生資訊監測上的潛力,能有效增強政策制定與危機應對。此研究部分由NIH贈款支持。 PubMed DOI

這項研究評估了大型語言模型(LLMs),如ChatGPT 3.5、ChatGPT 4.0和Gemini,對自體免疫疾病臨床問題的回答效果。共提出46個問題,並由專家根據五個質量維度進行評估。結果顯示,ChatGPT 4.0在所有維度上表現優於其他兩者,平均得分為199.8,顯示其在相關性、正確性、完整性、有用性和安全性方面的顯著優勢。整體而言,ChatGPT 4.0在提供準確且有用的醫療資訊上,顯示出更高的效能,顯示大型語言模型在醫療服務中的潛力。 PubMed DOI