原始文章

本研究探討生成式人工智慧(GenAI)在臨床微生物學和傳染病諮詢中的應用潛力。透過評估四款聊天機器人(如GPT-4.0),研究發現GPT-4.0在事實一致性、全面性及無醫療危害性方面表現優於其他兩款。專家對AI回應的評分顯著高於住院醫師,且專家認為回應“無害”的可能性更高,但仍有少於兩成的回應被認為無害。研究強調醫療人員的專業知識對AI回應的解讀影響深遠,並指出目前無AI模型可在無人監督下安全使用於臨床。 PubMed DOI


站上相關主題文章列表

研究評估了ChatGPT在處理細菌感染和抗生素敏感性相關問題以及臨床案例中的效果。結果顯示ChatGPT在回答理論問題表現不錯,但在臨床案例管理上有限制,例如識別抗藥機制和抗生素處方。ChatGPT可作為醫學教育和分析工具,但不宜取代專家諮詢在複雜決策中的重要性。 PubMed DOI

2022年11月推出的ChatGPT引起了對大型語言模型在臨床環境中應用的關注。最近一項針對英國全科醫生的調查顯示,20%的醫生已在臨床實踐中使用生成式人工智慧工具。使用者中,29%用於生成就診後文檔,28%用於建議鑑別診斷。儘管醫生認為這些工具在行政和臨床推理上有價值,但缺乏明確的指導和政策,醫療界面臨著教育專業人員和患者的挑戰。 PubMed DOI

抗微生物抗藥性是全球健康的重要議題,亟需創新策略來改善抗生素管理。AI 聊天機器人,特別是大型語言模型,能協助臨床醫師優化抗生素治療。本研究回顧了過去五年相關文獻,發現AI 聊天機器人能提供抗生素建議、增強醫學教育及改善臨床決策,但仍面臨臨床細節管理不一致、算法偏見及數據隱私等挑戰。未來需進行嚴格的臨床試驗及跨學科合作,以確保其安全有效地應用於臨床。 PubMed DOI

抗微生物抗藥性(AMR)對全球健康構成嚴重威脅,預計到2050年每年可能造成1000萬人死亡。為了有效應對,公共衛生訊息需針對不同受眾調整。本研究評估了ChatGPT-4生成適合文化和語言的AMR意識內容的能力。專家們識別了AMR的主要貢獻者,並開發了多語言的內容。雖然ChatGPT-4在生成定制內容方面顯示潛力,但質量差異顯著,需專業審查。未來研究應聚焦於完善提示和整合反饋,以提升內容有效性。 PubMed DOI

本研究探討AI模型(如GPT-3.5和GPT-4)在急診科生成病症鑑別診斷的表現,並與急診科醫師的準確性進行比較。結果顯示,ChatGPT-4的準確率為85.5%,略高於ChatGPT-3.5的84.6%和醫師的83%。特別是在腸胃主訴方面,ChatGPT-4的準確性達87.5%。研究顯示AI模型在臨床決策中具潛在應用價值,建議未來進一步探索AI在醫療中的應用。 PubMed DOI

大型語言模型(LLMs)在醫療領域的應用日益增多,能協助診斷和治療感染。一項研究比較了全科醫生與六個LLMs(如ChatGPT、Gemini等)對24個臨床案例的反應。全科醫生在診斷和抗生素處方的準確率高達96%-100%,但在劑量和療程的準確性上較低(50%-75%)。LLMs的表現也不錯,但在參考指導方針的能力上不一致,特別是在挪威的表現不佳。研究指出LLMs有數據洩漏的風險,雖然它們在抗生素處方上有潛力,但全科醫生在臨床情境解釋和指導方針應用上仍更具優勢。 PubMed DOI

生成式人工智慧(GenAI)在醫療服務中有潛力,尤其是在臨床環境。不過,實際臨床的複雜性需要謹慎且基於證據的方法來確保AI的安全與有效性。本研究將系統性評估四個知名的GenAI模型(Claude 2、Gemini Pro、GPT-4.0及一個自訂的GPT-4.0聊天機器人),並針對臨床微生物學和傳染病領域進行分析。評估將由兩組專業醫師進行,使用5點李克特量表來檢視回應的事實一致性、全面性、一致性及潛在醫療危害。研究將提供GenAI在臨床應用的見解,並強調制定倫理指導方針的重要性。 PubMed DOI

這項研究比較了經驗豐富的社區護理師與先進的生成式人工智慧(GenAI)在診斷準確性和臨床決策能力的表現。研究於2024年5至6月進行,114名以色列護理師參與,並針對四個醫療案例進行問卷調查。同時,收集了三個GenAI模型的回應。結果顯示,在10字限制下,護理師的準確性優於GenAI,雖然GenAI回應速度較快,但常顯得冗長。研究認為,儘管GenAI有潛力輔助護理,但目前人類醫師在臨床推理上仍具優勢,需進一步研究才能有效取代護理專業知識。 PubMed DOI

本研究探討生成式人工智慧(AI)在罕見疾病資訊上的準確性與安全性。研究評估了四個AI模型的回答,結果顯示大部分模型提供的資訊相對可靠,但仍有不準確的情況,可能讓患者及其家庭感到困惑。特別是Perplexity模型的表現較差,低分比例較高。研究強調了解AI的局限性並提供專家指導的重要性,以確保患者能有效利用這些工具。 PubMed DOI

這項研究評估了三個生成式人工智慧模型—ChatGPT-4o、Gemini 1.5 Advanced Pro 和 Claude 3.5 Sonnet—在創建與高血壓和糖尿病相關的藥理學問題的有效性。使用一次性提示,這些模型生成了60個問題,並由多學科小組進行可用性評估。103名醫學生在考試中回答了AI生成的問題,結果顯示AI問題的正確率與專家問題相當,且AI生成問題的準備效率顯著提升。然而,仍有19個問題被認為無法使用,顯示專家審查的重要性。結合AI效率與專家驗證的方式,可能是改善醫學教育的最佳策略。 PubMed DOI