原始文章

這項研究提出了一個創新的人工智慧解決方案,幫助泰國老年患者進行藥物管理,特別是解讀藥物標籤。研究測試了兩種模型:一個是結合EasyOCR和Qwen2-72b-instruct的兩階段模型,另一個是使用Qwen2-72b-VL的單階段視覺問答模型。兩者都以零樣本方式運作,並利用增強檢索生成技術。結果顯示,兩階段模型準確率高達94%,在上下文回憶和語義相似性方面表現優異,而單階段模型則反應更快,適合高流量環境。這項研究強調了人工智慧在醫療保健中的應用潛力。 PubMed DOI


站上相關主題文章列表

這項研究評估了大型語言模型(LLMs)在藥物審查中的表現,特別是劑量錯誤、藥物相互作用及基因組學建議的能力。研究測試了四個LLM,發現ChatGPT在劑量方案上表現良好,但對simvastatin的問題有例外。所有LLM都能識別warfarin的相互作用,但錯過metoprolol和verapamil的相互作用。Claude-Instant在治療監測上提供適當建議,而Gemini在基因組學上表現不錯。研究指出,LLM在藥物審查中有潛力,但整合進醫療系統對病人安全至關重要。 PubMed DOI

這項研究探討結合檢索增強生成(RAG)模型與大型語言模型(LLM),以提升國際詞彙中藥物名稱對應的準確性。研究過程中,將藥物成分名稱翻譯成英文,並使用日本藥品名稱,從OHDSI標準詞彙中提取藥物概念。結果顯示,LLM + RAG的組合表現顯著優於傳統方法,命中率超過90%,而基準僅64%。此外,r-precision指標也從23%提升至41%至50%。整體而言,RAG與LLM的整合提供了更有效的全球藥物資訊對應方法。 PubMed DOI

這項評估針對五種大型語言模型(LLMs)在重症護理藥物治療問題上的表現進行測試,結果顯示ChatGPT-4的準確性最高,達71.6%。LLMs在知識回憶問題上表現較好,但在知識應用問題上則不及藥學博士學生(學生準確性81%)。使用思考鏈提示可提升ChatGPT-4的準確性至77.4%。這顯示LLMs在特定領域仍需進一步訓練,以改善其應用能力,對於全面藥物管理的使用應謹慎。 PubMed DOI

這項研究探討大型語言模型(LLMs),特別是OpenAI的GPT-4,如何提升自然語言查詢(NLQs)轉換為藥物監測(PV)數據庫中的SQL查詢的準確性。研究分三個階段,變化查詢複雜度,並評估有無商業上下文文件的效果。結果顯示,NLQ轉換為SQL的準確性從8.3%提升至78.3%,在所有複雜度層級中均一致。排除高複雜度查詢時,準確率可達85%。這項研究對非技術用戶在數據密集型領域的信息可及性具有重要意義。 PubMed DOI

這項研究探討檢索增強生成(RAG)模型在術後鼻整形問題上的應用,目的是提升人工智慧在醫療中的準確性與可靠性。研究評估了四個RAG模型對30個常見病人詢問的回應,結果顯示雖然41.7%的回應完全準確,但非回應率高達30.8%,顯示理解上下文的挑戰。Gemini-1.0-Pro-002在全面性上表現佳,但可讀性和易懂性不足,而PaLM 2的可行性評分最低。這項研究強調了RAG在減輕醫師負擔和提升病人參與度的潛力,但也指出在臨床應用中需解決非回應和上下文理解的問題。 PubMed DOI

這篇論文探討了一個智能藥物助手的開發,目的是透過個性化的藥物建議來改善抑鬱症治療。助手利用先進技術,如大型語言模型(LLMs),分析病人的病歷和健康狀況,提供更準確的建議。研究分析了40個需要精神科監測的案例,測試了十個LLMs,結果顯示商業模型GPT-4的表現優於開源模型Llama-3,顯示出在心理健康領域的顯著進步。 PubMed DOI

與藥物相關的傷害對全球醫療成本和病人結果影響深遠。生成式人工智慧(GenAI)和大型語言模型(LLM)在降低這些風險上展現潛力。本次回顧分析了2012年1月到2024年10月的文獻,找到3988篇文章,最終納入30篇。GenAI和LLM的應用可分為三個領域:識別藥物相互作用、提供臨床決策支持及增強藥物監測。雖然這些模型在早期識別不良藥物事件上有潛力,但尚缺乏前瞻性測試,需進一步研究其整合與實際應用。 PubMed DOI

這項研究探討了基於GPT-4的檢索增強生成(RAG)模型在術前評估中的有效性。研究測試了十個大型語言模型,生成超過3,200個回應,並與近450個人類答案進行比較。結果顯示,使用國際指導的GPT-4 LLM-RAG模型準確率達96.4%,明顯高於人類的86.6%,且反應時間更快、不一致情況較少。這顯示LLM-RAG模型在醫療環境中提升術前評估的潛力。 PubMed DOI

這項研究評估了三個生成式人工智慧模型—ChatGPT-4o、Gemini 1.5 Advanced Pro 和 Claude 3.5 Sonnet—在創建與高血壓和糖尿病相關的藥理學問題的有效性。使用一次性提示,這些模型生成了60個問題,並由多學科小組進行可用性評估。103名醫學生在考試中回答了AI生成的問題,結果顯示AI問題的正確率與專家問題相當,且AI生成問題的準備效率顯著提升。然而,仍有19個問題被認為無法使用,顯示專家審查的重要性。結合AI效率與專家驗證的方式,可能是改善醫學教育的最佳策略。 PubMed DOI

多重用藥在老年人中很常見,可能引發不良事件如跌倒。減藥能降低這些風險,但在急診環境中實施面臨挑戰。本研究評估了一個大型語言模型(LLM)管道,利用三組標準來找出急診老年患者的減藥機會。結果顯示,LLM在篩選減藥標準上表現優於醫學生,但在提出具體建議時效果不佳。研究強調需更清晰的減藥指導及改善AI與臨床醫師的整合。 PubMed DOI