LLM 相關三個月內文章 / 第 106 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

藥物引起的肝損傷(DILI)是藥物安全性的重要議題,也是急性肝衰竭的主要原因。傳統的文獻搜尋方法因藥物相互作用的複雜性而效率不高,且手動整理容易出錯。近期,利用大型語言模型(LLMs)如LLaMA-2,研究人員開發了專門用於DILI分析的模型,並在CAMDA 2022的數據集上達到97.19%的準確率,顯示出LLMs在文獻識別上的潛力,可能簡化監管審查流程。 相關文章 PubMed DOI

這項研究探討大型語言模型(LLMs)在醫療應用中的準確性與能耗之間的平衡,特別分析了Meta的Llama 2和LMSYS Org的Vicuna 1.5。研究使用印第安納大學的胸部X光影像資料庫,發現Vicuna 1.5在效率和準確率上表現優於Llama 2。Llama 2的70B模型能耗是7B版本的七倍,但準確率卻較低,效率比僅22.30。結論指出,較小且經過微調的LLMs在醫療應用中更具可持續性,強調選擇模型的重要性,需平衡性能與環境影響。 相關文章 PubMed DOI

這篇系統性回顧強調虛擬實境(VR)在外科教育中的重要性,並指出其相對於傳統訓練的優勢。根據PRISMA指導方針,分析了1926篇研究,最終納入31篇。主要發現顯示,VR在外科模擬中效果顯著,特別是在解剖視覺化、手術計畫和技能評估方面。使用VR模擬器的初學外科醫生在信心、準確性和決策能力上都有明顯提升。不過,回顧也提到VR在病人溝通和團隊訓練上的應用仍需加強。VR在整形及重建外科的教學潛力很大,但仍需進一步研究以發展針對性的訓練方法。 相關文章 PubMed DOI

在2023年8月的一項分析中,對ChatGPT-3.5和Bard(Google Gemini)在回答12個懷孕問題的表現進行比較。根據美國婦產科醫學會的標準,ChatGPT-3.5的可接受回答率為58%,而Bard則達到83%。此外,ChatGPT-3.5的參考資料全有問題,Bard只有8%不一致。整體來看,Bard在準確性上優於ChatGPT-3.5,但兩者都需進一步評估才能成為懷孕婦女的可靠資訊來源。 相關文章 PubMed DOI

這項研究評估了一個經過微調的大型語言模型(LLM)在識別骨轉移患者的有效性,並與放射科醫師的手動標註進行比較。研究分析了15,456名患者的報告,LLM在711份報告中準確率達97.9%,敏感度分別為98.8%、94.7%和94.3%。雖然放射科醫師的準確率和敏感度稍高,但LLM的分類時間僅需105秒,遠低於醫師的2312秒和3094秒。總體來看,這個LLM在檢測骨轉移方面表現出色,且速度更快。 相關文章 PubMed DOI

最近,人工智慧(AI)在青光眼管理上有很大潛力,能提升篩檢效果和診斷準確性,但整合過程中面臨挑戰,如數據標註繁瑣、診斷標準不一致及測試不足,這些都可能影響演算法的適用性。此外,AI的「黑箱」特性也讓醫療人員感到疑慮。未來可透過聯邦學習增強數據隱私,並利用多樣化數據改善演算法,還有智慧型手機的應用潛力。解決這些挑戰將有助於提升青光眼護理的品質。 相關文章 PubMed DOI

這項研究利用生成式人工智慧,特別是大型語言模型,來深入了解參加正念減壓(MBSR)計畫的乳腺癌患者。這個為期六週的課程包含冥想、身體掃描、哈達瑜伽和行走冥想,每次兩小時。25名參與者中,大多數對課程表示高度滿意。透過生成式人工智慧,研究能深入分析參與者的反饋,並識別不同的子群體。整體來看,MBSR計畫對許多人有助於管理乳腺癌相關的心理壓力。 相關文章 PubMed DOI

這篇論文探討大型語言模型(LLMs)在不同上下文中的價值表達穩定性,並分析了認知能力、知識和模型大小等因素。研究涵蓋21個來自六個家族的LLM,重點在於人際和個體層級的穩定性。主要發現包括:某些模型(如Mixtral和GPT-3.5)在價值表達上較為穩定,而模擬特定個性時,模型的穩定性會下降。研究建議未來需進一步探討LLMs如何模擬多樣化的人格,並發展更全面的評估方法。論文為理解LLMs的價值穩定性提供了基礎,並附上研究代碼。 相關文章 PubMed DOI

人工智慧(AI)正逐漸進入放射學,提升病人旅程的各個階段。系統性文獻回顧顯示,AI技術已在排程、影像獲取及重建等方面發揮作用,能降低CT輻射劑量並縮短MRI獲取時間,同時保持影像品質。AI還能協助檢測骨折或結節,並透過大型語言模型優化報告流程。雖然AI有潛力提升放射學效率和診斷準確性,但成功實施需與現有技術無縫整合,並提供有效性證據。未來,AI可能顯著改變放射科醫師的角色,提升病人護理品質。 相關文章 PubMed DOI

這項研究比較了使用生成預訓練變壓器(GPT)與傳統方法開發的臨床與專業技能評估(CPSA)項目的有效性、考官看法及成本。研究對象為最後一年醫學生,開發了兩組各六個案例,其中一個是用GPT創建的。分析239名學生的表現,結果顯示兩者在難度和區分能力上無顯著差異。考官反饋認為GPT案例具挑戰性和現實性,且使用GPT可節省57%的成本。研究顯示GPT能以較低成本產生相似質量的CPSA項目,未來可探討其在其他臨床領域的應用。 相關文章 PubMed DOI