原始文章

這項研究用 Llama 3.0 大型語言模型分析兩家醫院的病歷,來偵測手術部位感染。28位病人中,LLM準確率達93%,敏感度100%,特異度86%。模型多半能和醫師一樣早,甚至更早發現感染。結果顯示 LLM 有潛力協助醫療篩檢,但臨床應用前還需更多研究驗證。 PubMed DOI


站上相關主題文章列表

針對大型語言模型(LLM)在回答感染預防問題的準確性和完整性進行的調查顯示,這些模型的準確率高達98.9%,完整性為94.6%。這顯示它們在這個領域的問題上是可靠的資源。研究結果指出,LLM可能成為感染預防諮詢的有價值補充,值得進一步探討在醫療環境中的應用,能增強決策能力,並為醫療專業人員提供額外支持。 PubMed DOI

這項研究比較了兩個開源大型語言模型,Llama-3 8B 和 Mixtral 8x7B,在預測敗血症的表現。新系統 COMPOSER-LLM 結合了大型語言模型,能從非結構化的臨床筆記中提取資訊。經過對 2,074 次病人就診的評估,Llama-3 8B 模型的敏感性為 70.3%,而 Mixtral 8x7B 的敏感性為 72.1%。結果顯示,較小的 Llama-3 模型在早期敗血症預測上表現良好,對資源有限的醫療環境特別重要。 PubMed DOI

這項研究探討如何利用大型語言模型(LLMs)來改善醫院的品質指標,特別是針對嚴重敗血症和敗血性休克的管理方案。研究團隊開發了一個基於LLM的系統,能自動化處理快速醫療互操作性資源(FHIR)數據,並與加州大學聖地牙哥醫療中心的100個手動抽象進行比較,達到90%的高一致性。專家審查指出,手動抽象中的錯誤影響了結果,顯示LLM的表現相當不錯。這項研究顯示LLMs能有效從電子健康紀錄中提取複雜的品質指標,提升醫療報告的效率與準確性。 PubMed DOI

Rodriguez-Nava 等人進行了一項概念驗證研究,探討如何利用安全的大型語言模型(LLM)來獲得醫療數據的批准。他們的研究專注於回顧性識別中心靜脈導管相關血流感染(CLABSIs),這是一種特定的醫療相關感染(HAI),並使用真實病人的數據進行監測。研究結果顯示,LLMs 有潛力顯著提升 HAI 監測的效率,並能部分自動化或簡化這個過程。 PubMed DOI

敗血症是一種因免疫反應不當而引起的嚴重疾病,死亡率高且併發症多。早期檢測和治療對病人預後至關重要,但現有模型常忽略臨床筆記中的重要資訊。本研究提出COMPOSER-LLM,一個開源的大型語言模型,能與COMPOSER模型協同工作,提升早期敗血症預測準確性。測試中,COMPOSER-LLM的敏感性達72.1%,假警報率低,顯示出優於原模型的表現,並強調了其臨床應用潛力。這標誌著醫療分析的一大進步。 PubMed DOI

這項研究發現,GPT-4o 在不用人工標註的情況下,能準確又有效率地從電子病歷資料做慢性病分類,表現比傳統規則式方法和其他 LLMs 更好。GPT-4o 召回率高達 0.97,macro-F1 分數也有 0.92。若結合 LLMs 和規則式方法,還能進一步提升準確度,讓人工審查更聚焦在有疑慮的案例上。 PubMed DOI

這項研究發現,ChatGPT-4o在分析敗血症患者臨床紀錄、評估抗生素和導管管理上表現不錯,但在隔離措施和壓瘡辨識上有失誤。整體來說,LLMs有潛力成為臨床感染控制的輔助工具。 PubMed DOI

這項研究發現,Llama-3 8B 雖然模型較小,但在從病歷擷取臨床徵象、預測早期敗血症的表現,幾乎和較大的 Mixtral 8x7B 一樣好。兩者都整合進 COMPOSER-LLM 系統,準確率相近。這代表運算效率高的小模型,也很適合資源有限的醫療現場使用。 PubMed DOI

這篇研究提出COMPOSER-LLM,把大型語言模型和現有敗血症預測工具結合,能同時分析結構化數據和臨床紀錄文字。實測2,500名病人,結果顯示新系統比傳統模型更準確,敏感度高、誤報少。即使有誤判,很多病人其實也有感染,證明這方法在臨床上很有幫助。整合LLM能更有效利用電子病歷,提升敗血症早期預測。 PubMed DOI

一項涵蓋13家醫院的研究發現,GPT-4-Turbo這種大型語言模型在判斷病人是否有近期長照機構接觸史時,準確度跟人工差不多甚至更高,速度快25倍、成本省20倍,還能抓出人工審查的錯誤。這代表AI能有效從醫療紀錄中擷取重要資訊,幫助提升感染控制和醫院作業效率。 PubMed DOI