原始文章

這項研究探討小型大型語言模型(sLLM)在從病理報告中提取關鍵資訊的效果。使用三個版本的Llama 2模型,參數從70億到700億不等,並在零樣本和五樣本學習情境下進行評估。結果顯示,700億參數的模型在五樣本情境下表現優異,顯示sLLM能有效提升數據提取的效率與準確性。研究強調範例學習的重要性,並討論模型大小、準確性及處理時間的權衡,支持在臨床環境中應用先進語言模型,以改善病人護理和生物醫學研究。 PubMed DOI


站上相關主題文章列表

研究比較了GPT-4等大型語言模型和傳統監督式模型在臨床註記中提取資訊的表現。結果顯示,對於標籤不平衡的任務,大型語言模型可能比監督式模型更有效。雖然大型語言模型減少了標註數據的需求,但監督式模型搭配詳細標註仍能提供相當結果。使用大型語言模型可加速臨床自然語言處理研究,減少對精心策劃數據集的需求,潛在增進臨床研究中自然語言處理變數的應用。 PubMed DOI

醫療機構的病理科常有重要資料,但提取資料常需手動且耗時。利用大型語言模型如ChatGPT和Google Bard能自動化這過程。將病理報告輸入模型,可輕鬆創建摘要報告,並匯出至Excel等工具。AI輔助的資料提取可提升研究效率和準確性,勝過手動方式。 PubMed DOI

大型語言模型(LLMs)是先進的神經網絡,能像人一樣回應,處理各種任務,如製作教材、摘要、提取資料、報告、寫程式和解讀圖像。使用時要謹慎,驗證來源至關重要。整合LLMs到臨床實務需謹慎考慮,避免錯誤和過度依賴。本文探討LLMs的歷史和在病理學中的應用。 PubMed DOI

研究利用大型語言模型協助臨床醫生問心臟超聲心動圖報告,提升對複雜心臟病患見解,增進患者護理效率。研究收集西奈山醫療體系10年數據,每患者有10份報告。LLM模型LLaMA-2 70B回答問題準確率達90%,尤其在嚴重程度評估和診斷檢索表現較佳。研究顯示使用LLM解釋心臟超聲心動圖數據有效,比傳統搜索更佳,提高臨床決策和研究效率。 PubMed DOI

這項研究評估了一個開源的大型語言模型(LLM)在從急診腦部MRI報告中提取信息的表現。對比了放射科醫師和LLM在識別頭痛、異常發現以及MRI結果與頭痛之間因果關係方面的能力。LLM在這些任務中表現出高靈敏度和特異度,顯示其具有潛力在不需額外訓練的情況下從放射學報告中準確提取信息。 PubMed DOI

研究比較了GPT-4與傳統監督式模型在臨床註記中提取資訊的表現,結果顯示GPT-4在乳癌病理報告分類上表現優異,甚至超越其他LLMs和監督式模型。GPT-4的零-shot分類能力對標籤不平衡的任務特別有效。雖然LLMs減少了標註需求,但簡單模型配合大量標註資料也能達到相當效果。GPT-4有潛力加速臨床自然語言處理研究,減少標註需求,促進臨床研究中使用自然語言處理變數。 PubMed DOI

這項研究探討了使用開源、輕量級的生成大型語言模型(LLMs)來從腎臟病理報告中提取臨床資訊,特別針對狼瘡性腎炎。研究開發了一個標註架構並生成黃金標準數據集,評估了三個輕量級LLM的表現。結果顯示,Mistral和BioMistral的表現優於Llama 2,Mistral在腎小球亞型的F1分數達到0.996,免疫標記值的F1分數為0.898。這些結果顯示輕量級LLM在臨床資訊提取中的潛力,提供了資源密集型模型的可行替代方案。 PubMed DOI

本研究探討大型語言模型(LLMs),特別是GPT-3.5 turbo和GPT-4,如何提取肝細胞癌病理報告中的關鍵要素。考量到手動整理報告的困難,研究比較了LLMs與傳統的正則表達式(REGEX)方法的準確性。共分析了88份病理報告,重點在五個關鍵要素。結果顯示,LLMs和REGEX的提取準確性均相當,介於84.1%到94.8%之間。研究指出,LLMs有潛力顯著簡化提取過程,進而加速癌症研究的進展。 PubMed DOI

這項研究介紹了一個開源流程,利用本地的大型語言模型(LLM)"Llama 2" 從臨床文本中提取定量數據,專注於識別失代償性肝硬化的特徵。研究在MIMIC IV數據集中測試500名患者的病歷,成功識別五個關鍵臨床特徵,敏感度達100%,特異度96%。此外,對其他病症的檢測也相當高,顯示出本地部署的LLM在提取臨床信息方面的有效性,且硬體需求低。 PubMed DOI

這項初步研究探討了大型語言模型(LLM),特別是LLaMA3,如何從三級醫院的出院摘要中提取中風審核數據。研究分析了一個月內的中風住院病人出院摘要,成功提取144個數據點,LLM的準確率高達93.8%(135個正確)。結果顯示,LLM能有效提升中風審核數據的收集效率,並建議進一步研究以優化LLM與醫療專業人員的合作。 PubMed DOI