原始文章

這項研究探討了電子健康紀錄(EHRs)中非結構化醫療文本的標準化挑戰,因為這些文本格式不一致。約80%的EHR數據是非結構化的,作者使用大型語言模型(LLMs)來標準化這些文本,開發了四種策略,包括RAGnorm。研究評估了這些策略在三個SNOMED映射的病症術語數據集上的表現,結果顯示RAGnorm在所有數據集中的表現最佳,且在TAC2017任務中獲得88.01的微F1分數,顯示其在標準化生物醫學文本方面的潛力。 PubMed DOI


站上相關主題文章列表

一項新研究介紹了一個名為GatorTronGPT的語言模型,專門針對醫療保健領域的生物醫學自然語言處理進行訓練。這個模型能生成合成文本,有助於提升NLP模型的效能。研究結果顯示,GatorTronGPT生成的文本在可讀性和臨床相關性上與人類生成的文本相當。這項研究強調了在醫學研究和醫療保健領域運用大型語言模型的潛力和挑戰。 PubMed DOI

在醫療領域,使用大型語言模型(LLMs)是重要進步,有助於改善病患護理、研究和教育。雖然LLMs有不完美之處,但透過提示工程和檢索增強生成(RAG)等策略,可以提高準確性和相關性。尤其在臨床決策等需要全面資訊的任務中,RAG是相當有幫助的。一個以KDIGO 2023慢性腎臟病指南為基礎的ChatGPT模型整合了RAG,展現了提供準確醫療建議的潛力。 PubMed DOI

這項研究系統性回顧了生成性大型語言模型(LLMs)在臨床環境,特別是電子健康紀錄(EHRs)的應用。儘管自然語言處理技術進步,LLMs在臨床實踐中的整合仍有限,面臨多重挑戰。研究分析了自2023年以來的76篇相關文獻,發現包括提示工程的使用、少數多模態數據的應用、評估指標的多樣性,以及臨床決策中的偏見和幻覺等問題。未來需改進計算技術和標準化評估,以提升LLMs在醫療中的可靠性。總之,LLMs在病人護理上有潛力,但仍需克服重大障礙。 PubMed DOI

這項研究探討增強檢索生成(RAG)的大型語言模型(LLMs)在急診科臨床紀錄中生成ICD-10-CM代碼的有效性,並與醫療提供者進行比較。研究基於Mount Sinai Health System的500次急診就診數據,發現RAG增強的LLMs在準確性和特異性上均優於醫療提供者,且GPT-4的表現尤為突出。即使是較小的模型如Llama-3.1-70B,經過RAG後也顯示出顯著提升。這顯示生成式人工智慧在改善醫療編碼準確性及減少行政負擔方面的潛力。 PubMed DOI

自然語言處理(NLP)在放射學等領域展現了將非結構化數據轉為結構化格式的潛力,但隱私問題使得數據集獲取困難。我們的目標是利用大型語言模型(LLMs)從救護人員與病人對話中提取醫療資訊,以填寫緊急應變程序表格。為此,我們開發了一個流程,使用"Zephyr-7b-beta"生成初步對話,再用GPT-4 Turbo進行精煉。初步結果顯示,"Zephyr-7b-beta"的準確率為94%,但經過精煉後略降至87%。這些結果顯示LLMs在醫療對話生成中的潛力與挑戰。 PubMed DOI

本研究綜合了近期在生物醫學領域中有關檢索增強生成(RAG)和大型語言模型(LLMs)的研究,旨在提供臨床發展的指導方針。透過系統文獻回顧和統合分析,研究納入了335項研究中的20項,結果顯示RAG顯著提升了模型表現,勝算比為1.35(P = .001)。報告詳細說明了臨床任務及評估方法,並提出在臨床環境中實施增強LLM的指導方針。未來研究應聚焦於RAG的整合與應用。 PubMed DOI

檢索增強生成(RAG)透過從資料庫中檢索知識來提升大型語言模型(LLMs)的表現,但傳統方法在檢索句子或段落時可能會引入噪音。為了解決這個問題,我們提出了BiomedRAG框架,將自動檢索的區塊文件直接輸入LLM。經過在四個生物醫學自然語言處理任務和八個數據集的評估,BiomedRAG的表現平均提升了9.95%,並且在多項基準上達到最先進的結果,超越了4.97%。這個框架為生物醫學領域的LLM應用提供了更準確且可調整的方法。 PubMed DOI

這項研究開發了一個基於檢索增強生成的醫生推薦模型(RAGPR),旨在提升網路醫療服務中的個人化推薦。研究針對排班人員手動分診的限制,使用廈門大學第一附屬醫院的646,383份諮詢紀錄進行評估。結果顯示,SBERT和OpenAI的表現優異,F1分數分別達到95%和96%。在大型語言模型中,GPT-4o表現最佳,F1分數為95%。整體而言,RAGPR模型在提升醫療服務的準確性和個人化方面展現良好潛力,提供可擴展的病患與醫生匹配解決方案。 PubMed DOI

這項研究評估大型語言模型(LLMs)在生成臨床試驗計畫書的有效性。研究人員使用LLM生成不同疾病和試驗階段的計畫書,並根據臨床思維、透明度、醫學術語和內容相關性四個標準進行評估。結果顯示,LLM在內容相關性和術語方面表現良好,但在臨床思維和透明度上則較差。為提升表現,研究人員採用檢索增強生成(RAG)方法,顯著改善了內容質量,提升了臨床思維和透明度的分數。這表明RAG方法能有效提升LLM在臨床試驗文件撰寫的可用性,並可能改變藥物開發過程。 PubMed DOI

這項研究聚焦於醫療概念標準化(MCN),強調數據質量對其表現的重要性,並提出一個框架來提升數據質量,利用像ChatGPT這樣的大型語言模型。研究評估了MCN數據集的質量,並透過ChatGPT進行數據增強,分析生成數據的正確性。實驗探討數據質量對MCN模型的影響,並指出增強過程中的數據重複問題。最終,研究認為少樣本學習結合適當的上下文是提升MCN數據質量的有效方法,並提供了寶貴的見解。如需詳情,可參考提供的GitHub連結。 PubMed DOI