原始文章

這項研究探討自動ICD編碼的挑戰,對保險理賠和疾病研究非常重要。由於臨床筆記複雜且變化多,手動編碼常常慢且易出錯。為了提升大型語言模型(LLMs)的表現,作者提出了一個微調框架,結合標籤注意機制、醫學知識注入及知識驅動的抽樣。實驗結果顯示,這個框架在MIMIC-III-50數據集上表現優於傳統微調方法,特別是在編碼器-解碼器模型中,準確率和F1分數都有顯著提升。 PubMed DOI


站上相關主題文章列表

LLMs可協助自動化醫療行政工作,減輕醫師電子病歷負擔,提升病人護理。應注意安全、隱私、法規合規,並強調LLMs應輔助而非取代人類關懷。結合LLMs與專業知識可提升病人護理品質。在臨床環境中謹慎實施LLMs至關重要。 PubMed DOI

這項研究探討利用自然語言處理(NLP)來自動化ICD-10-CM編碼系統,以提升基於自由文本的出院摘要編碼效率與準確性。研究以高雄醫學大學中和紀念醫院的病人出院摘要為數據集,開發了基於GPT-2模型的AI輔助編碼系統,並整合進專家工作流程中。結果顯示,該系統在編碼準確性上表現良好,F1分數達0.667,且與專家之間的協議程度也相對較高,顯示出其在提升醫療編碼效率的潛力。 PubMed DOI

臨床敘述的摘要對編碼人員來說非常重要,但臨床文本的複雜性卻帶來挑戰。最近的研究顯示,大型語言模型(LLMs)在摘要臨床文本方面有潛力,特別是在放射學和心臟超音波領域。研究團隊從MIMIC-III資料庫創建了一個數據集,並對兩個開源LLM進行微調,結果發現生物醫學預訓練模型的表現優於一般模型。這顯示針對臨床領域的LLM能成為編碼人員的有用工具,未來應該調整更先進的模型以提升表現。 PubMed DOI

這項研究探討增強檢索生成(RAG)的大型語言模型(LLMs)在急診科臨床紀錄中生成ICD-10-CM代碼的有效性,並與醫療提供者進行比較。研究基於Mount Sinai Health System的500次急診就診數據,發現RAG增強的LLMs在準確性和特異性上均優於醫療提供者,且GPT-4的表現尤為突出。即使是較小的模型如Llama-3.1-70B,經過RAG後也顯示出顯著提升。這顯示生成式人工智慧在改善醫療編碼準確性及減少行政負擔方面的潛力。 PubMed DOI

這項研究評估大型語言模型(LLMs)在從非結構化住院病歷中提取ICD-10-CM代碼的效果,並與人類編碼員進行比較。測試的模型包括GPT-3.5、GPT-4等,共分析50份去識別化的病歷。人類編碼員識別出165個獨特代碼,平均每份病歷4個。雖然LLMs的中位數代碼數量較高,GPT-4表現最佳,但與人類編碼員的符合率仍然較低,顯示目前LLMs在準確提取ICD-10-CM代碼上仍有挑戰。 PubMed DOI

這項研究評估了六種大型語言模型(LLMs)在從病人筆記中提取ICD-10-CM代碼的表現,並與人類編碼員進行比較。結果顯示,人類編碼員提取了165個代碼,而LLMs提取的數量明顯更多,Llama 2-70b以658個代碼領先。GPT-4與人類的協議百分比最高,但整體協議程度極低。Claude 3在主要診斷方面表現最佳。研究指出,LLMs在提取過程中存在不一致,整體表現仍不及人類編碼員。 PubMed DOI

癌症案例報告的主要挑戰在於手動審查大量報告的繁瑣過程。目前的做法多依賴基於規則的系統或自訂的監督學習模型來預測診斷代碼。雖然這些方法有潛力,但在實際應用中可能受到偏見影響。我們針對肺癌進行的可行性研究中,開發了一個檢索增強生成(RAG)系統,利用大型語言模型(LLMs)進行癌症登記編碼。結果顯示,未微調的LLMs也能有效運作,且透過提示工程可顯著提升表現,為癌症登記員提供了提高效率與準確性的有力工具。 PubMed DOI

這項研究探討了使用先進的大型語言模型,如ChatGPT 3.5和ChatGPT 4,來提升醫療紀錄中ICD-10代碼的分類準確性,特別是針對現有方法識別為假陰性的紀錄。研究在MIMIC IV數據集的802份出院摘要上進行,結果顯示ChatGPT 4的匹配率為86%到89%,明顯優於ChatGPT 3.5的57%到67%。雖然經驗豐富的人類編碼員表現更佳,但ChatGPT 4的準確性已達到人類編碼員的中位數。這顯示將這類模型整合進臨床編碼中,能提升醫療文檔的準確性,特別在複雜案例中。 PubMed DOI

這項研究探討了如何利用大型語言模型GPT-4來協助醫療編碼員進行ICD-10編碼。研究目的是透過關鍵詞識別來增強編碼過程,並採用檢索增強生成(RAG)方法。使用的CodiEsp-X數據集包含1000個西班牙臨床案例及其編碼,並創建了專注於關鍵詞的CodiEsp-X-lead數據集。雖然關鍵詞提取的F1分數達到0.80,但整體可解釋性F1分數僅為0.305,顯示出編碼分配的效果不佳。未來研究應著重於改善系統與醫療編碼員的工作流程對接,以提高準確性。 PubMed DOI

大數據與人工智慧在醫療保健中結合,特別是透過電子健康紀錄(EHR)的分析,能顯著提升診斷準確性。然而,處理大量非結構化數據是一大挑戰。本研究探討大型語言模型(LLMs)在分類含排版錯誤的EHR文本的有效性。研究以哈哲特佩大學的兒科急診室數據為例,經微調的GPT-3模型在識別呼吸道感染病例上達到99.88%準確率,顯著優於預訓練模型的78.54%。結果顯示,微調的LLMs能高效分類非結構化EHR數據,提升醫療數據處理的效率與可靠性。 PubMed DOI