原始文章

這項研究比較了兩種模型在預測住院情況的表現,分別是深度學習模型Bio-Clinical-BERT和詞袋邏輯回歸模型BOW-LR-TF-IDF。研究基於Mount Sinai Health System近140萬名患者的數據,結果顯示Bio-Clinical-BERT的接收者操作特徵曲線下面積(AUC)得分為0.82到0.85,優於BOW-LR-TF-IDF的0.81到0.84。雖然兩者性能差異不大,但都能有效利用分診筆記進行預測。研究強調在資源有限的情況下,簡單模型也能滿足需求,並建議進一步研究以提升醫療預測能力。 PubMed DOI


站上相關主題文章列表

醫師需要快速做決定,預測模型能預測臨床事件,提供幫助。傳統模型有限制,但透過臨床註記訓練語言模型,可以打造更多功能的預測引擎。開發了醫學語言模型(NYUTron),並在預測再入院和死亡方面進行微調,比傳統模型更準確。對臨床文本進行預訓練,再針對不同地點進行微調,可以增強泛化能力。成功在試驗中應用,顯示臨床語言模型有潛力協助醫師即時做決定。 PubMed DOI

研究比較了不同NLP模型在擷取非小細胞肺癌患者影像報告中的癌症結果。結果顯示,DFCI-ImagingBERT表現最佳,但簡單模型也不錯。若資源有限,簡單機器學習模型仍可有效。 PubMed DOI

這項研究專注於將電子健康記錄中的文本組織成不同部分,並將其歸類為不同類別。研究人員結合了監督式學習模型中的特定數據集知識和大型語言模型(LLMs),發現零-shot LLMs 在跨領域數據上的表現優於監督式基於BERT的模型。通過集成技術結合兩種模型的優勢進一步提高了性能。 PubMed DOI

研究使用大型語言模型如GPT和BERT自動記錄急診科臨床診斷,並進行BERT微調。透過XAI和SHAP方法分析模型,結果顯示KLUE-RoBERTa表現最佳,XAI提供可靠解釋。研究指出LLMs或許可簡化韓國急診科電子病歷記錄。 PubMed DOI

在大型醫療系統中,準確編碼醫學診斷和程序對於高效的醫療管理、品質改善、研究和報酬至關重要。使用自然語言處理(NLP)能簡化手動編碼,但最佳使用方法尚未廣為人知。雖然大型語言模型(LLMs)受歡迎,但非所有任務都需要其複雜程度。一項研究指出,傳統NLP技術在預測手術程序代碼方面表現優於BERT,具有高準確性和可解釋性,並提出了複雜度衡量標準,強調NLP在減少編碼錯誤方面的潛力。 PubMed DOI

社會健康決定因素(SDoH)對健康影響很大,其中住房穩定性至關重要。電子健康記錄(EHRs)中包含有用的SDoH資訊,但常為非結構化,需要透過自然語言處理(NLP)進行分析。新的NLP技術如GPT-4能有效辨識住房不穩定性,雖然在偵測上有高召回率,但精確度較低。LLMs提供擴展且成本效益高的解決方案,同時召回率也較高。結合LLMs和人工審查可提高數據分析效率,支持醫療系統提供更主動的病人護理。 PubMed DOI

人工智慧和大型語言模型可輔助急診室運作,幫助醫生判斷病人是否需要住院。一項使用紐約市醫院真實數據的研究發現,GPT-4模型在預測急診病人入院情況方面表現優異。建議大型語言模型可成為醫療決策支援工具,進一步改進以提高效能。 PubMed DOI

研究專注於從電子健康記錄中提取社會健康決定因素,以改善健康公平。研究建立跨機構數據集,開發分類模型,包括大型語言模型,從不同醫療機構的臨床註釋中檢測SDoH因素。研究發現不同病人群、註釋類型和醫院有不同的SDoH記錄實踐和標籤分佈。LLM在辨識SDoH因素方面表現最佳,但在跨數據集泛化上仍有挑戰。為促進合作,研究提供了PhysioNet存儲庫上的註釋數據集和模型訪問權。 PubMed DOI

這項研究探討大型語言模型(LLMs),特別是GPT-4和GPT-3.5,如何分析急診部報告以識別與腎結石相關的就診。研究使用標註過的數據集,透過提示優化和微調來提升模型表現。結果顯示,GPT-4的宏觀F1分數達0.833,明顯優於基準系統的0.71,而GPT-3.5則為0.796。研究還發現,GPT-4在種族和性別偏見方面表現良好,顯示出其在臨床文本分析的潛力。 PubMed DOI

這項研究強調在醫療照護中評估健康社會決定因素(SDoH)的重要性,以改善病患照護並縮小健康差距。研究探討了電子健康紀錄(EHRs)中SDoH數據不足的挑戰,主要因為缺乏標準化的診斷代碼。研究團隊使用大型語言模型(如BERT和RoBERTa)來分類無家可歸、食物不安全和家庭暴力等SDoH概念,並創建合成訓練數據集。結果顯示,這些模型能有效提取SDoH資訊,幫助醫療提供者識別高風險病患,進而實施針對性干預,支持減少健康差距的努力。 PubMed DOI