原始文章

罕見疾病(RDs)每2000人中影響不到1人,但全球約7%的人口受到影響,主要是兒童,且通常缺乏特定治療。患者的診斷過程漫長,平均需5年,可能影響健康。機器學習(ML)能改善患者管理與診斷。我們利用MIMIC-III數據庫及其他醫療筆記,建立了一個標記數據集,旨在早期檢測罕見疾病。應用多種機器學習技術後,SVM的F-measure達92.7%,AUC達96%,顯示ML在精準診斷罕見疾病方面的潛力,為未來研究提供資源。 PubMed DOI


站上相關主題文章列表

這項前瞻性觀察研究針對270名病人進行,最終260名完成研究。研究涵蓋慢性腎病、慢性肝病、結核病、癡呆症和心臟病等慢性疾病,並開發了三個機器學習模型。結果顯示,隨機森林模型在預測CKD和心臟病方面表現最佳,準確率分別為85.3%和88.2%。此外,邏輯回歸在預測TB和癡呆症上也有不錯的表現。研究強調機器學習在慢性疾病預測中的潛力,並建議未來進行多中心研究以驗證結果。 PubMed DOI

PhenoBrain是一個創新的AI系統,專門用來解決罕見疾病的診斷問題,影響全球約3.5億人。它利用基於BERT的自然語言處理技術,從電子健康紀錄中提取重要資訊,並透過五個新診斷模型進行鑑別。經過在2,271個案例和431種罕見疾病的測試,PhenoBrain的表現超越了多種預測方法,顯示出在臨床環境中提升診斷準確性的潛力。 PubMed DOI

大數據與人工智慧在醫療保健中結合,特別是透過電子健康紀錄(EHR)的分析,能顯著提升診斷準確性。然而,處理大量非結構化數據是一大挑戰。本研究探討大型語言模型(LLMs)在分類含排版錯誤的EHR文本的有效性。研究以哈哲特佩大學的兒科急診室數據為例,經微調的GPT-3模型在識別呼吸道感染病例上達到99.88%準確率,顯著優於預訓練模型的78.54%。結果顯示,微調的LLMs能高效分類非結構化EHR數據,提升醫療數據處理的效率與可靠性。 PubMed DOI

這項研究顯示大型語言模型(LLMs)在診斷罕見疾病方面的潛力,因為這些疾病因發病率低且表現多樣而難以識別。研究分析了152個來自中國醫學案例資料庫的案例,並比較了四個LLMs(ChatGPT-4o、Claude 3.5 Sonnet、Gemini Advanced和Llama 3.1 405B)與人類醫師的診斷準確性。結果顯示,LLMs的表現超越人類醫師,Claude 3.5 Sonnet的準確率達78.9%,而人類醫師僅26.3%。這顯示LLMs在臨床上可能成為有價值的工具,但在實際應用前仍需進一步驗證及考量倫理與隱私問題。 PubMed DOI

這項研究開發了一種利用大型語言模型(LLMs)從電子健康紀錄(EHR)中識別健康狀況的策略,解決了手動標記的繁瑣問題。研究將2015年的心臟登記隊列與阿爾伯塔省的EHR系統結合,分析臨床筆記以檢測急性心肌梗塞、糖尿病和高血壓。結果顯示,LLM方法在敏感度和陰性預測值上優於傳統ICD代碼,且檢測趨勢穩定。這種方法有潛力提升EHR在即時疾病監測中的應用效率。 PubMed DOI

這項研究利用大型語言模型分析電子健康紀錄,追蹤Noonan症候群等罕見疾病患者的症狀變化。目的是加深對疾病的了解、驗證現有知識,並協助提升罕見疾病患者的照護品質與協調。 PubMed DOI

這篇研究發現,大型語言模型(LLMs)雖然有潛力協助找出醫療紀錄中容易被忽略的間接病人識別資訊,但目前標記出來的很多其實是誤判。要真正把LLMs用在去識別化流程,還需要更多研究,才能確保病人隱私,同時又能安全分享醫療資料。 PubMed DOI

這項研究推出 RDguru 智慧診斷系統,專為罕見疾病設計,結合 GPT-4、醫學知識和診斷工具。實測 238 個案例,RDguru 前 10 答案有 69.1% 命中正確診斷,前 5 有 63.6%,第一個建議正確率為 41.9%,能有效協助臨床決策。 PubMed

這篇研究發現,就算只有少量高品質標註,只要用像 GPT-4o 這種高品質合成標註來微調 Llama 3.1-8B 這類輕量級語言模型,醫療任務表現也能大幅提升(micro F1 可達 0.91)。即使合成標註品質較差,微調後的模型表現還是能超越原本的雜訊標註,顯示模型很有韌性,合成資料在醫療 LLM 微調上很有潛力。 PubMed

大部分醫療紀錄都是非結構化,讓資料分析很困難。這項研究測試九種大型語言模型,能自動從兒科臨床報告擷取結構化資料。不論是商業還是開源模型,表現都很優秀,最好的模型辨識重要病患資訊的準確率超過九成。LLMs為醫療資料擷取提供靈活又準確的替代方案,有機會取代人工處理。 PubMed DOI