原始文章

罕見疾病(RDs)每2000人中影響不到1人,但全球約7%的人口受到影響,主要是兒童,且通常缺乏特定治療。患者的診斷過程漫長,平均需5年,可能影響健康。機器學習(ML)能改善患者管理與診斷。我們利用MIMIC-III數據庫及其他醫療筆記,建立了一個標記數據集,旨在早期檢測罕見疾病。應用多種機器學習技術後,SVM的F-measure達92.7%,AUC達96%,顯示ML在精準診斷罕見疾病方面的潛力,為未來研究提供資源。 PubMed DOI


站上相關主題文章列表

對罕見疾病進行表型分類很重要,但需要有標註的數據。利用大型語言模型進行即時學習可以自動化這個過程。ChatGPT和BioClinicalBERT是首次應用即時學習來識別罕見疾病表型的研究。雖然BioClinicalBERT整體表現較好,但ChatGPT在提取罕見疾病和症狀方面有潛力,並僅需最少的標註。ChatGPT有潛力匹敵或超越BioClinicalBERT,成為研究人員的寶貴工具,但模型輸出需仔細評估以確保準確性。 PubMed DOI

這項研究評估了GPT-4在診斷罕見疾病的表現,使用了5,267份以phenopackets格式整理的案例報告。研究旨在克服以往樣本量小和主觀評估的問題。結果顯示,GPT-4的正確診斷平均倒數排名(MRR)為0.24,表示在19.2%的案例中正確診斷排名第一,28.6%排名前三,32.5%排名前十。這是迄今對大型語言模型在罕見疾病診斷的最大分析,提供了更真實的能力評估。 PubMed DOI

這項研究開發了一個基於人工智慧的異常檢測模型,幫助醫療人員識別新型疾病並防止疫情擴散。模型使用來自麻薩諸塞州一所醫院的120,714名住院病人數據,基於生成預訓練變壓器(GPT)架構,並透過經驗風險最小化進行訓練。它分析電子健康紀錄,檢測不尋常的病人特徵,並在COVID-19疫情初期成功預測住院情況,達到92.2%的準確率。該模型在異常檢測和死亡預測上表現優異,顯示出在現代醫療中的潛力。 PubMed DOI

診斷罕見兒科疾病相當具挑戰性,因為這些疾病的表現複雜。本研究評估了三種大型語言模型(LLMs)的診斷表現:GPT-4、Gemini Pro,以及一個整合Human Phenotype Ontology的自訂模型(GPT-4 HPO),針對61個罕見疾病進行分析。結果顯示,GPT-4的準確率為13.1%,而GPT-4 HPO和Gemini Pro均為8.2%。特別是GPT-4 HPO在鑑別診斷和疾病分類上表現較佳。這些結果顯示大型語言模型在診斷支持上有潛力,但仍需改進以便更好地融入臨床實踐。 PubMed DOI

罕見疾病的診斷與治療面臨挑戰,因為其發生率低且表現多樣。研究提出一種混合方法,結合字典式自然語言處理(NLP)工具與大型語言模型(LLMs),以提升從非結構化臨床報告中識別罕見疾病的能力。這個框架整合了孤兒病本體和統一醫學語言系統,利用SemEHR工具提取疾病資訊,並透過多種LLMs優化結果。研究顯示,這種方法在識別潛在罕見疾病方面表現優異,顯示出其在臨床應用中的潛力,未來仍需進一步研究以克服相關挑戰。 PubMed DOI

這項研究的目的是自動化從接受心導管檢查病人的電子病歷中提取不良事件,特別是根據NCDR-IMPACT登記資料庫定義的事件。數據來自Necker兒童醫院,最初透過正則表達式篩選,產生了許多假陽性。心臟科醫生利用主動學習進行標註,建立了包含2,980名病人的數據集,並訓練了一個深度學習文本分類器。最終模型在識別不良事件時,達到0.78的召回率和0.94的特異性,顯示主動學習在臨床研究中的潛力,特別是對於罕見疾病的標註數據。 PubMed DOI

罕見疾病影響全球數百萬人,但因為盛行率低,研究關注有限,且缺乏特定的 ICD 代碼,讓臨床試驗中的患者識別變得困難。為了解決這個問題,我們開發了名為自動化罕見疾病挖掘(AutoRD)的系統,能自動提取醫學文本中的罕見疾病資訊。AutoRD 整合了醫學知識圖譜,並在實體和關係提取上表現優異,特別是在罕見疾病實體提取上達到 83.5% 的 F1 分數,顯示出其在醫療保健轉型中的潛力。 PubMed DOI

PhenoBrain是一個創新的AI系統,專門用來解決罕見疾病的診斷問題,影響全球約3.5億人。它利用基於BERT的自然語言處理技術,從電子健康紀錄中提取重要資訊,並透過五個新診斷模型進行鑑別。經過在2,271個案例和431種罕見疾病的測試,PhenoBrain的表現超越了多種預測方法,顯示出在臨床環境中提升診斷準確性的潛力。 PubMed DOI

大數據與人工智慧在醫療保健中結合,特別是透過電子健康紀錄(EHR)的分析,能顯著提升診斷準確性。然而,處理大量非結構化數據是一大挑戰。本研究探討大型語言模型(LLMs)在分類含排版錯誤的EHR文本的有效性。研究以哈哲特佩大學的兒科急診室數據為例,經微調的GPT-3模型在識別呼吸道感染病例上達到99.88%準確率,顯著優於預訓練模型的78.54%。結果顯示,微調的LLMs能高效分類非結構化EHR數據,提升醫療數據處理的效率與可靠性。 PubMed DOI

這項研究顯示大型語言模型(LLMs)在診斷罕見疾病方面的潛力,因為這些疾病因發病率低且表現多樣而難以識別。研究分析了152個來自中國醫學案例資料庫的案例,並比較了四個LLMs(ChatGPT-4o、Claude 3.5 Sonnet、Gemini Advanced和Llama 3.1 405B)與人類醫師的診斷準確性。結果顯示,LLMs的表現超越人類醫師,Claude 3.5 Sonnet的準確率達78.9%,而人類醫師僅26.3%。這顯示LLMs在臨床上可能成為有價值的工具,但在實際應用前仍需進一步驗證及考量倫理與隱私問題。 PubMed DOI