原始文章

PhenoBrain是一個創新的AI系統,專門用來解決罕見疾病的診斷問題,影響全球約3.5億人。它利用基於BERT的自然語言處理技術,從電子健康紀錄中提取重要資訊,並透過五個新診斷模型進行鑑別。經過在2,271個案例和431種罕見疾病的測試,PhenoBrain的表現超越了多種預測方法,顯示出在臨床環境中提升診斷準確性的潛力。 PubMed DOI


站上相關主題文章列表

研究團隊開發了PhenoBCBERT和PhenoGPT兩個模型,旨在擴充人類表型本體(HPO)術語,提升對遺傳疾病臨床記錄中表型的識別能力。新模型比PhenoTagger更強,能辨識更多表型概念,並在生醫文獻中表現優異。綜合評估結果顯示,這些模型能有效增強自動檢測臨床文本中表型的能力,有助於進行人類疾病相關的進一步分析。 PubMed DOI

為了更準確記錄遺傳疾病的症狀,開發了PhenoBCBERT和PhenoGPT模型,擴充了HPO術語詞彙。這些模型利用大型語言模型自動辨識症狀術語,包括不在HPO中的術語。相較於現有工具如PhenoTagger,新模型能識別更多症狀,並在生物醫學文獻中表現更好。綜合評估BERT和GPT模型後發現,這些模型提升了自動辨識症狀的能力,進而改善了對人類疾病的分析。 PubMed DOI

對罕見疾病進行表型分類很重要,但需要有標註的數據。利用大型語言模型進行即時學習可以自動化這個過程。ChatGPT和BioClinicalBERT是首次應用即時學習來識別罕見疾病表型的研究。雖然BioClinicalBERT整體表現較好,但ChatGPT在提取罕見疾病和症狀方面有潛力,並僅需最少的標註。ChatGPT有潛力匹敵或超越BioClinicalBERT,成為研究人員的寶貴工具,但模型輸出需仔細評估以確保準確性。 PubMed DOI

這項研究介紹了一個名為RareDxGPT的增強版ChatGPT,專門用於診斷罕見疾病。雖然單一罕見疾病的發病率低,但全球約有4億人受到影響,診斷時間可長達五年。RareDxGPT整合了717種罕見疾病的資料,並採用檢索增強生成(RAG)方法進行分析。研究結果顯示,RareDxGPT在各種提示下的準確率均高於標準的ChatGPT 3.5,顯示出其在協助診斷罕見疾病方面的潛力。 PubMed DOI

這項研究評估了GPT-4在診斷罕見疾病的表現,使用了5,267份以phenopackets格式整理的案例報告。研究旨在克服以往樣本量小和主觀評估的問題。結果顯示,GPT-4的正確診斷平均倒數排名(MRR)為0.24,表示在19.2%的案例中正確診斷排名第一,28.6%排名前三,32.5%排名前十。這是迄今對大型語言模型在罕見疾病診斷的最大分析,提供了更真實的能力評估。 PubMed DOI

診斷罕見兒科疾病相當具挑戰性,因為這些疾病的表現複雜。本研究評估了三種大型語言模型(LLMs)的診斷表現:GPT-4、Gemini Pro,以及一個整合Human Phenotype Ontology的自訂模型(GPT-4 HPO),針對61個罕見疾病進行分析。結果顯示,GPT-4的準確率為13.1%,而GPT-4 HPO和Gemini Pro均為8.2%。特別是GPT-4 HPO在鑑別診斷和疾病分類上表現較佳。這些結果顯示大型語言模型在診斷支持上有潛力,但仍需改進以便更好地融入臨床實踐。 PubMed DOI

罕見疾病的診斷與治療面臨挑戰,因為其發生率低且表現多樣。研究提出一種混合方法,結合字典式自然語言處理(NLP)工具與大型語言模型(LLMs),以提升從非結構化臨床報告中識別罕見疾病的能力。這個框架整合了孤兒病本體和統一醫學語言系統,利用SemEHR工具提取疾病資訊,並透過多種LLMs優化結果。研究顯示,這種方法在識別潛在罕見疾病方面表現優異,顯示出其在臨床應用中的潛力,未來仍需進一步研究以克服相關挑戰。 PubMed DOI

這項研究針對醫學文本中的表型資訊進行精確對齊,旨在提升智能醫療應用,如檢索相似病患案例。作者提出了表型語義結構單元(PhenoSSU)及自動提取演算法,並探索多種對齊策略,發現數據驅動的方法效果最佳。基於BERT的模型對短語型PhenoSSU有效,而知識基礎方法則適合邏輯型PhenoSSU。最終開發的PhenoAlign工具在金標準測試集上表現優異,F1分數達0.820,顯示其在病患照護和醫學研究中的潛力。 PubMed DOI

大型語言模型(LLMs)如GPT-4o在醫療應用,特別是鑑別診斷方面展現潛力。研究人員創建了4,967個臨床案例,涵蓋378種遺傳疾病,並翻譯HPO術語,生成多語言提示。結果顯示,GPT-4o在英語中正確識別排名第一的診斷達19.8%,而在八種非英語語言中,正確率介於16.9%到20.5%之間。這顯示該模型在非英語臨床環境中的應用潛力,並得到多方支持,推進LLMs在醫療領域的合作努力。 PubMed DOI

這項研究顯示大型語言模型(LLMs)在診斷罕見疾病方面的潛力,因為這些疾病因發病率低且表現多樣而難以識別。研究分析了152個來自中國醫學案例資料庫的案例,並比較了四個LLMs(ChatGPT-4o、Claude 3.5 Sonnet、Gemini Advanced和Llama 3.1 405B)與人類醫師的診斷準確性。結果顯示,LLMs的表現超越人類醫師,Claude 3.5 Sonnet的準確率達78.9%,而人類醫師僅26.3%。這顯示LLMs在臨床上可能成為有價值的工具,但在實際應用前仍需進一步驗證及考量倫理與隱私問題。 PubMed DOI