原始文章

這項研究提出了一種簡化的檢索器,利用BioBERT的上下文詞嵌入來搜尋人類表型本體(HPO),提升大型語言模型在標準化表型術語的準確性。與傳統依賴明確術語定義的方法不同,我們的方法讓GPT-4o在《線上孟德爾遺傳學手冊》的臨床摘要中,標準化準確率從62%提升到85%。這不僅顯示出顯著的準確性提升,還提供了一種比複雜檢索系統更有效的替代方案,顯示其在其他生物醫學術語標準化任務中的潛力。 PubMed DOI


站上相關主題文章列表

研究團隊開發了PhenoBCBERT和PhenoGPT兩個模型,旨在擴充人類表型本體(HPO)術語,提升對遺傳疾病臨床記錄中表型的識別能力。新模型比PhenoTagger更強,能辨識更多表型概念,並在生醫文獻中表現優異。綜合評估結果顯示,這些模型能有效增強自動檢測臨床文本中表型的能力,有助於進行人類疾病相關的進一步分析。 PubMed DOI

資訊提取(IE)在NLP中很重要,可以從文本中找出事實知識,支援各種應用。在基因醫學中,準確提取患者數據的表現型對基因疾病診斷很重要。LLM的進步提高了從臨床報告中提取表現型的準確性。本文評估了ChatGPT和現有解決方案在這方面的效能,強調了比較方法對提升基因診斷的重要性。 PubMed DOI

研究目的是透過特定語料庫微調LLaMA 2,以改進罕見疾病概念的規範化。四個模型在臨床概念上表現準確,對打字錯誤有強大的辨識能力。同義詞模型在新概念上表現較佳。研究測試了模型在SNOMED-CT同義詞上的準確度,並指出ChatGPT 3.5在某些情況下能正確識別HPO ID。這些模型展現了對拼寫錯誤和同義詞的強大辨識能力,有助於臨床敘事中辨識和規範醫學概念。 PubMed DOI

為了更準確記錄遺傳疾病的症狀,開發了PhenoBCBERT和PhenoGPT模型,擴充了HPO術語詞彙。這些模型利用大型語言模型自動辨識症狀術語,包括不在HPO中的術語。相較於現有工具如PhenoTagger,新模型能識別更多症狀,並在生物醫學文獻中表現更好。綜合評估BERT和GPT模型後發現,這些模型提升了自動辨識症狀的能力,進而改善了對人類疾病的分析。 PubMed DOI

臨床深度表型分析和註釋對於診斷罕見疾病和推進領域知識至關重要。研究發現,GPT模型在這些任務中表現良好,尤其在特定本體子集上優於其他工具。然而,使用大型語言模型仍面臨非確定性和高成本等挑戰。 PubMed DOI

研究使用Llama 2語言模型,透過HPO語料庫微調,提升罕見疾病概念的準確性。建立兩個語料庫,一個收錄標準HPO名稱和同義詞。微調後的模型能準確規範表型術語,即使有錯別字或新詞。這方法有助於臨床文本中識別醫學實體並標準化。 PubMed DOI

這篇手稿介紹了PheNormGPT,這是一個專門從臨床文本中提取和標準化關鍵發現的框架。它利用大型語言模型,特別是OpenAI的GPT-3.5 Turbo和GPT-4,來識別並將表型數據映射到人類表型本體的概念。這個框架結合了微調和獨特的少量學習策略,根據特定需求自訂範例選擇。在BioCreative VIII Track 3競賽中,PheNormGPT專注於從畸形學的身體檢查記錄中提取遺傳表型,並取得了優異的成績,標準匹配的F1分數為0.82,精確匹配的F1分數為0.72,並獲得第一名。 PubMed DOI

RAG-HPO是一款新推出的Python工具,旨在提升罕見遺傳疾病診斷中表型提取的準確性。傳統工具如Doc2HPO常因表型分配不完整而需大量人工審查。RAG-HPO整合了超過54,000個HPO ID相關的表型短語,增強大型語言模型的上下文能力,避免耗時的微調。經評估,RAG-HPO在120個案例中達到0.84的平均精確度,顯示出優越性能。這個工具不僅使用方便,還顯著提升了表型分析的精確度,推進了遺傳學研究。 PubMed DOI

這項研究探討了從臨床文本中準確提取人類表型本體(HPO)術語的挑戰,隨著外顯子和基因組測序的普及,這項任務愈加重要。傳統方法如PhenoTagger在精確度上有限。作者提出利用大型語言模型(LLMs)創建合成臨床句子,並將其轉換為HPO術語的向量嵌入,避免了LLM的幻覺問題。研究顯示,三種嵌入模型的表現均優於PhenoTagger,最佳模型的各項指標均達0.7,顯示出這種綜合方法在HPO術語提取上的有效性,為生物醫學數據標註提供了可擴展的解決方案。 PubMed DOI

這項研究探討了電子健康紀錄(EHRs)中非結構化醫療文本的標準化挑戰,因為這些文本格式不一致。約80%的EHR數據是非結構化的,作者使用大型語言模型(LLMs)來標準化這些文本,開發了四種策略,包括RAGnorm。研究評估了這些策略在三個SNOMED映射的病症術語數據集上的表現,結果顯示RAGnorm在所有數據集中的表現最佳,且在TAC2017任務中獲得88.01的微F1分數,顯示其在標準化生物醫學文本方面的潛力。 PubMed DOI