原始文章

電子表型化是一個複雜的過程,涉及分析結構化和非結構化數據,使用規則技術、機器學習和自然語言處理。目前,準確的表型定義需要大量人力,主要依賴文獻回顧和專業知識,這使得擴展困難。大型語言模型(LLMs)提供自動提取表型定義的潛力,但也面臨可靠性和準確性等挑戰。我們的研究目標是建立標準評估集,確保模型輸出可靠,並測試不同提示策略以提取表型定義。結果顯示,雖然有進展,但仍需人類評估,且我們的方法有潛力減少文獻回顧所需時間。 PubMed DOI


站上相關主題文章列表

研究團隊開發了PhenoBCBERT和PhenoGPT兩個模型,旨在擴充人類表型本體(HPO)術語,提升對遺傳疾病臨床記錄中表型的識別能力。新模型比PhenoTagger更強,能辨識更多表型概念,並在生醫文獻中表現優異。綜合評估結果顯示,這些模型能有效增強自動檢測臨床文本中表型的能力,有助於進行人類疾病相關的進一步分析。 PubMed DOI

資訊提取(IE)在NLP中很重要,可以從文本中找出事實知識,支援各種應用。在基因醫學中,準確提取患者數據的表現型對基因疾病診斷很重要。LLM的進步提高了從臨床報告中提取表現型的準確性。本文評估了ChatGPT和現有解決方案在這方面的效能,強調了比較方法對提升基因診斷的重要性。 PubMed DOI

研究使用電子健康記錄進行表型分析時,需要準確的演算法,但開發這些演算法可能耗費大量時間。研究指出,使用大型語言模型(LLMs)能有效生成初步演算法,其中GPT-4和GPT-3.5在評估中表現較佳。然而,仍需要人類專業知識來完善這些演算法。 PubMed DOI

為了更準確記錄遺傳疾病的症狀,開發了PhenoBCBERT和PhenoGPT模型,擴充了HPO術語詞彙。這些模型利用大型語言模型自動辨識症狀術語,包括不在HPO中的術語。相較於現有工具如PhenoTagger,新模型能識別更多症狀,並在生物醫學文獻中表現更好。綜合評估BERT和GPT模型後發現,這些模型提升了自動辨識症狀的能力,進而改善了對人類疾病的分析。 PubMed DOI

研究評估大型語言模型在基因組分析中的應用潛力,以診斷罕見遺傳疾病。最佳模型準確率為16.0%,低於傳統工具,但隨模型大小增加,準確性提高。自由文本輸入可提高預測準確性,但某些基因可能存在偏見。總結,大型語言模型在基因組分析中有應用價值。 PubMed DOI

在健康研究中使用電子健康記錄進行表型分析是至關重要的,但也很費時。像GPT-4和GPT-3.5這樣的大型語言模型可以幫助有效地生成初步演算法。然而,這些模型雖然可以識別臨床標準,但可能需要專家進一步精煉以提高準確性。 PubMed DOI

對罕見疾病進行表型分類很重要,但需要有標註的數據。利用大型語言模型進行即時學習可以自動化這個過程。ChatGPT和BioClinicalBERT是首次應用即時學習來識別罕見疾病表型的研究。雖然BioClinicalBERT整體表現較好,但ChatGPT在提取罕見疾病和症狀方面有潛力,並僅需最少的標註。ChatGPT有潛力匹敵或超越BioClinicalBERT,成為研究人員的寶貴工具,但模型輸出需仔細評估以確保準確性。 PubMed DOI

這項研究分析了不同大型語言模型(LLMs)在識別遺傳疾病時的表現,對比了開源模型(如Llama-2-chat和Vicuna)與封閉源模型(如ChatGPT-4)。結果顯示,開源模型的準確率在54%-68%之間,而ChatGPT-4則高達89%-90%。研究還指出,臨床醫生和一般民眾的提問對模型表現有顯著影響,且使用列表型提示能提升準確性。整體而言,這項研究揭示了LLMs在醫療領域的潛力與挑戰。 PubMed DOI

這項研究探討大型語言模型(LLMs)在診斷罕見遺傳疾病中的應用,特別是基於表型的基因優先排序。研究比較了五種LLMs,結果顯示GPT-4的表現最佳,能在前50個預測中準確識別17.0%的診斷基因,但仍低於傳統方法。雖然較大的模型通常表現較好,先進技術如檢索增強生成並未提升準確性,但精緻的提示改善了任務完整性。整體而言,這些發現顯示LLMs在基因組分析中的潛力與限制,對臨床應用有重要影響。 PubMed DOI

罕見疾病的診斷與治療面臨挑戰,因為其發生率低且表現多樣。研究提出一種混合方法,結合字典式自然語言處理(NLP)工具與大型語言模型(LLMs),以提升從非結構化臨床報告中識別罕見疾病的能力。這個框架整合了孤兒病本體和統一醫學語言系統,利用SemEHR工具提取疾病資訊,並透過多種LLMs優化結果。研究顯示,這種方法在識別潛在罕見疾病方面表現優異,顯示出其在臨床應用中的潛力,未來仍需進一步研究以克服相關挑戰。 PubMed DOI