原始文章

這篇手稿介紹了PheNormGPT,這是一個專門從臨床文本中提取和標準化關鍵發現的框架。它利用大型語言模型,特別是OpenAI的GPT-3.5 Turbo和GPT-4,來識別並將表型數據映射到人類表型本體的概念。這個框架結合了微調和獨特的少量學習策略,根據特定需求自訂範例選擇。在BioCreative VIII Track 3競賽中,PheNormGPT專注於從畸形學的身體檢查記錄中提取遺傳表型,並取得了優異的成績,標準匹配的F1分數為0.82,精確匹配的F1分數為0.72,並獲得第一名。 PubMed DOI


站上相關主題文章列表

研究使用OpenAI的GPT-4模型分析非小細胞肺癌患者病歷,結果顯示GPT-4在臨床表現上優於其他模型。GPT模型的上下文識別能力強,不需明確規則,與SpaCy不同。GPT-4的預訓練和模式識別能力提升臨床表型辨識,比起基於規則的模型,更有助於病患照護。 PubMed DOI

研究團隊開發了PhenoBCBERT和PhenoGPT兩個模型,旨在擴充人類表型本體(HPO)術語,提升對遺傳疾病臨床記錄中表型的識別能力。新模型比PhenoTagger更強,能辨識更多表型概念,並在生醫文獻中表現優異。綜合評估結果顯示,這些模型能有效增強自動檢測臨床文本中表型的能力,有助於進行人類疾病相關的進一步分析。 PubMed DOI

資訊提取(IE)在NLP中很重要,可以從文本中找出事實知識,支援各種應用。在基因醫學中,準確提取患者數據的表現型對基因疾病診斷很重要。LLM的進步提高了從臨床報告中提取表現型的準確性。本文評估了ChatGPT和現有解決方案在這方面的效能,強調了比較方法對提升基因診斷的重要性。 PubMed DOI

研究使用電子健康記錄進行表型分析時,需要準確的演算法,但開發這些演算法可能耗費大量時間。研究指出,使用大型語言模型(LLMs)能有效生成初步演算法,其中GPT-4和GPT-3.5在評估中表現較佳。然而,仍需要人類專業知識來完善這些演算法。 PubMed DOI

為了更準確記錄遺傳疾病的症狀,開發了PhenoBCBERT和PhenoGPT模型,擴充了HPO術語詞彙。這些模型利用大型語言模型自動辨識症狀術語,包括不在HPO中的術語。相較於現有工具如PhenoTagger,新模型能識別更多症狀,並在生物醫學文獻中表現更好。綜合評估BERT和GPT模型後發現,這些模型提升了自動辨識症狀的能力,進而改善了對人類疾病的分析。 PubMed DOI

臨床深度表型分析和註釋對於診斷罕見疾病和推進領域知識至關重要。研究發現,GPT模型在這些任務中表現良好,尤其在特定本體子集上優於其他工具。然而,使用大型語言模型仍面臨非確定性和高成本等挑戰。 PubMed DOI

在健康研究中使用電子健康記錄進行表型分析是至關重要的,但也很費時。像GPT-4和GPT-3.5這樣的大型語言模型可以幫助有效地生成初步演算法。然而,這些模型雖然可以識別臨床標準,但可能需要專家進一步精煉以提高準確性。 PubMed DOI

對罕見疾病進行表型分類很重要,但需要有標註的數據。利用大型語言模型進行即時學習可以自動化這個過程。ChatGPT和BioClinicalBERT是首次應用即時學習來識別罕見疾病表型的研究。雖然BioClinicalBERT整體表現較好,但ChatGPT在提取罕見疾病和症狀方面有潛力,並僅需最少的標註。ChatGPT有潛力匹敵或超越BioClinicalBERT,成為研究人員的寶貴工具,但模型輸出需仔細評估以確保準確性。 PubMed DOI

研究使用OpenAI的GPT-4模型分析非小細胞肺癌患者的電子健康記錄,結果顯示GPT-4在識別疾病階段、治療和進展方面比其他模型表現更好。這表示GPT-4在臨床表現型提取上比基於規則的模型更有效率,具有更高的精確度、召回率和F1分數。GPT模型在醫療領域有著重要的應用價值,因為它們提供了更好的上下文理解和臨床表現型識別能力。 PubMed DOI

罕見疾病的診斷與治療面臨挑戰,因為其發生率低且表現多樣。研究提出一種混合方法,結合字典式自然語言處理(NLP)工具與大型語言模型(LLMs),以提升從非結構化臨床報告中識別罕見疾病的能力。這個框架整合了孤兒病本體和統一醫學語言系統,利用SemEHR工具提取疾病資訊,並透過多種LLMs優化結果。研究顯示,這種方法在識別潛在罕見疾病方面表現優異,顯示出其在臨床應用中的潛力,未來仍需進一步研究以克服相關挑戰。 PubMed DOI