原始文章

電子表型化是一個複雜的過程,涉及分析結構化和非結構化數據,使用規則技術、機器學習和自然語言處理。目前,準確的表型定義需要大量人力,主要依賴文獻回顧和專業知識,這使得擴展困難。大型語言模型(LLMs)提供自動提取表型定義的潛力,但也面臨可靠性和準確性等挑戰。我們的研究目標是建立標準評估集,確保模型輸出可靠,並測試不同提示策略以提取表型定義。結果顯示,雖然有進展,但仍需人類評估,且我們的方法有潛力減少文獻回顧所需時間。 PubMed DOI


站上相關主題文章列表

這項研究分析了不同大型語言模型(LLMs)在識別遺傳疾病時的表現,對比了開源模型(如Llama-2-chat和Vicuna)與封閉源模型(如ChatGPT-4)。結果顯示,開源模型的準確率在54%-68%之間,而ChatGPT-4則高達89%-90%。研究還指出,臨床醫生和一般民眾的提問對模型表現有顯著影響,且使用列表型提示能提升準確性。整體而言,這項研究揭示了LLMs在醫療領域的潛力與挑戰。 PubMed DOI

這項研究探討大型語言模型(LLMs)在診斷罕見遺傳疾病中的應用,特別是基於表型的基因優先排序。研究比較了五種LLMs,結果顯示GPT-4的表現最佳,能在前50個預測中準確識別17.0%的診斷基因,但仍低於傳統方法。雖然較大的模型通常表現較好,先進技術如檢索增強生成並未提升準確性,但精緻的提示改善了任務完整性。整體而言,這些發現顯示LLMs在基因組分析中的潛力與限制,對臨床應用有重要影響。 PubMed DOI

罕見疾病的診斷與治療面臨挑戰,因為其發生率低且表現多樣。研究提出一種混合方法,結合字典式自然語言處理(NLP)工具與大型語言模型(LLMs),以提升從非結構化臨床報告中識別罕見疾病的能力。這個框架整合了孤兒病本體和統一醫學語言系統,利用SemEHR工具提取疾病資訊,並透過多種LLMs優化結果。研究顯示,這種方法在識別潛在罕見疾病方面表現優異,顯示出其在臨床應用中的潛力,未來仍需進一步研究以克服相關挑戰。 PubMed DOI

RAG-HPO是一款新推出的Python工具,旨在提升罕見遺傳疾病診斷中表型提取的準確性。傳統工具如Doc2HPO常因表型分配不完整而需大量人工審查。RAG-HPO整合了超過54,000個HPO ID相關的表型短語,增強大型語言模型的上下文能力,避免耗時的微調。經評估,RAG-HPO在120個案例中達到0.84的平均精確度,顯示出優越性能。這個工具不僅使用方便,還顯著提升了表型分析的精確度,推進了遺傳學研究。 PubMed DOI

這項研究探討了結合知識增強電子檔案審查系統(KEEPER)與大型語言模型(LLMs),自動化觀察性研究中基於行政索賠和電子健康紀錄的案例裁定過程的可行性。傳統上,研究人員面臨數據限制及手動審查的挑戰。KEEPER 提取臨床發現,LLMs 評估患者是否符合案例標準。研究測試了四種 LLM,包括 GPT-4,結果顯示敏感性從 78% 到 98% 不等,特異性範圍為 48% 到 98%。這顯示 LLMs 在自動化表型評估上有潛力,未來可能減少手動審查的需求。 PubMed DOI

這項研究探討開源大型語言模型(LLMs)在從電子健康紀錄(EHRs)中提取社會健康決定因素(SDoH)數據的效果。研究隨機選取200名患者,並由兩位審查者手動標記九個SDoH方面,達成93%的高一致性。結果顯示,LLMs的表現明顯優於基準模型,特別是在識別明確提及的SDoH方面。最佳模型openchat_3.5在所有SDoH方面的準確率最高。研究強調進一步精煉和專業訓練的潛力,以提升LLMs在臨床研究中的應用,最終改善醫療結果。 PubMed DOI

深度表型學透過本體方式全面描述患者的徵兆與症狀,為了分析電子健康紀錄中的醫生筆記,需採用高通量方法。過去三十年已有進展,本研究展示大型語言模型與混合自然語言處理(NLP)模型的有效性,結合詞向量與機器學習分類器,達成高準確率。結果顯示,大型語言模型有潛力成為臨床徵兆與症狀深度表型學的主要技術,特別是在醫生筆記中記錄的資訊上。 PubMed DOI

這項研究發現,GPT-4o 在不用人工標註的情況下,能準確又有效率地從電子病歷資料做慢性病分類,表現比傳統規則式方法和其他 LLMs 更好。GPT-4o 召回率高達 0.97,macro-F1 分數也有 0.92。若結合 LLMs 和規則式方法,還能進一步提升準確度,讓人工審查更聚焦在有疑慮的案例上。 PubMed DOI

大型語言模型(LLMs)能根據病人表現型有效排序相關基因,表現不輸甚至優於傳統生物資訊方法。LLMs 有潛力協助罕見遺傳疾病診斷,提升準確度並簡化流程,成為未來診斷新選擇。 PubMed DOI

這篇研究比較GPT-4大型語言模型、深度學習和機器學習三種方法在電子病歷症狀標準化上的表現。結果發現,GPT-4表現最好,顯示大型語言模型很有潛力成為未來醫師筆記自動化分析的主流工具,有助於推動精準醫療發展。 PubMed