原始文章

作者提出FREEFORM架構,利用大型語言模型(LLMs)在基因型-表現型預測中做特徵選擇與工程。FREEFORM結合LLMs的生醫知識和推理能力,能挑出精簡且易解釋的基因特徵,尤其在資料少時效果更勝傳統方法。此架構已開源並上傳至GitHub。 PubMed


站上相關主題文章列表

這項研究探討大型語言模型(LLMs)在診斷罕見遺傳疾病中的應用,特別是基於表型的基因優先排序。研究比較了五種LLMs,結果顯示GPT-4的表現最佳,能在前50個預測中準確識別17.0%的診斷基因,但仍低於傳統方法。雖然較大的模型通常表現較好,先進技術如檢索增強生成並未提升準確性,但精緻的提示改善了任務完整性。整體而言,這些發現顯示LLMs在基因組分析中的潛力與限制,對臨床應用有重要影響。 PubMed DOI

預訓練語言模型對自然語言處理(NLP)影響深遠,現在也啟發了基因組學的相關研究。開發高品質的基因組基礎模型(FMs)成本高且需大量資源,因此本研究提出L2G,透過現有的大型語言模型(LLMs)來應用於基因組任務。L2G運用「跨模態轉移」的概念,並結合神經架構搜索(NAS)及三階段訓練過程。結果顯示,L2G在多項基因組基準測試中表現優於微調的基因組FMs,特別在增強子活性預測方面也有卓越表現,顯示語言模型在基因組學的潛力。 PubMed DOI

大型語言模型(LLMs)正在改變生物醫學科學,特別是在理解生物序列方面。基因組語言模型(gLMs)專注於DNA序列,能幫助預測基因組中重要的功能區域、設計新DNA序列,並促進轉移學習。儘管如此,開發有效的gLMs仍面臨挑戰,如數據質量、模型架構及評估指標等。解決這些問題對於gLMs在複雜生物系統中的應用至關重要。 PubMed DOI

你的專案專注於提升大型語言模型(LLMs)在基因組學的表現,特別是透過整合變異註解數據。你成功將1.9億條準確的變異註解整合進GPT-4o,讓使用者能查詢特定基因變異並獲得詳細解釋。雖然微調有助於提升表現,但檢索增強生成(RAG)在數據量和成本效益上更具優勢。這項研究不僅提高了變異解釋的可及性,也為未來基因組學的AI系統發展樹立了榜樣,展現了LLMs的潛力。公開數據集可依需求分享。 PubMed DOI

這項研究用大型語言模型,從GEM資料庫和文獻中自動萃取基因編輯細節,突破了原本資料庫的限制。這讓研究人員能更快找到重要基因、規劃實驗,提升基因編輯研究效率。相關工具和資料已在GitHub公開,方便大家使用。 PubMed DOI

大型語言模型(LLMs)能根據病人表現型有效排序相關基因,表現不輸甚至優於傳統生物資訊方法。LLMs 有潛力協助罕見遺傳疾病診斷,提升準確度並簡化流程,成為未來診斷新選擇。 PubMed DOI

作者提出FREEFORM架構,利用大型語言模型(LLMs)來做基因型-表現型預測的特徵選擇與工程。FREEFORM能善用LLMs的知識和推理力,在資料少時表現比傳統方法更好。這套工具已開源並在GitHub上公開。 PubMed

傳統基因集分析彈性有限,llm2geneset 利用大型語言模型,能根據基因和自然語言描述,動態產生專屬基因集,品質媲美甚至超越人工整理。這工具在解析高通量資料和找生物過程上,比傳統方法更有效。llm2geneset 已開源,網路上可免費取得。 PubMed DOI

這項研究用大型語言模型,從GEM資料庫和文獻中自動萃取、量化基因編輯資訊,突破現有資料庫限制,更清楚呈現基因在編輯中的角色,提升基因排序效率,幫助設計更好的基因編輯實驗。相關工具和資料已在GitHub公開。 PubMed DOI

大型語言模型正改變基因體醫療,能快速分析文獻和基因資料,提升診斷與治療建議的精準度。雖然還有挑戰待克服,但隨著技術進步和跨領域合作,未來 AI 將成為臨床基因體分析的主流工具,推動個人化醫療發展。 PubMed DOI