原始文章

我們提出一種新方法,結合NCBI Gene的基因描述和大型語言模型,將單細胞RNA定序資料轉換成有意義的向量。做法是先找出每個細胞表現量最高的基因,擷取基因註解,再用語言模型轉成向量,並依表現量加權。這樣不只提升解釋性,也讓細胞分群和分析更精準。 PubMed


站上相關主題文章列表

阿茲海默症是一種漸進性的神經系統疾病,影響全球數百萬人,導致認知能力下降和記憶喪失。傳統診斷方法難以早期檢測。本研究提出一種新方法,結合自然語言處理和大型語言模型,利用GenBERT來識別阿茲海默症的生物標記。透過整合臨床數據,GenBERT在早期預測方面表現優異,準確率達98.30%,並顯示出高敏感性和特異性,為阿茲海默症的早期診斷提供了可靠工具,可能改變未來的檢測與治療策略。 PubMed DOI

單細胞多組學技術,特別是單細胞RNA測序(scRNA-seq),讓我們更深入了解細胞的多樣性與發展。透過將基因視為單詞,並利用word2vec技術生成基因的向量表示,我們能夠進行多尺度分析,識別細胞狀態與發展軌跡。這種方法不僅計算效率高,還能在不依賴高效能計算集群的情況下進行分析,成為探索細胞發展、基因影響及組織關係的重要工具。 PubMed DOI

Omics 資料量暴增,超出現有分析能力,但大型語言模型(LLMs)能解決這問題。透過多模態基礎模型預訓練,可有效解析基因體、轉錄體等多元資料,應用於細胞分類、生物標記發現、基因調控等,推動 AI 驅動的生物研究,深入了解生命科學。 PubMed DOI

大型語言模型(LLMs)能根據病人表現型有效排序相關基因,表現不輸甚至優於傳統生物資訊方法。LLMs 有潛力協助罕見遺傳疾病診斷,提升準確度並簡化流程,成為未來診斷新選擇。 PubMed DOI

這項研究用大型語言模型自動從電子病歷抓出智力及發展障礙、腦性麻痺患者的語言和行走能力,準確率很高(行走能力F1值超過0.9)。這方法能減少人工評估負擔、省成本,且適用不同醫院和紀錄格式。不過,還需要更多研究才能擴展到其他族群和更細的功能指標。 PubMed DOI

傳統基因集分析彈性有限,llm2geneset 利用大型語言模型,能根據基因和自然語言描述,動態產生專屬基因集,品質媲美甚至超越人工整理。這工具在解析高通量資料和找生物過程上,比傳統方法更有效。llm2geneset 已開源,網路上可免費取得。 PubMed DOI

大型語言模型(LLMs)正大幅改變阿茲海默症藥物開發流程,能快速分析大量生醫資料、找出新藥標靶並設計新化合物。雖然還有資料品質和模型解釋性的挑戰,LLMs 已有效加速研究進展,為治療帶來新希望,也推動 AI 與生醫領域的合作。 PubMed DOI

這項研究發現,AI語言模型(像GPT-4)能有效找出生物老化相關分子的語意連結,並建議多重介入組合。其分析結果與實際生物學關係高度吻合,並經KEGG資料庫驗證,顯示LLMs有潛力協助發現老化相關的新分子與路徑連結。 PubMed DOI

sciL-aMA 是微軟推出的新深度學習框架,結合大型語言模型的基因嵌入和單細胞 RNA 定序資料,採用 paired-VAE 架構。這方法能同時為細胞和基因建立情境感知的表徵,提升批次校正、細胞分群和基因標記鑑定的效果,兼顧效率與可解釋性。原始碼在 GitHub:https://github.com/microsoft/sciLaMA PubMed DOI

罕見疾病診斷困難,因資料少且基因多樣。本研究評估大型語言模型(LLMs)在基因排序的表現,發現GPT-4表現最佳,但對知名基因有偏好且受輸入順序影響。採用分批處理可提升準確度並減少偏誤,有助加快罕見疾病基因鑑定與診斷。程式碼可在 GitHub 下載。 PubMed DOI