原始文章

GPTON 利用 GPT-4 來強化本體敘述,將結構化知識轉換為語言,並將本體術語整合進大型語言模型中。這種方法使得超過 68% 的基因集在前五名預測中能獲得準確的文本和本體註釋。手動評估證實了 GPTON 的有效性,顯示它如何運用 LLMs 和結構化知識,對生物醫學研究做出重要貢獻,超越了基因集的註釋範疇。 PubMed DOI


站上相關主題文章列表

單細胞RNA分析中標註細胞類型耗時且需要專業知識,但使用GPT-4大型語言模型能自動且精確標註。它與手動標註一致,可減少標註的工作量。為了推廣GPT-4的應用,開發了開源軟體套件GPTCelltype。 PubMed DOI

GeneGPT是一種教導大型語言模型使用NCBI網站回答基因組問題的方法。研究顯示GeneGPT在基因組任務上表現優異,平均得分達0.83。應用程式示範對上下文學習有效,GeneGPT能處理多跳問題,未來可增強特定錯誤類型。 PubMed DOI

本研究使用OpenAI的GPT-4大型語言模型,評估其在功能基因組學中的應用價值。結果顯示,GPT-4能夠生成具有生物醫學知識的基因功能假設,並提供比傳統方法更豐富的資訊。這顯示大型語言模型在功能基因組學研究中具有潛力成為有用的工具。 PubMed DOI

單細胞生物學領域近期有新進展,Geneformer和scGPT等複雜模型能從基因表現數據學習功能。GenePT是一簡單替代方案,利用ChatGPT嵌入基因,無需大量數據或訓練即可生成基因和細胞嵌入。GenePT在各項任務上表現優異,顯示利用語言模型嵌入可有效建立生物模型。 PubMed DOI

臨床深度表型分析和註釋對於診斷罕見疾病和推進領域知識至關重要。研究發現,GPT模型在這些任務中表現良好,尤其在特定本體子集上優於其他工具。然而,使用大型語言模型仍面臨非確定性和高成本等挑戰。 PubMed DOI

GeneGPT是一種新方法,教導大型語言模型利用NCBI網站回答基因組學問題。研究顯示GeneGPT在基準任務中表現優異,得分0.83超越其他模型。研究強調GeneGPT處理多跳問題的能力,並提供改進見解。程式碼和數據可在GitHub找到。 PubMed DOI

在這項研究中,我們展示了GPT-4可以在單細胞RNA序列分析中使用標記基因數據準確標記細胞類型。GPT-4的標記與各種組織和細胞類型的手動標記相符,簡化了細胞類型標記的過程。我們還開發了一個名為GPTCelltype的R軟體套件,用於使用GPT-4進行自動細胞類型標記。 PubMed DOI

這項研究評估了五種大型語言模型(LLMs)在識別基因集共同功能的有效性,並探討現有基因功能數據庫的限制。結果顯示,GPT-4在73%的案例中提出的功能與整理的基因集名稱相符,且其自信度與準確性相關。相比之下,隨機基因集的零自信率高達87%。其他模型如GPT-3.5和Gemini Pro則表現不一,經常在隨機基因集上出現錯誤自信。GPT-4在分析組學數據的基因簇時,識別出共同功能的案例達45%,顯示其在特異性和基因覆蓋率上優於傳統方法,顯示LLMs在組學研究中的潛力。 PubMed DOI

你的專案專注於提升大型語言模型(LLMs)在基因組學的表現,特別是透過整合變異註解數據。你成功將1.9億條準確的變異註解整合進GPT-4o,讓使用者能查詢特定基因變異並獲得詳細解釋。雖然微調有助於提升表現,但檢索增強生成(RAG)在數據量和成本效益上更具優勢。這項研究不僅提高了變異解釋的可及性,也為未來基因組學的AI系統發展樹立了榜樣,展現了LLMs的潛力。公開數據集可依需求分享。 PubMed DOI

這段文字探討了在對生物文本,特別是表型描述進行註釋時的挑戰,尤其是使用本體詞彙的情況。傳統文本挖掘工具在理解上下文方面表現不佳,而像OpenAI的GPT這類大型語言模型則更適合需要語義理解的任務。作者提出利用GPT對*Arabidopsis thaliana*和森林樹木的表型觀察進行本體詞彙註釋,目標是達到與人工註釋相當的效果。這些流程包括將表型解析為簡潔概念,並使用嵌入向量相似度和檢索增強生成(RAG)方法來識別合適的本體詞彙,最終實現高準確度的自動註釋。 PubMed DOI