原始文章

在科學研究中,隨著出版物數量的增加,管理變得愈加困難。為了解決這個問題,我們開發了一個高通量流程,利用ChatGPT從超過24,000篇秀麗隱杆線蟲和150,000篇果蠅的文獻中提取資訊,成功識別了超過200,000個C. elegans的互動及近120萬個果蠅的互動,建立了全面的生物圖譜。我們還創建了一個可搜尋的線上平台,方便使用者訪問這些知識網絡,並突顯了重要的生物途徑。這些數據庫可在worm.bio-map.com和drosophila.bio-map.com訪問。 PubMed DOI


站上相關主題文章列表

合成生物學期刊文章提取知識應用於機器學習需耗時。使用GPT-4可加速提取微生物在複雜條件下的表現資訊。一研究利用GPT-4管線從176篇文章中擷取數據,總計2037個數據實例。機器學習模型如隨機森林可預測Yarrowia的發酵濃度,R^2為0.86。透過轉移學習,可評估Rhodosporidium toruloides的生產潛力。研究顯示AI如何從文章中提取資訊,有助於預測生物製造發展。 PubMed DOI

生物醫學資料庫增加快速,分析資料對生物學和醫學至關重要。現有工具常難以完整處理條目或像人類一樣修正錯誤。大型語言模型(LLMs)如ChatGPT提供了新的查詢資料庫方式,但在擴展規模時會有挑戰。ChIP-GPT是基於GPT模型Llama微調的,能高精確度從序列讀取存檔中提取元數據。它能處理打字錯誤和缺失標籤,適應各種資料庫和問題。 PubMed DOI

研究生物相互作用對了解複雜生物系統、推動研究和藥物開發至關重要。雖然手動審查是最佳方法,但現在也有自動化工具如GIX框架可協助。GIX簡化了提取過程,提高了準確性,並提供了信心因子。通過評估,GIX優於現有方法,並展現出與手動審查相當的穩定性。此外,GIX還能提供新信息,對大腸桿菌基因回路的推斷有實際應用價值。 PubMed DOI

利用PubMed資料庫的大量英文摘要,透過PubMedBERT和t-SNE模型,製作了生物醫學文獻的二維地圖。這地圖可分析COVID-19文獻增加、神經科學變化、機器學習應用、作者性別不平衡及被撤回文章分佈。同時開發互動網站,方便探索並支持未來研究。 PubMed DOI

對於ChatGPT和Bard (Gemini)在檢索生物知識的評估顯示,這兩者在資料整理和研究上有明顯的限制。ChatGPT在24分中只得5分,而Bard得13分,顯示它們在提供準確和完整資訊方面面臨挑戰。常見問題包括缺乏細節、錯誤答案,以及準確與不準確資訊混雜。此外,這兩個模型還會虛構科學論文的參考文獻,讓人對其可靠性產生疑慮。因此,建議生物學家繼續依賴傳統的科學資訊來源,並偶爾重新評估這些AI工具的可靠性。 PubMed DOI

這項研究評估了21個大型語言模型(LLMs)在檢索生物知識的有效性,特別針對基因調控和KEGG途徑。隨著生物文獻的快速增長,傳統手動整理已不再足夠,LLMs成為一個有前景的替代方案。 結果顯示,模型性能差異明顯,GPT-4和Claude-Pro在基因調控關係的F1分數分別為0.4448和0.4386,KEGG途徑的Jaccard指數也表現強勁。相比之下,開源模型表現較差。研究強調選擇合適模型的重要性,並提供了LLMs在生物研究中的應用見解,相關代碼已在GitHub上公開。 PubMed DOI

在2023年,大型語言模型聊天機器人的使用大幅增加,特別是ChatGPT在生物資訊學和生物醫學資訊學的應用。我們的調查探討了它在組學、遺傳學、生物醫學文本挖掘、藥物發現、生物醫學影像理解、生物資訊學程式設計及教育等領域的表現。我們指出了ChatGPT的優勢與限制,並對其在生物資訊學的未來發展提供了潛在見解。 PubMed DOI

基因組時代的來臨促進了高通量數據和先進計算方法的發展,幫助我們探索植物抗逆境的遺傳與功能。儘管有許多實驗和分析技術,但龐大的數據量仍帶來挑戰。深度學習模型在預測基因結構和功能方面表現優異,並在農業高通量表型學中越來越常見。這篇綜述強調了數據資源和生物信息學工具,以及機器學習和人工智慧在植物抗逆境研究中的應用,並展示如何利用大型語言模型(如ChatGPT)創建相關知識圖譜,促進跨領域合作。 PubMed DOI

這項研究探討了研究人員在處理大量生物醫學文獻時的挑戰,並提出了一種混合方法,結合文本挖掘、圖神經網絡(GNNs)和微調的大型語言模型(LLMs)。這種方法旨在增強生物醫學知識圖譜,並解釋預測的關係。研究顯示,該方法在蛋白質相互作用數據集上達到0.772的馬修斯相關係數,並在失眠研究中識別出25個新的人類蛋白質相互作用。這種方法有助於加速治療靶點的發現,並提高文獻分析的效率。 PubMed DOI

研究蛋白質-蛋白質相互作用(PPIs)對於理解生物過程非常重要,尤其是在抗體與抗原、酶與抑制劑或促進劑的互動上。近期針對PPIs的研究,特別是與SARS-CoV-2的關聯,推動了疫苗的開發。雖然已有數據庫整理PPI網絡,但文本挖掘方法在新研究或少數物種中顯得尤為重要。比較不同的自然語言處理(NLP)工具後發現,傳統方法真陽性率高但網絡過度連接,機器學習方法則網絡結構相似但真陽性率低,而大型語言模型的表現則介於兩者之間。選擇合適的NLP方法需根據研究需求和文本量。 PubMed DOI