原始文章

這份調查探討基礎模型(FMs)在生物資訊學中的影響,特別是如何克服有限標註數據和數據噪音的挑戰。文章總結了FMs的演變、當前研究狀況及方法,並強調它們在序列分析、結構預測和功能註釋等生物學問題上的應用,與傳統方法進行比較。此外,還討論了FMs面臨的挑戰,如數據噪音、可解釋性和偏見,並提供對性能限制的見解。最後,文章展望了FMs在生物研究中的未來發展方向。 PubMed DOI


站上相關主題文章列表

FM是一種大型AI模型,能處理各種任務,代表了人工智慧領域的重大進步。它們包括語言模型、視覺語言模型和多模型。儘管通常是為了一般任務而訓練的,但已成功應用在不同領域,包括皮膚科學。了解FM技術在皮膚科學中的應用、挑戰和未來發展對臨床醫生和皮膚科醫生至關重要。 PubMed DOI

基礎模型是新一代人工智慧,適用於各種任務,不同於傳統模型只針對特定目標。在眼科領域,這些模型有潛力改革臨床實踐,成為其他醫學專業的典範。這篇評論提供眼科專業人員了解並應用基礎模型於他們研究和實踐的指引。內容包括基礎模型在眼科領域的關鍵概念、技術進展、訓練方法和現有文獻。評論也探討隱私、偏見和臨床驗證等挑戰,並提出最大化技術優勢的方法。 PubMed DOI

在分子生物學中,探索分子間的關聯性至關重要,而大型語言模型(LLMs)的出現大幅推進了這一領域。這些模型在自然語言處理和圖像生成上表現優異,能夠從龐大數據集中捕捉複雜關係,成為基礎模型。 目前的數據集涵蓋RNA、DNA、蛋白質序列及單細胞和空間轉錄組,為模型開發提供了豐富基礎。未來,基礎模型的發展將專注於提升可解釋性、整合多組學數據及增強預測能力,對於改進我們對生物系統的理解及治療策略具有巨大潛力。 PubMed DOI

去年推出的RETFound是眼科領域首個基礎模型,為通用醫療人工智慧(GMAI)奠定基礎。與此同時,像GPT-4和Gemini等大型語言模型也經過調整,並在臨床中測試,結果相當不錯。RETFound在小型數據集上表現優於傳統深度學習模型,而Med-Gemini和Medprompt GPT-4在眼科任務中也超越了標準模型。不過,眼科領域缺乏專門的多模態模型,主要因為訓練需求高和數據集稀缺。儘管基礎模型潛力大,但仍需高品質的數據集來進行有效訓練。 PubMed DOI

這項研究介紹了cdsFM,一個大型語言模型,專注於同義密碼子在蛋白質編碼中的角色。與現有模型不同,cdsFM認為同義密碼子的選擇有其調控和功能意義。它包含EnCodon和DeCodon,經過超過5,000種物種的數據預訓練,能學習密碼子與氨基酸的關係。這些模型在多項任務中表現優於現有基因組模型,並能有效預測同義密碼子的選擇對蛋白質表達的影響。研究還發現了多個潛在的致病性密碼子,顯示cdsFM在理解蛋白質合成中的重要性。 PubMed DOI

大型語言模型(LLMs)在生物醫學研究中展現潛力,但在計算生物學應用上仍面臨挑戰。雖然LLMs提供了創新的數據分析和假設生成方法,但其有效性尚未達到自然語言處理的水平。本次研討會將探討LLMs的最新進展,強調面臨的挑戰及未來在計算生物學的增強機會,主要討論主題包括LLM輸出的驗證、專有模型的限制,以及評估這些模型失效模式所需的專業知識。 PubMed DOI

大型語言模型(LLMs)正在改變生物醫學科學,特別是在理解生物序列方面。基因組語言模型(gLMs)專注於DNA序列,能幫助預測基因組中重要的功能區域、設計新DNA序列,並促進轉移學習。儘管如此,開發有效的gLMs仍面臨挑戰,如數據質量、模型架構及評估指標等。解決這些問題對於gLMs在複雜生物系統中的應用至關重要。 PubMed DOI

這項調查探討了基礎模型(FMs)在人工智慧中的影響,特別是它們如何與聯邦學習(FL)結合應用於生物醫學研究。像ChatGPT、LLaMa和CLIP等模型透過無監督預訓練和人類反饋強化學習,提升了機器學習的能力,能處理臨床報告和診斷影像等多種數據。結合基礎模型與聯邦學習,不僅能分析數據,還能保護醫療數據隱私,改善醫療診斷和個性化治療。調查也指出了當前的挑戰,並建議未來的研究方向,以促進醫療保健的創新。 PubMed DOI

基礎模型(FMs)是大型深度學習模型,透過自我監督學習在廣泛數據集上訓練,已在醫療領域取得成功。這項調查提供FMs在醫療中的歷史、學習策略、主要模型及應用的深入分析,特別是BERT和GPT如何影響臨床語言處理、醫學影像分析等領域。儘管FMs帶來許多機會,但也面臨挑戰,調查指出未解的研究問題,為研究人員和實務工作者提供見解,以促進FMs的應用並應對潛在風險。 PubMed DOI

基礎模型已成為人工智慧應用,特別是自然語言處理中不可或缺的部分。圖形機器學習也正朝向更先進的深度學習技術發展。基礎模型的成功促使研究者探索圖形基礎模型(GFMs),這些模型預期能在大型圖形數據集上進行預訓練,並適應不同任務。不過,這個新興領域目前缺乏明確定義和系統分析。本文介紹GFMs的關鍵特徵,並根據其對圖形神經網絡和大型語言模型的依賴程度,將研究分為三類,並回顧GFMs的現狀及未來研究方向。 PubMed DOI