Application of Deep Learning for Studying NMDA Receptors.
應用深度學習研究NMDA受體。 Methods Mol Biol 2024-05-10

人工智慧近年來進步神速，像ChatGPT等模型已經相當厲害。不過，將AI用在非專業領域還是有挑戰。為此，Uni-Mol模型開發了線上工具，專注於中樞神經系統疾病藥物開發，包括NMDA受體。這些工具像是BBB滲透性預測、QSAR分析和VD-gen分子生成模型，旨在幫助加速藥物研發，彌合AI技術與專家之間的鴻溝。 PubMed DOI

Meta predictive learning model of languages in neural circuits.
神經迴路中語言的元預測學習模型。 Phys Rev E 2024-05-17

大型語言模型在各種任務中表現優異，與大腦計算的關聯存在爭議。一個提出平均場學習模型的研究指出，大多數連接變得確定性，而輸出連接更具變異性。隨著訓練數據增加，網絡性能提升，提供有關大腦計算和通用智能的見解。 PubMed DOI

A Forward Learning Algorithm for Neural Memory Ordinary Differential Equations.
神經記憶常微分方程的前向學習演算法。 Int J Neural Syst 2024-06-23

深度神經網路使用反向傳播已成功，但不符合生物學原理。為此，針對離散神經網路，已做出努力。連續神經網路對於建立更貼近生物真實的模型及理解大型語言模型至關重要。神經記憶常微分方程式(nmODE)是一個有趣的連續神經網路模型。研究提出新的前向學習演算法nmForwardLA，適用於nmODE，效率更高、計算複雜度更低。實驗結果顯示，在MNIST、CIFAR10和CIFAR100數據集上，效果優於其他學習演算法。 PubMed DOI

Network properties determine neural network performance.
網絡特性決定神經網絡的表現。 Nat Commun 2024-07-08

機器學習在社會扮演重要角色，推動技術進步如Alphago和ChatGPT，已整合到消費品如智慧手機和自駕車。儘管人工神經網路廣泛使用，但因模型配置和數據嘈雜，理解仍有挑戰。新數學框架將神經網路表現與特性聯繫，可用早期數據預測模型表現。框架引入神經容量指標，評估模型泛化能力，優於現有方法。 PubMed DOI

Scale matters: Large language models with billions (rather than millions) of parameters better match neural representations of natural language.
規模重要性：擁有數十億（而非數百萬）參數的大型語言模型更能匹配自然語言的神經表徵。 bioRxiv 2024-07-15

最新研究利用先進語言模型研究人腦處理語言方式。模型提升語言能力，但神經科學研究未跟上。研究者用不同大小模型觀察其捕捉大腦語言資訊能力，發現大模型預測神經活動較佳。研究指出，隨模型增大，最佳神經信號預測層轉移到較早層，顯示大腦處理語言有組織層次結構。 PubMed DOI

Learning long sequences in spiking neural networks.
在脈衝神經網絡中學習長序列。 Sci Rep 2024-09-20

這項研究探討了狀態空間模型（SSMs）與脈衝神經網絡（SNNs）在長距離序列建模的整合，分析了SNNs面對現代架構如Transformers的挑戰。結果顯示，基於SSM的SNNs在長距離序列建模中表現優於Transformers，且在序列圖像分類中以較少參數超越現有SNNs。研究還引入了一個新特徵混合層，提升了SNN的準確性，並挑戰了對SNN中二元激活的傳統觀點。這為在神經形態硬體上實施先進的SSM模型開啟了新可能，促進了計算的能源效率。 PubMed DOI

Large language models surpass human experts in predicting neuroscience results.
大型語言模型在預測神經科學結果方面超越人類專家。 Nat Hum Behav 2024-11-28

這份摘要強調大型語言模型（LLMs）在預測實驗結果方面的潛力，特別是在神經科學領域。研究介紹了BrainBench，一個評估LLMs預測能力的基準測試。結果顯示，LLMs在預測上可超越人類專家，而專門模型BrainGPT的準確性更高。當LLMs表現出高度信心時，預測也相對可靠，顯示它們在協助人類發現過程中的潛在角色。這種方法論不僅適用於神經科學，還可能對其他知識密集型領域產生廣泛影響。 PubMed DOI

ConoDL: a deep learning framework for rapid generation and prediction of conotoxins.
ConoDL：一個快速生成和預測 conotoxins 的深度學習框架。 J Comput Aided Mol Des 2024-12-26

圓錐毒素是一種小型生物活性肽，具備很高的藥理潛力，但傳統的研究方法有限。為了解決這個問題，我們推出了ConoDL框架，專門用於圓錐毒素的生成與預測。它包含ConoGen模型，利用轉移學習和大型語言模型來生成圓錐毒素，還有ConoPred模型來精煉研究重點。評估結果顯示，ConoDL生成的圓錐毒素與天然毒素相似，並且有新穎的半胱氨酸骨架，這將有助於發現新的圓錐毒素分子及其藥理活性。 PubMed DOI

Efficient scaling of large language models with mixture of experts and 3D analog in-memory computing.
大型語言模型的高效擴展：專家混合與3D類比內存計算。 Nat Comput Sci 2025-01-08

大型語言模型（LLMs）在各領域表現出色，但其龐大的參數數量帶來了可擴展性挑戰，如高訓練成本和能量消耗。本文探討「專家混合」（MoEs）網路，透過條件計算來管理計算需求，並保持大量參數。重點在於將MoEs應用於基於三維非揮發性記憶體的類比內存計算硬體上，解決傳統模型的瓶頸。模擬結果顯示，MoEs的條件計算機制能降低推理成本，提升可及性和能量效率。 PubMed DOI

Incremental accumulation of linguistic context in artificial and biological neural networks.
人工與生物神經網絡中語言上下文的逐步累積。 Nat Commun 2025-01-17

這項研究探討大型語言模型（LLMs）與人類大腦在處理敘事資訊上的差異。雖然LLMs能預測與敘事相關的神經信號，但它們是平行分析大量文本，與大腦逐步處理的方式不同。研究使用219名參與者的fMRI數據，發現LLMs在短期上下文中表現較好。研究人員開發了一個增量上下文模型，結合短期與持續更新的長期上下文，顯著改善了對長期處理腦區活動的預測。這結果顯示大腦整合資訊的能力，對認知神經科學和人工智慧的發展提供了新見解。 PubMed DOI

原始文章

站上相關主題文章列表