Mamba

Mamba

2025/4/19 12:04:44 来源：https://blog.csdn.net/m0_73811793/article/details/136819404 浏览: 次关键词：Mamba

h（t）本身的状态参量，x（t）是这一时刻的输入

h‘（t）的导数就是与本身的状态以及输入有关.

y(t)就是输出

因为NLP是要处理离散的状态，所以要将连续的状态转换成离散的状态

h（t）与h（t-1）前一时刻还有输入相关，其实可以看到在形式上与连续状态空间方程类似

有个缺点：对于一个时间部，这里的ABC是一个固定的值，如果时间部不同，那么ABC也不同，那么就无法实现convolutional

关于current和convolutional

Current：通常指的是递归神经网络（Recurrent Neural Network, RNN）中的术语，它表示网络在处理序列数据时，当前步骤的输出会依赖于前面步骤的信息。RNN能够处理任意长度的序列数据，并且在每一步都维护一个内部状态，这个状态就是“current state”，它包含了前面的信息。
Convolutional：指的是卷积神经网络（Convolutional Neural Network, CNN）中的术语，它表示网络通过卷积层来提取特征。在卷积层中，神经元会对输入数据的局部区域进行卷积操作，以此来捕捉局部特征。