只是换掉 Transformer 架构,立马性能全方位提升,问鼎同规模开源模型! (注意力机制不存在了) 这就是最新 Falcon Mamba 7B 模型。 ...

关注我们的公众号

微信公众号