作者 | 江宇 编辑 | 漠影 智东西9月26日报道,蚂蚁百灵团队近日正式开源两款全新混合线性推理模型——Ring-mini-linear-2.0与Ring-flash-linear-2.0。相比前代 … Continue reading 蚂蚁百灵开卷模型性价比!长文本推理只要1/10成本,6.1B激活撬动40B性能
标签: attention
attention
GCNet: Non-local Networks Meet Squeeze-Excitation Networks and Beyond Abstract Non-Local Network(NLN … Continue reading attention