科大讯飞:已完成MoE和强化学习等算法在昇腾算力上的适配优化

财联社9月29日电,科大讯飞在互动平台表示,科大讯飞研发团队在各类芯片适配优化工作上具备丰富的工程实践经验,面对新算法和新架构,讯飞会持续联合国内芯片厂商团队开展攻关优化,当前已经完成MoE和强化学习 … Continue reading 科大讯飞:已完成MoE和强化学习等算法在昇腾算力上的适配优化

阿里巴巴宣布与英伟达开展Physical AI合作

《科创板日报》24日讯,在2025阿里云栖大会上,阿里巴巴正式宣布与英伟达开展Physical AI合作。合作覆盖了Physical AI的实践的各个方面,包括数据的合成处理,模型的训练,环境仿真强化 … Continue reading 阿里巴巴宣布与英伟达开展Physical AI合作

推荐系统(10)—— 进化算法、强化学习

1、进化策略(ES:evolution strategy)   在一定的抽象程度上,进化方法可被视为这样一个过程:从个体构成的群体中采样并让其中成功的个体引导未来后代的分布。但是,其数学细节在生物进化 … Continue reading 推荐系统(10)—— 进化算法、强化学习

《超级马里奥兄弟》通关了没?强化学习算法的AI成功拿下29个关卡!

  《超级马里奥兄弟》你能玩到第几关?说起这款 FC 时代的经典游戏,大家可能再熟悉不过了,大鼻子、留胡子,永远穿着背带工装服的马里奥大叔,成为了很多 80/90 后的童年回忆。看着画面中熟悉的马里奥 … Continue reading 《超级马里奥兄弟》通关了没?强化学习算法的AI成功拿下29个关卡!

《Nature》最新研究:大脑中存在分布式强化学习机制

作者 | DeepMind 编译 | 雷锋网 AI 科技评论 雷锋网(公众号:雷锋网)编者按:人工智能与神经科学/脑科学之间存在剪不断理还乱的关系。从人工智能诞生之初,其研究就深受神经科学的影响,包括 … Continue reading 《Nature》最新研究:大脑中存在分布式强化学习机制

深度强化学习 继续死磕电子游戏还是另辟蹊径?

  2019年,深度强化学习可以算得上 AI 研究的 Top 关键词之一。 无论是 DeepMind 星际2 AI 「AlphaStar」血虐人类玩家,还是 OpenAI 最终因太 … Continue reading 深度强化学习 继续死磕电子游戏还是另辟蹊径?