11月25日,腾讯混元宣布推出开源模型HunyuanOCR,参数仅为1B。HunyuanOCR是混元原生多模态端到端OCR专家模型,主要由三大部分组建构成:原生分辨率视频编码器、自适应视觉适配器和轻量 … Continue reading 腾讯混元OCR专家模型宣布开源,参数仅1B
标签: 视频生成模型
腾讯混元OCR模型宣布开源
财联社11月25日电,腾讯混元推出全新开源模型HunyuanOCR,参数仅为1B,依托于混元原生多模态架构打造,获得多项业界OCR应用榜单SOTA(最先进水平)成绩。
Anthropic发布模型Claude Opus 4.5
每经AI快讯,当地时间11月24日,Anthropic正式发布其最新模型Claude Opus 4.5。该模型已在Anthropic应用、API以及三大云平台开放使用。
Anthropic正式发布最新的模型Claude Opus 4.5
财联社11月25日电,Anthropic正式发布最新的模型Claude Opus 4.5。微软宣布在Microsoft Foundry、GitHub Copilot付费计划及Microsoft Cop … Continue reading Anthropic正式发布最新的模型Claude Opus 4.5
谷歌新版Nano Banana上线
《科创板日报》20日讯,当地时间11月20日,谷歌的新一代多模态AI模型、第二代Nano Banana(代号Gemini 3.0 Pro Image)更新,新版本的正式代号是Gemini 3 Pro … Continue reading 谷歌新版Nano Banana上线
李飞飞团队推出首款商用世界模型Marble
11月13日,AI教母、斯坦福大学教授李飞飞的创业公司World Labs宣布推出首款商用世界模型Marble。Marble支持大规模多模态,可以从文本、图像、视频或粗略的3D布局中创建3D世界;Ma … Continue reading 李飞飞团队推出首款商用世界模型Marble
百度将发布新一代数字人
界面新闻获悉,百度即将推出一款“具备实时连麦交互能力”的新一代数字人,该产品在响应速度、多模态实时生成与感知真实物理世界方面实现关键突破。
月之暗面宣布发布Kimi K2 Thinking开源思考模型。
每经AI快讯,据“月之暗面Kimi”官微11月6日消息,月之暗面宣布发布Kimi K2 Thinking开源思考模型。据悉,Kimi迄今能力最强的开源思考模型。前往kimi官网或更新到最新版Kimi … Continue reading 月之暗面宣布发布Kimi K2 Thinking开源思考模型。
MiniMax发布Hailuo 2.3视频生成模型
10月28号,MiniMax稀宇极智正式发布其最新视频生成模型海螺2.3(Hailuo 2.3),在动态表现力、风格化呈现以及人物表演细腻度方面较上一代取得提升。此外,MiniMax还将海螺Video … Continue reading MiniMax发布Hailuo 2.3视频生成模型
Sora 2 爆火社交平台,AI影像纪元新开端
近期,OpenAI发布的文生视频模型Sora 2,以其惊人的真实感和“客串”功能引爆了全球社交网络,在中国市场更是掀起了一场关于技术、应用与投资的全民热议。这不仅是一次技术的迭代,更是对整个内容创作产 … Continue reading Sora 2 爆火社交平台,AI影像纪元新开端

