指令 – 第 31 页 – 冯金伟博客园

苹果全能视觉AI模型UniGen 1.5亮相，看图、修图、绘图三合一

IT之家 12 月 19 日消息，科技媒体 9to5Mac 昨日（12 月 18 日）发布博文，报道称苹果研究团队近日发布多模态 AI 模型 UniGen 1.5，成功在单一系统中集成了图像理解、生成 … 继续阅读苹果全能视觉AI模型UniGen 1.5亮相，看图、修图、绘图三合一

豆包手机才发布半个多月，字节就发布了通用agent模型豆包 1.8。这是一个能在真实世界中“做事”的多模态大模型。豆包 1.8可以直接操作你的手机、电脑和浏览器。它能看懂屏幕上的按钮和界面，然后像人 … 继续阅读豆包“包圆”互联网

AI竞技场开始清场。就在刚刚，谷歌再次扣动扳机，正式推出了 Gemini 3 Flash。这是继 Gemini 3 Pro 之后的又一次暴力输出。没有预告，没有任何铺垫，谷歌直接宣布 Gemini … 继续阅读模型免费、推理翻倍：Gemini 3 Flash深夜炸场，发放智能体时代的“入场券”

IT之家 12 月 17 日消息，Adobe 正在为其人工智能视频生成应用 Firefly 推送更新，新增一款支持基于文本指令精准编辑的视频编辑器，同时引入多款用于图像和视频生成的第三方模型，其中包括 … 继续阅读 Adobe Firefly更新：说句话就能修改视频元素、镜头角度

凤凰网科技讯 12月16日，字节跳动发布新一代音视频生成模型Seedance 1.5 pro。该模型支持从文本或图像生成带有同步音频的视频，实现了音视频的联合生成。据介绍，Seedance 1.5 … 继续阅读字节跳动发布Seedance 1.5 pro模型，支持音视频联合生成

智东西作者 | ZeR0 编辑 | 漠影智东西12月16日报道，今日，英伟达推出了NVIDIA Nemotron 3系列开放模型、数据和库，并公布Nemotron 3 Nano模型的技术报告。 N … 继续阅读英伟达开源3款新推理模型，收购1家AI公司

凤凰网科技讯 12月16日，阿里巴巴旗下通义万相团队发布了新一代万相2.6系列模型。该版本被定义为国内首个支持角色扮演功能的视频生成模型，同时集成了音画同步、多镜头生成及声音驱动等能力。据悉，万相2 … 继续阅读新一代万相2.6系列模型发布：支持角色扮演、多镜头生成功能

快科技12月15日消息，近年来，手机、电脑等电子产品更新换代频率加快，大量旧手机、旧电脑进入回收渠道。但这些电子产品中留存的账户信息、隐私数据、工作信息等，若未被彻底清除，就可能被不法分子利用，引发 … 继续阅读二手机清除数据国家标准来了！强制“物理级”清除信息

鹭羽发自凹非寺量子位 | 公众号 QbitAI 世界模型赛道，又有老面孔新鲜入局！就在刚刚，Runway发布旗下首个通用世界模型GWM-1。不止于此，还打包发布了一系列世界模型变体：模拟真 … 继续阅读美国视频生成老炮儿，入局世界模型

快科技12月12日消息，台湾省能用高德导航了，高德能用黄安导航语音了！近日，高德地图携手台湾知名音乐人黄安，正式推出黄安导航语音包。用户在高德地图App中即可免费下载使用，用熟悉的乡音畅行两岸。高 … 继续阅读高德地图推出首款台湾腔导航语音包源于一次热门新闻