苹果全能视觉AI模型UniGen 1.5亮相,看图、修图、绘图三合一

IT之家 12 月 19 日消息,科技媒体 9to5Mac 昨日(12 月 18 日)发布博文,报道称苹果研究团队近日发布多模态 AI 模型 UniGen 1.5,成功在单一系统中集成了图像理解、生成 … 继续阅读 苹果全能视觉AI模型UniGen 1.5亮相,看图、修图、绘图三合一

豆包“包圆”互联网

豆包手机才发布半个多月,字节就发布了通用agent模型豆包 1.8。这是一个能在真实世界中“做事”的多模态大模型。 豆包 1.8可以直接操作你的手机、电脑和浏览器。它能看懂屏幕上的按钮和界面,然后像人 … 继续阅读 豆包“包圆”互联网

模型免费、推理翻倍:Gemini 3 Flash深夜炸场,发放智能体时代的“入场券”

AI竞技场开始清场。 就在刚刚,谷歌再次扣动扳机,正式推出了 Gemini 3 Flash。 这是继 Gemini 3 Pro 之后的又一次暴力输出。没有预告,没有任何铺垫,谷歌直接宣布 Gemini … 继续阅读 模型免费、推理翻倍:Gemini 3 Flash深夜炸场,发放智能体时代的“入场券”

Adobe Firefly更新:说句话就能修改视频元素、镜头角度

IT之家 12 月 17 日消息,Adobe 正在为其人工智能视频生成应用 Firefly 推送更新,新增一款支持基于文本指令精准编辑的视频编辑器,同时引入多款用于图像和视频生成的第三方模型,其中包括 … 继续阅读 Adobe Firefly更新:说句话就能修改视频元素、镜头角度

字节跳动发布Seedance 1.5 pro模型,支持音视频联合生成

凤凰网科技讯 12月16日,字节跳动发布新一代音视频生成模型Seedance 1.5 pro。该模型支持从文本或图像生成带有同步音频的视频,实现了音视频的联合生成。 据介绍,Seedance 1.5 … 继续阅读 字节跳动发布Seedance 1.5 pro模型,支持音视频联合生成

英伟达开源3款新推理模型,收购1家AI公司

智东西 作者 | ZeR0 编辑 | 漠影 智东西12月16日报道,今日,英伟达推出了NVIDIA Nemotron 3系列开放模型、数据和库,并公布Nemotron 3 Nano模型的技术报告。 N … 继续阅读 英伟达开源3款新推理模型,收购1家AI公司

新一代万相2.6系列模型发布:支持角色扮演、多镜头生成功能

凤凰网科技讯 12月16日,阿里巴巴旗下通义万相团队发布了新一代万相2.6系列模型。该版本被定义为国内首个支持角色扮演功能的视频生成模型,同时集成了音画同步、多镜头生成及声音驱动等能力。 据悉,万相2 … 继续阅读 新一代万相2.6系列模型发布:支持角色扮演、多镜头生成功能

二手机清除数据国家标准来了!强制“物理级”清除信息

快科技12月15日消息,近年来,手机、电脑等电子产品更新换代频率加快,大量旧手机、旧电脑进入回收渠道。 但这些电子产品中留存的账户信息、隐私数据、工作信息等,若未被彻底清除,就可能被不法分子利用,引发 … 继续阅读 二手机清除数据国家标准来了!强制“物理级”清除信息

美国视频生成老炮儿,入局世界模型

鹭羽 发自 凹非寺 量子位 | 公众号 QbitAI 世界模型赛道,又有老面孔新鲜入局! 就在刚刚,Runway发布旗下首个通用世界模型GWM-1。 不止于此,还打包发布了一系列世界模型变体: 模拟真 … 继续阅读 美国视频生成老炮儿,入局世界模型

高德地图推出首款台湾腔导航语音包 源于一次热门新闻

快科技12月12日消息,台湾省能用高德导航了,高德能用黄安导航语音了! 近日,高德地图携手台湾知名音乐人黄安,正式推出黄安导航语音包。用户在高德地图App中即可免费下载使用,用熟悉的乡音畅行两岸。 高 … 继续阅读 高德地图推出首款台湾腔导航语音包 源于一次热门新闻