作者|周一笑 你可以不关心香蕉的价格,但很难忽视Nano Banana这根香蕉。 在社交媒体和技术社区,用户正热衷于分享它的各种玩法,有人用它把桌面手办转换成真人 Cosplay,有人上传多张素材图, … Continue reading Nano Banana有点ChatGPT时刻的味儿了
标签: 语义
0.3B!谷歌开源新模型,手机断网也能跑,0.2GB内存就够用
作者 | 李水青 编辑 | 云鹏 智东西9月5日消息,今天,谷歌开源一款全新的开放式嵌入模型EmbeddingGemma。该模型以小博大,拥有3.08亿个参数,专为端侧AI设计,支持在笔记本、手机等设 … Continue reading 0.3B!谷歌开源新模型,手机断网也能跑,0.2GB内存就够用
苹果最新模型,5年前的iPhone能跑
编译 | 程茜 编辑 | 云鹏 智东西9月1日消息,苹果又公布了大模型研发新进展! 8月28日,苹果在arXiv发布新论文,介绍新一代多模态基础模型MobileCLIP2及其背后的多模态强化训练机制, … Continue reading 苹果最新模型,5年前的iPhone能跑
3D打印火出圈了?一众网友秀“成果” 幕后推手竟是这款AI模型
《科创板日报》9月1日讯 一张三维建模图、一个手办模型、一个印有“Nano-banana”字样的包装盒……在刚刚过去的周末,朋友圈突然涌现出大量雷同的“3D打印手办”图片。这些手办或是明星角色,或是家 … Continue reading 3D打印火出圈了?一众网友秀“成果” 幕后推手竟是这款AI模型
腾讯混元开源端到端AI模型Hunyuan-Foley:视频+文字=“电影级”音效
IT之家 8 月 28 日消息,腾讯混元今天午间宣布开源端到端视频音效生成模型 Hunyuan-Foley,用户只需输入视频和文字,就能为视频匹配电影级音效。 根据官方介绍,HunyuanVideo- … Continue reading 腾讯混元开源端到端AI模型Hunyuan-Foley:视频+文字=“电影级”音效
神秘香蕉AI 正式上线!Google P 图新王深夜炸场|附体验方式
还记得之前大家热议的神秘 AI 图片编辑模型「nano-banana」吗? 前几天,我们在 LMArena 大语言模型竞技场里面用它进行了多轮测试,结果表现都非常出色。 现在,Google 终于揭开了 … Continue reading 神秘香蕉AI 正式上线!Google P 图新王深夜炸场|附体验方式
阿里图像生成模型登顶HuggingFace,一句话把马斯克“变老”
就在8月19日,阿里发布了Qwen-Image,这是一个图像生成基础模型。这个模型的特点是,通过系统性的数据工程、渐进式的学习策略、改进的多任务训练范式以及可扩展的架构优化,旨在解决复杂文本渲染和精准 … Continue reading 阿里图像生成模型登顶HuggingFace,一句话把马斯克“变老”
开源版Genie 3世界模型来了:实时+长时间交互,单卡可跑,国内公司出品
世界模型,正在迎来一次技术大突破。 本月初,Google DeepMind 发布的 Genie 3,因为效果惊艳,关注度直接超越了 OpenAI 同日发布的 GPT-5。 Genie 3 实现了实时互 … Continue reading 开源版Genie 3世界模型来了:实时+长时间交互,单卡可跑,国内公司出品
阿里“干掉”PS了,深夜正式开源
作者 | 李水青 编辑 | 心缘 智东西8月19日报道,今日,阿里推出Qwen-Image-Edit,这是其此前8月5日推出的图像生成基础模型Qwen-Image的图像编辑版本。(阿里开源图像大模型, … Continue reading 阿里“干掉”PS了,深夜正式开源
通义千问Qwen-Image-Edit发布:兼具语义与外观双重编辑能力
凤凰网科技讯 8月19日,通义千问Qwen宣布推出Qwen-Image-Edit,Qwen-Image的图像编辑版本。 Qwen-Image-Edit基于20B的Qwen-Image模型进⼀步训练,成 … Continue reading 通义千问Qwen-Image-Edit发布:兼具语义与外观双重编辑能力