作者 | 李水青 编辑 | 云鹏 智东西8月15日消息,今日晚间,阿里宣布推出首个开源多模态深度研究智能体(Deep Research Agent)——WebWatcher。 市面上的深度研究工具层出 … Continue reading 刚刚!阿里推出首个开源多模态深度研究Agent,四大VQA基准测试赶超GPT-4o
标签: 视觉
快手可灵2.1视频生成模型全新首尾帧功能开启内测,具备“电影级”效果
IT之家 8 月 15 日消息,快手旗下的可灵 2.1 模型今天开启全新首尾帧功能内测。据官方介绍,本次升级带来了显著的效果提升:更加流畅的“电影级”运镜控制、丝滑自然的转场效果以及精准的复杂语义理解 … Continue reading 快手可灵2.1视频生成模型全新首尾帧功能开启内测,具备“电影级”效果
Meta刚刚开源DINOv3,横扫60+任务,无标注封神
今天凌晨,全球社交、科技巨头Meta开源了,最新视觉大模型DINOv3。 DINOv3的主要创新使用了自我监督学习,无需标注数据就能大幅度降低训练所需要的时间和算力资源。并且与前一代相比,DINOv3 … Continue reading Meta刚刚开源DINOv3,横扫60+任务,无标注封神
戴上眼镜,起飞!影翎 A1 全景无人机首发评测
你大概率见过这样一幕——一台航拍无人机,身上绑着一部全景相机。早在 2022 年,影石就嗅到了这股创意的风,推出了适配大疆 Air2 系列的全景相机套件「瞳 Sphere」,让无人机玩家第一次尝到了 … Continue reading 戴上眼镜,起飞!影翎 A1 全景无人机首发评测
7小时0接管!特斯拉发布史上最长FSD演示,马斯克承诺升级自动充电,开车还能像打游戏
杰西卡 发自 副驾寺 智能车参考 | 公众号 AI4Auto FSD又进化到哪一步了? 特斯拉在社交平台上,最新发布了有史以来耗时最长的FSD演示视频: 从旧金山到洛杉矶,全程7小时、580公里,行驶 … Continue reading 7小时0接管!特斯拉发布史上最长FSD演示,马斯克承诺升级自动充电,开车还能像打游戏
智元机器人发布行业首个机器人世界模型开源平台 实测可完成做三明治、倒茶等任务
凤凰网科技讯 8月14日,智元机器人正式发布行业首个机器人世界模型开源平台——Genie Envisioner(简称GE)。该平台突破传统“数据—训练— 评估”割裂的流水线模式,宣称首次将未来帧预测、 … Continue reading 智元机器人发布行业首个机器人世界模型开源平台 实测可完成做三明治、倒茶等任务
曝iPhone18系列搭载全新A20芯片 iPhone 18 Fold明年发布
站长之家(ChinaZ.com)8月13日 消息:知名分析师郭明錤最新发文带来重磅消息,苹果公司明年下半年的新品布局有了新动态。据悉,苹果将在iPhone18系列上搭载全新设计的A20芯片,该芯片采用 … Continue reading 曝iPhone18系列搭载全新A20芯片 iPhone 18 Fold明年发布
曝PS6光追性能将超RTX 5080 画质飞跃远超PS4到PS5
据知名爆料者Tom最新信息,索尼下一代主机PlayStation 6(代号Orion/Canis)的光线追踪性能将实现巨大飞跃,预计达到PS5的十倍。这一提升被强调为下代主机的核心焦点。 爆料者驳斥了 … Continue reading 曝PS6光追性能将超RTX 5080 画质飞跃远超PS4到PS5
OpenAI奥特曼宣布GPT-5升级:提供“自动”“快速”“深度思考”模式,人格更亲和
凤凰网科技讯 8月13日,OpenAI首席执行官奥特曼在X平台上发布动态,详细介绍了 ChatGPT的最新功能更新情况。此次更新的核心在于GPT-5在多个关键领域实现了重大突破。 在响应模式方面,GP … Continue reading OpenAI奥特曼宣布GPT-5升级:提供“自动”“快速”“深度思考”模式,人格更亲和
OPPO宣布将医学指标引入护眼研发 下代Find旗舰率先应用研究成果
凤凰网科技讯(作者/于雷)8月13日,在昨日温州举办的第三届国际泪膜与眼表学会中国分会(TFOS China)上,OPPO正式宣布与视觉健康全国重点实验室达成战略合作,旨在将严谨的医学级标准全面引入手 … Continue reading OPPO宣布将医学指标引入护眼研发 下代Find旗舰率先应用研究成果