ChatGPT在日本高考中斩获九科满分,平均分达96.9

IT之家 1 月 21 日消息,一家人工智能企业于当地时间本周二宣布,在今年的日本大学统一入学考试中,人工智能聊天机器人 ChatGPT 斩获九门科目满分。 日本 AI 初创企业 LifePrompt … 继续阅读 ChatGPT在日本高考中斩获九科满分,平均分达96.9

谷歌新发现:DeepSeek推理分裂出多重人格,左右脑互搏越来越聪明

AI变聪明的真相居然是正在“脑内群聊”?! 谷歌最新研究表明,DeepSeek-R1这类顶尖推理模型在解题时,内部会自发“分裂”出不同性格的虚拟人格,比如外向的、严谨的、多疑的…… 大模型的解题推理过 … 继续阅读 谷歌新发现:DeepSeek推理分裂出多重人格,左右脑互搏越来越聪明

多模态大模型输给三岁宝宝?新评测集BabyVision发布

凤凰网科技讯 1月12日,近日,红杉中国旗下评测体系xbench与UniPat AI团队联合发布全新多模态理解评测集BabyVision,旨在系统评估大模型在不依赖语言提示下的纯视觉基础能力。评测结果 … 继续阅读 多模态大模型输给三岁宝宝?新评测集BabyVision发布

陶哲轩亲自曝光:AI破解数学难题,竟全是“抄”的?

新智元报道 编辑:YHluck 【新智元导读】数学大神陶哲轩近期发现,AI声称破解的Erdos难题,实则是多年前已被人类解决但被遗忘的「旧闻」。这揭示了AI当前的核心能力并非从0创新,而是利用超强算力 … 继续阅读 陶哲轩亲自曝光:AI破解数学难题,竟全是“抄”的?

达到金牌分数线:字节跳动推出新一代数学推理专用模型Seed Prover 1.5

凤凰网科技讯 12月24日,字节跳动Seed团队近日推出新一代形式化数学推理模型Seed Prover 1.5。该模型基于大规模智能体强化学习训练,在数学竞赛题的形式化证明能力上有所提升。 据官方信息 … 继续阅读 达到金牌分数线:字节跳动推出新一代数学推理专用模型Seed Prover 1.5

谷歌杀疯了!Gemini 3 Flash 突袭:这个跑腿小弟差点打败了GPT-5.2

一个月前,谷歌发布了最新的 Gemini,从此我们进入了 Gemini 3 的时代。 那以后, Gemini 3 Pro 就成了我干活的主力。 但说实话,它反应是真慢,而且很多时候我只是问些简单问题, … 继续阅读 谷歌杀疯了!Gemini 3 Flash 突袭:这个跑腿小弟差点打败了GPT-5.2

千问再放大招!阿里最强学习模型上线,能讲题、会批改、懂专业,直接把老师“请回家”

作者 | 王涵 编辑 | 漠影 千问最近的风头可不小。 此前,阿里即将发布千问App的消息在海外掀起强烈反响,甚至还被外媒取了“Qwen Panic”(千问恐慌)的名字。 11月17日千问app官宣发 … 继续阅读 千问再放大招!阿里最强学习模型上线,能讲题、会批改、懂专业,直接把老师“请回家”

谷歌Gemini 3杀疯了!陶哲轩亲测:10分钟干翻百年数学难题

编辑:犀牛 【新智元导读】Gemini 3一日霸榜数学、物理两个顶级基准测试!与此同时,陶哲轩用Gemini DeepThink十分钟便搞定了一道埃尔德什难题。 继续领跑! Gemini 3本周一发布 … 继续阅读 谷歌Gemini 3杀疯了!陶哲轩亲测:10分钟干翻百年数学难题

作业帮APP惊现“学生跳楼”题目 网友:没见过这么恶毒的题

快科技11月4日消息,据媒体报道,近日有网友反映,作业帮APP上出现了调侃学生跳楼自杀的题目。 根据网友截图的题目显示:“生命可以轮回,高考只有一次。” “在内卷的大背景下,有不少学生受地球引力影响而 … 继续阅读 作业帮APP惊现“学生跳楼”题目 网友:没见过这么恶毒的题

百川发布循证增强大模型M2 Plus,号称“医生版 ChatGPT”

IT之家 10 月 22 日消息,据百川大模型官方微信公众号消息,今天,百川发布了循证增强医疗大模型 Baichuan-M2 Plus,同步升级配套应用百小应并开放 API。这是百川自 8 月开源 B … 继续阅读 百川发布循证增强大模型M2 Plus,号称“医生版 ChatGPT”