谷歌推出基准测试检验AI是否“靠谱”:Gemini 3 Pro准确率仅69%

IT之家 12 月 13 日消息,据《商业内幕》今日报道,谷歌 DeepMind 本周发布了 FACTS 基准测试,用来检验 AI 在事实准确性方面到底靠不靠谱。 这一测试从四个维度评估模型能力,包括 … 继续阅读 谷歌推出基准测试检验AI是否“靠谱”:Gemini 3 Pro准确率仅69%