年底集成100万颗自研芯片!AWS最大AI计算集群上线,Anthropic已用上

编译 | 王欣逸

编辑 | 程茜

东西10月30日消息,10月29日,AWS(亚马逊云科技)宣布与Anthropic合作开发的AI超级集群Project Rainier已投入使用,目前集成了近50万颗亚马逊自主研发的Trainium2芯片,预计到今年年底,Anthropic的AI模型Claude将在超过100万颗Trainium2芯片上运行。

AWS称,Project Rainier的规模比该公司以往任何AI计算平台都大出约70%。去年12月,AWS宣布启动Project Rainier,旨在构建一个分布在美国多个数据中心的AI计算集群。距离项目首次宣布仅不到一年的时间,Project Rainier就正式上线。这一计划采用了近50万颗Trainium2芯片,提供的计算能力是Anthropic之前用于训练其AI模型的五倍以上。

Project Rainier(图源:Amazon)

Trainium2是一款专门为训练AI系统而定制的AWS AI芯片,拥有极其强大的性能单颗芯片每秒可完成数万亿次计算。区别笔记本电脑手机中的通用芯片,Trainium2专门为训练复杂的AI模型所需海量数据而设计。

数千个Trainium2芯片将连接成一种新型的Amazon EC2 UltraServer和EC2 UltraCluster架构,从而实现整个庞大系统内的超高速通信和数据共享

Anthropic正在利用Project Rainier的计算集群来构建和部署其AI模型Claude,该公司计划在今年年底前,在Project Rainier上使用超过100万个Trainium2芯片。

目前,Project Rainier正被用于构建和部署升级版本的Claude。AWS称,当用于训练大模型的计算能力越强,训练出的模型就会变得越智能、越精准

结语:AWS押注AI超级算力工厂竞赛

AWS杰出工程师兼Trainium首席架构师罗恩·迪亚曼特(Ron Diamant)称:“这是一个规模庞大、独一无二基础设施项目,它将引领下一代AI模型的到来。”

10月28日,亚马逊宣布裁员约3万人,据外媒CNBC报道,亚马逊正在进一步调整资源结构,重新分配,优先向AI和Trainium芯片等倾斜。

亚马逊将于今日收盘后公布第三季度财报,AWS的增长情况将备受关注。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平