Meta已经建造了一台人工智能超级计算机据称到2022年底将成为世界上最快的

导读社交媒体集团Meta是最新一家建造人工智能超级计算机的科技公司——这是一种专门用于训练机器学习系统的高速计算机。该公司表示,其新的AIRe

社交媒体集团Meta是最新一家建造“人工智能超级计算机”的科技公司——这是一种专门用于训练机器学习系统的高速计算机。该公司表示,其新的AIResearchSuperCluster或RSC已经是同类中速度最快的机器之一,并且在2022年年中完成后,将成为世界上最快的机器。

“Meta开发了我们认为是世界上最快的人工智能超级计算机,”Meta首席执行官马克扎克伯格在一份声明中说。“我们将其称为人工智能研究超级集群的RSC,它将在今年晚些时候完成。”

这一消息表明,人工智能研究对于Meta这样的公司具有绝对的核心地位。微软和英伟达等竞争对手已经发布了自己的“人工智能超级计算机”,这与我们认为的普通超级计算机略有不同。RSC将用于训练Meta业务中的一系列系统:从用于检测Facebook和Instagram上的仇恨言论的内容审核算法到有一天将在公司未来的AR硬件中提供的增强现实功能。而且,是的,Meta说RSC将被用于设计虚拟世界的体验——该公司坚持为一系列相互关联的虚拟空间打造品牌,从办公室到在线竞技场。

“RSC将帮助Meta的AI研究人员构建可以从数万亿个示例中学习的新的更好的AI模型;跨数百种不同语言工作;无缝分析文本、图像和视频;开发新的增强现实工具;等等,”Meta工程师KevinLee和ShubhoSengupta在一篇概述新闻的博客文章中写道。

“我们希望RSC能够帮助我们构建全新的AI系统,例如,可以为一大群人提供实时语音翻译,每个人都说不同的语言,这样他们就可以在研究项目上无缝协作或玩AR游戏一起。”

RSC的工作始于一年半前,Meta的工程师完全从头开始设计机器的各种系统——冷却、电源、网络和布线。RSC的第一阶段已经启动并运行,由760个NvidiaGGXA100系统组成,其中包含6,080个连接的GPU(一种特别擅长解决机器学习问题的处理器)。Meta表示,它已经在其标准机器视觉研究任务上提供了高达20倍的性能提升。

不过,在2022年底之前,RSC的第二阶段将完成。届时,它将包含大约16,000个GPU,并将能够“在1艾字节大的数据集上使用超过一万亿个参数”训练AI系统。(这个原始的GPU数量仅提供了一个系统整体性能的狭隘指标,但为了比较,微软使用研究实验室OpenAI构建的AI超级计算机是由10,000个GPU构建的。)

这些数字都非常令人印象深刻,但它们确实引发了一个问题:到底什么是人工智能超级计算机?它与我们通常认为的超级计算机——大学和政府部署的用于处理太空、核物理和气候变化等复杂领域的数字的大型计算机相比,又如何呢?

这两种类型的系统,称为高性能计算机或HPC,肯定比它们不同之处更相似。两者在尺寸和外观上都比单个计算机更接近数据中心,并且依赖大量互连的处理器以极快的速度交换数据。但正如HyperionResearch的HPC分析师BobSorensen向TheVerge解释的那样,两者之间存在关键差异。Sorensen说:“基于AI的HPC生活在一个与传统HPC同行有所不同的世界中,最大的区别在于准确性。

简单的解释是,机器学习要求的准确性低于传统超级计算机的任务,因此“人工智能超级计算机”(最近的一个品牌)可以比使用相同硬件的普通兄弟每秒执行更多的计算。这意味着当Meta说它建造了“世界上最快的AI超级计算机”时,它不一定与你经常在新闻中看到的超级计算机进行直接比较(排名由独立的Top500.org编制,每年发布两次)。

为了进一步解释这一点,您需要知道超级计算机和AI超级计算机都使用所谓的浮点算法进行计算——这是一种数学简写,对于使用非常大和非常小的数字(“浮点数”)进行计算非常有用”是小数点,它在有效数字之间“浮动”)。浮点计算中部署的准确度可以根据不同的格式进行调整,大多数超级计算机的速度是使用所谓的每秒64位浮点运算或FLOP来计算的。但是,由于AI计算对精度的要求较低,因此AI超级计算机通常以32位甚至16位FLOP来衡量。这就是为什么比较两种类型的系统不一定是苹果对苹果,

索伦森还提出了一个额外的警告。与评估硬件的“速度和馈送”方法经常发生的情况一样,吹嘘的最高速度并不总是具有代表性。“HPC供应商通常会引用性能数据,表明他们的机器可以运行的绝对速度。我们称之为理论峰值性能,”Sorensen说。“然而,一个好的系统设计的真正衡量标准是能够在他们设计的工作上快速运行。事实上,一些HPC在运行实际应用程序时实现的所谓峰值性能不到25%的情况并不少见。”

换句话说:超级计算机的真正效用在于它们所做的工作,而不是它们理论上的峰值性能。对于Meta,这项工作意味着在对公司的信任处于历史最低点的时候建立审核系统,并意味着创建一个新的计算平台——无论是基于增强现实眼镜还是元界——它可以在面对谷歌、微软和苹果等竞争对手。人工智能超级计算机为公司提供了原始动力,但Meta仍然需要自己找到制胜战略。

免责声明:本文由用户上传,如有侵权请联系删除!