随着生成式人工智能(GenAI)日益普及,很多组织的CIO开始优化他们的IT系统,以充分挖掘AI技术的潜力。例如,美国电信巨头AT&T部署了3000多个AI机器人实施重复性任务,达美航空公司(Delta Airlines)使用AI IT运营管理平台来减少服务中断对客户的影响。
然而,随着IT环境的更新,也需要对IT基础设施进行更新和改造。数据中心的发展速度难以跟上AI为组织带来的好处。其中许多组织针对AI进行了优化,以实现运营自动化、改善资源管理、增强网络安全并提供更好的服务。
尽管如此,数据中心仍无法提供大规模开发和实施AI应用所需的资源,一个新的生态系统应运而生,那就是AI工厂。
AI工厂是做什么的?
AI工厂或AI数据中心是为满足AI的特定需求而设计的设施,为部署复杂的AI应用程序和模型提供基础设施和资源。
AI工厂的目的类似于数据中心和生产工厂。就像工厂生产产品一样,AI工厂生产“智能”,然后采用智能运行AI模型和其他资产以及IT系统。
Artefact咨询总监Nina Abide表示,“AI工厂通过标准化流程简化了AI模型的生产,实现了跨行业的高效扩展。它们涵盖了从数据准备到模型部署的各个阶段,并利用自动化来提高速度和效率。”
AI工厂的一个固有特征是生成智能。AI工厂处理大量数据,以产生智能并更新其运营的系统,或者创建包括文本、图像、视频或音频内容在内的输出。AI工厂产生的智能也可以作为命令来控制机器人或超级计算机等系统。
2024年3月,英伟达CEO黄仁勋在GTC大会上发表演讲时介绍了AI工厂的蓝图,他将其定义为“将原材料转化为有价值的新产品的地方”。他将AI工厂称之为“新工业革命的家园”。
他说,“AI工厂输入的原材料是数据和电力,生产的产品是数据令牌(tokens)。令牌是不可见的,可以发送到世界各地,它是非常有价值的。”
企业构建AI工厂的方法
作为专门建造的设施,AI工厂允许在IT环境中全面实施AI。这些量身定制的数据中心拥有将GenAI部署到IT运营中所必需的硬件和软件,从而提高效率、可扩展性和创新性。
Arcadis全球制造总监Martijn Karrenbeld说,“AI工厂可以通过流程自动化和工作流程优化来提高效率。其中一个真正的好处是能够通过简化制造过程来降低运营成本。这为未来的扩大业务规模提供了更多的组织灵活性和可扩展性,从而加快了上市速度。”
AI工厂是如何运作的?
AI工厂背后的理念是训练AI模型来产生智能。为此,相关数据被输入到计算系统的模型中,这样它就可以分析数据并做出预测。
如果这些预测是准确的,AI模型就会得到训练,并可以通过AI推理过程开始执行所需的任务。
与传统数据中心相比,AI工厂需要更多的电力、能源和冷却解决方案。事实上,由于这些设施通常是为处理大量数据和开发或培训新系统而设计的,因此需要采用高性能服务器机架、专用硬件加速器、大型存储系统和网络基础设施。
为了能够处理相关的工作负载,AI工厂采用专门的IT硬件建造,其中包括定制设计的AI芯片和图形处理单元(GPU)。
还没有评论,来说两句吧...