周三,人工智能 (AI) 创新前沿的基准测试组织 MLCommons 宣布推出旨在评估 AI 硬件效率的新基准。这些测试的重点是测量人工智能模型(例如 ChatGPT 中使用的模型)在生成用户查询答案时的响应速度。这一发展标志着理解和增强人工智能技术性能的重要一步。
MLCommons 新推出的基准旨在对顶级人工智能芯片和系统处理和响应信息的速度进行全面评估。具体来说,这些基准测试旨在通过测量人工智能模型生成响应的速度来模拟现实世界的应用程序。其中包括名为Llama 2 的问答场景基准测试,该基准测试拥有 700 亿个参数,由 Meta Platforms 开发,以及基于 Stability AI 的 Stable Diffusion XL 模型的文本到图像生成器基准测试。这些基准测试的结果让我们得以一睹人工智能应用的未来,展示了快速、高效的用户交互的潜力。人工智能性能的领导者
Nvidia 在最近的基准测试中脱颖而出,其 H100 芯片展示了卓越的原始性能能力。不过,英特尔和高通也做出了自己的贡献,提交了自己的人工智能芯片设计进行评估。这些结果突显了人工智能硬件开发的竞争格局,各公司都在努力实现高性能和能源效率。特别是能源效率已被确定为人工智能应用实际部署的关键因素,导致 MLCommons 在其基准测试中包含一个单独的类别来测量功耗。对人工智能未来的影响
MLCommons 添加这些基准不仅仅是一项技术成就;它代表了创建响应速度更快、更高效的人工智能系统的重大进步。通过建立评估人工智能性能的标准化方法,MLCommons 正在为未来的创新铺平道路,这些创新可能会彻底改变我们与技术交互的方式。随着人工智能应用的不断发展,此类基准在指导开发和部署策略方面的重要性不容低估。
这些基准的公布标志着人工智能研究和开发的一个有希望的方向。它不仅展示了当前人工智能技术的能力,还为未来的改进树立了基准。随着公司和研究人员努力满足并超越这些标准,我们可以期望看到人工智能系统不仅速度更快,而且更加节能和易于使用。这一进步通过实现更复杂、响应更灵敏的人工智能驱动解决方案,为从医疗保健到客户服务等众多行业的转型带来了巨大的潜力。