联泰集群-专注提供计算力!
登录
联泰集群服务电话 400-100-3811
联泰集群

Volta 架构 Tesla V100

最先进的数据中心GPU加速器

NVIDIA Tesla V100是当今市场上极其先进的数据中心GPU,能加快人工智能、高性能计算和图形技术的发展。Tesla V100采用新一代GPU的性能、让数据科学家、研究人员和工程师能够解决以前无法解决的难题。

人工智能训练

从语音识别到训练虚拟个人助理和教会自动驾驶汽车自动驾驶,数据科学家们正利用人工智能解决日益复杂的挑战。解决此类问题需要花大量时间密集训练复杂性飞速增长的深度学习模型。

Tesla V100拥有640个Tensor内核,是世界上第一个突破100万亿次(TFLOPS)深度学习性能障碍的GPU。新一代NVIDIA NVLink™以高达300GB/s的速度连接多个V100 GPU,在全球打造出功能极其强大的计算机服务器。现在,在之前的系统中需要消耗数周计算资源的人工智能模型在几天内就可以完成训练。随着训练时间的大幅度缩短,人工智能现在可以解决各类型问题。

人工智能推理

为了利用最相关的信息、服务和产品加强人与人之间的联 系,超大规模计算公司已经开始采用人工智能。然而,及时 满足用户需求是一项困难的挑战。例如,全球最大的超大规 模计算公司最近估计,如果每个用户一天仅花费三分钟时间 使用其语音识别服务,他们便需要将数据中心的容量翻倍。 我们设计 Tesla V100 就是为了在现有的超大规模服务器机架 上提供更高的性能。由于将人工智能作为核心,Tesla V100 GPU 可提供比 CPU 服务器高 30 倍的推理性能。这种吞吐量 和效率的大幅提升将使人工智能服务的外扩变成现实。

高性能计算(HPC)

高性能计算是现代科学的基石。从天气预报到发现药物和发现新能源,研究人员使用大型计算系统来模拟和预测我们的世界。人工智能可让研究人员分析大量数据,在仅凭模拟无法完全预测真实世界的情况下快速获取见解,从而扩展了传统的高性能计算。

Tesla V100 的设计能够融合人工智能和高性能计算。它为高性能计算系统提供了一个平台,在用于科学模拟的计算机科学和用于在数据中发现见解的数据科学方面表现优异。通过在一个统一架构内搭配使用 NVIDIA CUDA® 内核和Tensor 内核,配备 Tesla V100 GPU 的单台服务器可以取代数百台仅配备通用 CPU 的服务器来处理传统的高性能计算和人工智能工作负载。现在,每位研究人员和工程师都可以负担得起使用人工智能超级计算机处理最具挑战性工作的做法。

突破性创新

VOLTA架构

通过在一个统一架构内搭配使用 CUDA 内核和 Tensor内核,配备 Tesla V100 GPU的单台服务器可以取代数百台通用 CPU 服务器来处理传统的 HPC 和深度学习。

TENSOR 核心

Tesla V100 配有 640 个Tensor核心,可提供 125 万亿次级的深度学习性能。与 NVIDIAPascal™ GPU 相比,可为深度学习训练提供 12 倍张量浮点运算能力;为深度学习推理提供6 倍张量浮点运算能力。

新一代 NVLINK

Tesla V100 中采用的 NVIDIANVLink 可提供 2 倍于上一代的吞吐量。8 块 Tesla V100 加速器能以高达 300 GB/s 的速度互联,从而发挥出单个服务器所能提供的最高应用性能。

最大的能效模式

全新的最大节能模式可允许数据中心在现有的功耗预算内,使每个机架最高提升 40% 的计算能力。在此模式下,Tesla V100 以最大处理效率运行时,可提供高达 80% 的性能而只需一半的功耗。

HBM2

Tesla V100 将 900 GB/s 的改良版原始带宽与高达 95%的 DRAM 利用效率相结合,在 STREAM 上测量时可提供高于 Pascal GPU 1.5 倍的显存带宽。

可编程性

Tesla V100 的架构设计初衷即是为了简化可编程性。其全新的独立线程调度能力可实现细粒度同步,并能通过在琐碎的工作之间共享资源进而提升 GPU 的利用率。

NVIDIA TESLA V100 试用申请

立即注册