深度学习 Tesla_P4
TESLA_P4


体验更大的推理吞吐量
在人工智能和智能机器新时代,深度学习正以与历史上其他计算模型截然不同的方式改变 着世界。互动语音、视觉搜索和视频推荐是我们日常使用的众多人工智能服务中的几项。
准确性和响应速度是决定用户是否采用这些服务的关键因素。随着深度学习模型的准确性 和复杂性越来越高,CPU 已经无法再提供响应灵敏的用户体验。
NVIDIA Tesla P4 采用革命性的 NVIDIA Pascal™ 架构,专为处理深度学习工作负载,启用 智能响应人工智能服务的外扩型服务器而打造,可显著提升其运作效率。该显卡可将任何 超大规模基础架构的延迟降低 15 倍,并可以提供比 CPU 高 60 倍的惊人能效。这使得我们 开发了许多新的人工智能服务,这些服务在过去由于延迟限制而无法实现。

功能 | |
小巧的外形和 50/75W 的功耗,适用于任何外扩型服务器。 | |
INT8 运算能力将延迟降低 15 倍。 | |
硬件解码引擎能对 35 路高清视频流进行实时转码和推理。 | |
规格 | |
GPU架构 | NVIDIA Pascal™ |
单精度浮点运算能力 | 5.5 TeraFLOPS* |
整数运算能力 (INT8) | 22 TOPS* (万亿次运算/秒) |
GPU 显卡 | 8 GB |
显存带宽 | 192 GB/s |
系统接口 | PCI Express 半高外形 |
外形 | 4.4"(高)x 10.5"(长),双插槽,全高 |
最大功耗 | 50W/75W |
已使用页面迁移引擎提升编程能力 | 是 |
ECC保护 | 是 |
针对数据中心部署优化服务器 | 是 |
硬件加速视频引擎 | 1 个解码引擎,2 个编码引擎 |
NVIDIA TESLA P4加速器的特性和利益点
打造 Tesla P4 的主要目的是在外扩型服务器中实现实时推理性能和智能用户体验。