GALAX GeForce RTX 2080 Ti 登场

导读 NVIDIA 正式发布新一代「Turing」GPU 微架构旗舰级绘图卡「GeForce RTX 2080 Ti」,它是近十多年来 GPU 最大的架构跃进,基于全新


NVIDIA 正式发布新一代「Turing」GPU 微架构旗舰级绘图卡「GeForce RTX 2080 Ti」,它是近十多年来 GPU 最大的架构跃进,基于全新 12nm FFN 制程的「TU102」绘图核心,高达 186 亿个电晶体、内建 4,352 个 CUDA Cores,首次加入 Tensor Core 及 RT Core 运算单元,带来革命性 AI 运算及光射追踪渲染,不仅性能表现进一步提升,更将 PC 游戏画质带进另一个层次。



全新「Turing」GPU微架构

NVIDIA 正式发布基于全新「Turing」GPU 微架构的旗舰级游戏绘图卡、核心代号为「TU102」的「GeForce RTX 2080 Ti」,它是近十多年来 GPU 最大的架构跃进,包括新增 Tensor 核心、RT 核心及许多新的进阶着色功能,透过全新硬体加速引擎及混合渲染技术,能实时提供光线追踪渲染,提供更逼真的物体阴影、反射及折射效果,除了性能表现进一步提升外,更将 PC 游戏真实感带进另一个层次。

Turing

与 NVIDIA「Turing」GPU 微架构开发并行,Microsoft 在 2018 年初宣布全新 A.I 人工智能及 DXR 光线追踪的 DirectML API,令游戏开发人员可以快速部署 A.I 人工智能技术与光线追踪于新游戏中,融合光栅化、实时光线追踪、人工智能和模拟,在 PC 游戏中实现令人难以置信的真实感,神奇网络提供惊人的新效果、电影级交互式体验和流畅创建或导航複杂 3D 模型的交互性。

Turing

此外,全新「Turing」GPU 还承继了「Volta」微架构中所有增强的「CUDA」功能,例如独立线程调度、针对多个 CUDA 应用的地址空间隔离 MPS 硬体加速能力以及全新的协作加速,令新一代 GeForce RTX 绘图卡的「CUDA」运算能力更灵活、性能更强大。

12nm FinFET 制程、TU102 绘图核心

NVIDIA 「Turing」 GPU 架构相较上代「Pascal」更为複杂,上代「GP102」绘图核心採用 16nm 制程、内建 120 亿个电晶体,Die Size 为 471mm² 、 TDP 为 250W;全新「TU102」绘图核心增至 186 亿个电晶体,受惠于全新TSMC 12nm FFN 制程配合 VLSI 超大型积体电路优化,虽然 Die Size 增至 754mm²,运算单元数目大幅提升,但 TDP 仍保持为 250~260W 水平,性能功耗表现更上一层楼。

Turing

NVIDIA TU102 绘图核心

全新「GeForce RTX 2080 Ti」绘图卡除了在 CUDA Cores 数目上提升至 4,352 个外,同时改用全新 Stream Multi-Processor 架构,相较上代「Pascal」每个 CUDA Core 性能最高可提升 50%,今代更新增了 544 个 Tensor Cores 及 68 个 RT Cores,其中 Tensor Cores 是专门用于执行向量及矩阵运算的专用执行单元,RT Core 则可用于实时光线追踪运算上,无论 3D 运算、A.I 智能运算及光线追踪运算上均有突破性发展。

Turing

此外,NVIDIA「TU102」绘图核心新增了多种进阶阴影技术,包括 Mesh Shading 网状阴影、VRS 可变速率阴影及 Texture-Space 空间纹理着色阴影,同时对视点偏移应用加入全新 MVR 多视点图形渲染技术。全新 NVIDIA RTX 系列首次加入 DNN 深度学习的神经网络运算,包括超高品质 NGX DLSS ( 深度学习超级採样)、AI InPainting 内容识别图像替换、AI Slow-Mo 非常高品质和平滑慢动作,以及 AI Super Rez 智能分辨率调整大小,为 PC 游戏世界带来革命性突破。

GeForce GTX 1080 Ti vs GeForce RTX 2080 Ti

GeForce GTX 1080 TiGeForce RTX 2080 TiArchitecturePascalTuringManufacturing ProcessTSMC 16nmTSMC 12nm FFNTransistor Count12 Billion18.6 BillionDie Size471mm²754mm²GPCs66TPCs2834SMs2868CUDA per SM12864Total CUDA Cores35844352Tensor Cores per SM-8Total Tensor Cores-544RT Cores-68Base Clock1,480MHz

1,350MHz / 1,350MHz*

Boost Clock1,582MHz1,545MHz / 1,635MHz*RTX-OPS (Tera-OPS)11.376 / 78*Rays Cast (Giga Rays/s)1.110 / 10*Peak FP32 TFLOPS11.313.4 / 14.2*Peak INT32 TIPS-13.4 / 14.2Peak FP16 TFLOPS-26.9 / 28.5*

Peak FP16 Tensor TFLOPS

with FP16 Accumulate

-107.6 / 113.8*

Peak FP16 Tensor TFLOPS

with FP32 Accumulate

-53.8 / 56.9*Peak INT8 Tensor TOPS-215.2 / 227.7*Peak INT4 Tensor TOPS-430.3 / 455.4*Memory TypeGDDR5XGDDR6Memory Size11GB11GBMemory Interface352bit352bitMemory Clock11Gbps14GbpsMemory Bandwidth484616ROPs8888Texture Units224272Texture Fill-rate354.4420.2L2 Cache2816KB5632KBRegister File Size7168KB17408KBTDP ^250W250W / 260W*

#. 所有 TFLOPS、TIPS 及 TOPS 速度基于GPU Boost Clock

*. GeForce RTX 2080 Ti Founders Edition 规格

^. 数字仅代表绘图卡 TDP,如使用 VirtualLink /USB Type-C 连接需额外增加 35W 功率

免责声明:本文由用户上传,如有侵权请联系删除!