秋无痕淘宝天猫优惠券网	秋无痕常用软件全功能装机光盘 2023年金秋版	秋无痕一键优化Windows 10专版	秋无痕一键优化Windows 11专版
秋无痕论坛官方QQ群	获取无痕币和提高等级

主题 : 真正的战未来：英伟达RTX 2080显卡首发测评

使用道具 | 复制链接 | 浏览器收藏 | 打印

加为好友

hexj9

千山同一月万户尽皆春千江有水千江月万里无云万里天

级别: 总版主

作者资料发送短消息

UID: 998
精华: 0
发帖: 605038
威望: 529413 点
无痕币: 22 WHB
贡献值: 0 点
在线时间: 62342(时)
注册时间: 2008-12-25
最后登录: 2024-05-05

0 发表于: 2018-09-20 10:54｜请将IE368导航设置为首页，支持论坛

全看 | 小中大

0 真正的战未来：英伟达RTX 2080显卡首发测评

相信即使是NV也不会想到，在帕斯卡于2016年正式发售至2018年科隆电脑展图灵游戏显卡到来之前的这两年内，整个显卡行业乃至于硬件行业出现了为数众多的戏剧性场面，无论是虚拟货币的过山车行情，还是对新显卡发售日期的预测，我们每一个人都成为了这场大戏的主角，于是在9月19日晚上9点，这场持续了两年的剧目终于要落下了帷幕。

8月21日凌晨，老黄在德国科隆正式发布了三款显卡，包括RTX 2080、RTX 2080 Ti以及RTX 2070，其中RTX 2080和RTX 2080 Ti将会成为首发产品，而RTX 2070则稍后发售，只是和以往相比，这一次的驱动似乎来得有些晚，尽管我们很久就已经拿到了新版显卡，但是在无驱动的窘境还是让我们只能放下这些卡皇们，将其作为一款艺术品进行欣赏。

在拥有最新的驱动加持之后，这些显卡才真正地释放自己的活力。只是发布会期间老黄并没有直接公布新一代显卡的性能，于是我便有隐隐的担忧，认为这一代显卡的性能似乎并不如人所愿，至少没有9代至10代升级这样给力，而在经过了一段时间的测试之后，我似乎更加确定这些显卡将会为未来做准备，无论是新的DLSS、RTX还是全新的架构算法。

一、架构解析：以“计算机之父”命名表现英伟达未来的野心
阿伦·图灵，这位计算机科学之父同时也是人工智能之父，为今后计算机以及AI的发展起到了至关重要的作用，而英伟达将20系显卡的架构名称命名为“图灵”，自然是有他自己的道理，或许在“图灵”架构中我们可以看到英伟达今后的野心。
（1）、全新的Turing架构，单精度不再是唯一

▲图灵架构以及帕斯卡架构对比
首先关于这个图灵架构的名字就已经争论了很久。在老黄推出了GTX 1080 Ti显卡之后，关于新一代显卡的名字自然受到了大家的热烈讨论，当时的GTC大会上，老黄发布基于伏特架构的计算卡，于是大家纷纷认为新一代显卡便是伏特架构，随后的测试软件似乎也证实了这一猜测。不过在SIGGRAPH 2018上，老黄展示了基于图灵架构的专业卡，同时也宣布了图灵架构的到来，而现在新一代显卡采用图灵架构就已经实锤了。这一次NV在RTX 2080 Ti、RTX 2080以及RTX 2070上分别使用了不同的核心，区分度更加明显。

TU102核心示意图

▲TU102核心实拍
作为旗舰版本的TU102核心共有6组GPC单元，每组GPC单元又拥有12个SM单元，一共是72个SM单元，不过RTX 2080 Ti采用的是其中的68个SM单元，总共4352个CUDA，另外NV给每一组SM单元分配了一个RT单元以及8个Tensor Core，这样子共同组成了一个完整的SM单元，而RT单元以及Tensor Core的增加是图灵面积暴增的最主要原因。

▲TU104核心
和旗舰版本的RTX 2080 Ti相比，RTX 2080所采用的SM单元就少得多，虽然架构相同，继续采用6组GPC单元，然而每组的SM单元8个，也就是说RTX 2080显卡所采用的TU104核心总共48个SM单元，共计2944个流处理器。这也就是为什么RTX 2080的实际规格要比RTX 2080 Ti小得多。

在Nvidia给出的图灵架构白皮书中，NV表示图灵架构显卡采用的是全新的图灵单元，它拥有比帕斯卡更高的单元性能，其中Core性能提升幅度可以达到50%。这是由于图灵采用的是全新的计算方式，不再依靠传统的FP32也就是单精度浮点来评估显卡的性能。

▲图灵架构的SM示意图
在图灵架构中，NV搭建了一套新的性能计算方式。例如就跟之前所说的一样，一个完整的图灵单元应该包含64个FP32、64个INT32、8个Tensor Core、1个RT Core，而一个Pascal单元包括的是128个FP32单元，当然在图灵显卡中，FP64已经悄然消失，毕竟游戏并不需要双精度性能。
NV在公开场合多次表示计算图灵架构的性能不仅仅包括传统的FP32，更要考虑到INT32单元性能，因为在图灵架构中，由于独立线程调度的存在，图灵显卡可以实现INT32以及FP32的并发执行，也就是说图灵显卡可以同时处理FP32和INT32的请求，如果仅仅考虑到FP32的话，对于图灵来说显然是有失偏僻的。而在Volta架构刚推出的时候，按照原来的FP32为王的思想，仅将FP64进行简单的转换，使得FP64变成传统的FP32，从这个思想去推断图灵的性能，不过现在FP64计算单元的确没了。只不过变成了更多种类的计算单元。
为了提升图灵的执行效率，NV在图灵中采用了更加高效的缓存，同时为共享缓存、L1缓存、纹理缓存引入了统一架构，L2缓存的容量也翻倍，这样子可以提升单元之间的数据交换的速度和效率，提升了显卡的性能。