主题 : 真正的战未来:英伟达RTX 2080显卡首发测评
千山同一月 万户尽皆春 千江有水千江月 万里无云万里天
级别: 总版主

UID: 998
精华: 0
发帖: 605038
威望: 529413 点
无痕币: 22 WHB
贡献值: 0 点
在线时间: 62342(时)
注册时间: 2008-12-25
最后登录: 2024-05-05

0 真正的战未来:英伟达RTX 2080显卡首发测评

相信即使是NV也不会想到,在帕斯卡于2016年正式发售至2018年科隆电脑展图灵游戏显卡到来之前的这两年内,整个显卡行业乃至于硬件行业出现了为数众多的戏剧性场面,无论是虚拟货币的过山车行情,还是对新显卡发售日期的预测,我们每一个人都成为了这场大戏的主角,于是在9月19日晚上9点,这场持续了两年的剧目终于要落下了帷幕。

8月21日凌晨,老黄在德国科隆正式发布了三款显卡,包括RTX 2080、RTX 2080 Ti以及RTX 2070,其中RTX 2080和RTX 2080 Ti将会成为首发产品,而RTX 2070则稍后发售,只是和以往相比,这一次的驱动似乎来得有些晚,尽管我们很久就已经拿到了新版显卡,但是在无驱动的窘境还是让我们只能放下这些卡皇们,将其作为一款艺术品进行欣赏。

在拥有最新的驱动加持之后,这些显卡才真正地释放自己的活力。只是发布会期间老黄并没有直接公布新一代显卡的性能,于是我便有隐隐的担忧,认为这一代显卡的性能似乎并不如人所愿,至少没有9代至10代升级这样给力,而在经过了一段时间的测试之后,我似乎更加确定这些显卡将会为未来做准备,无论是新的DLSS、RTX还是全新的架构算法。

一、架构解析:以“计算机之父”命名表现英伟达未来的野心
阿伦·图灵,这位计算机科学之父同时也是人工智能之父,为今后计算机以及AI的发展起到了至关重要的作用,而英伟达将20系显卡的架构名称命名为“图灵”,自然是有他自己的道理,或许在“图灵”架构中我们可以看到英伟达今后的野心。
(1)、全新的Turing架构,单精度不再是唯一

▲图灵架构以及帕斯卡架构对比
首先关于这个图灵架构的名字就已经争论了很久。在老黄推出了GTX 1080 Ti显卡之后,关于新一代显卡的名字自然受到了大家的热烈讨论,当时的GTC大会上,老黄发布基于伏特架构的计算卡,于是大家纷纷认为新一代显卡便是伏特架构,随后的测试软件似乎也证实了这一猜测。不过在SIGGRAPH 2018上,老黄展示了基于图灵架构的专业卡,同时也宣布了图灵架构的到来,而现在新一代显卡采用图灵架构就已经实锤了。这一次NV在RTX 2080 Ti、RTX 2080以及RTX 2070上分别使用了不同的核心,区分度更加明显。

TU102核心示意图

▲TU102核心实拍
作为旗舰版本的TU102核心共有6组GPC单元,每组GPC单元又拥有12个SM单元,一共是72个SM单元,不过RTX 2080 Ti采用的是其中的68个SM单元,总共4352个CUDA,另外NV给每一组SM单元分配了一个RT单元以及8个Tensor Core,这样子共同组成了一个完整的SM单元,而RT单元以及Tensor Core的增加是图灵面积暴增的最主要原因。

▲TU104核心
和旗舰版本的RTX 2080 Ti相比,RTX 2080所采用的SM单元就少得多,虽然架构相同,继续采用6组GPC单元,然而每组的SM单元8个,也就是说RTX 2080显卡所采用的TU104核心总共48个SM单元,共计2944个流处理器。这也就是为什么RTX 2080的实际规格要比RTX 2080 Ti小得多。

在Nvidia给出的图灵架构白皮书中,NV表示图灵架构显卡采用的是全新的图灵单元,它拥有比帕斯卡更高的单元性能,其中Core性能提升幅度可以达到50%。这是由于图灵采用的是全新的计算方式,不再依靠传统的FP32也就是单精度浮点来评估显卡的性能。

▲图灵架构的SM示意图
在图灵架构中,NV搭建了一套新的性能计算方式。例如就跟之前所说的一样,一个完整的图灵单元应该包含64个FP32、64个INT32、8个Tensor Core、1个RT Core,而一个Pascal单元包括的是128个FP32单元,当然在图灵显卡中,FP64已经悄然消失,毕竟游戏并不需要双精度性能。
NV在公开场合多次表示计算图灵架构的性能不仅仅包括传统的FP32,更要考虑到INT32单元性能,因为在图灵架构中,由于独立线程调度的存在,图灵显卡可以实现INT32以及FP32的并发执行,也就是说图灵显卡可以同时处理FP32和INT32的请求,如果仅仅考虑到FP32的话,对于图灵来说显然是有失偏僻的。而在Volta架构刚推出的时候,按照原来的FP32为王的思想,仅将FP64进行简单的转换,使得FP64变成传统的FP32,从这个思想去推断图灵的性能,不过现在FP64计算单元的确没了。只不过变成了更多种类的计算单元。
为了提升图灵的执行效率,NV在图灵中采用了更加高效的缓存,同时为共享缓存、L1缓存、纹理缓存引入了统一架构,L2缓存的容量也翻倍,这样子可以提升单元之间的数据交换的速度和效率,提升了显卡的性能。

英伟达表示FP32性能+INI32性能+Tensor以及Ray性能相互组合,这样子才是一个完整的图灵性能,当然这也就是发布会上所说的RTX-OPS性能。
级别: 十方秋水

UID: 1397
精华: 0
发帖: 110789
威望: 155524 点
无痕币: 1434 WHB
贡献值: 0 点
在线时间: 66108(时)
注册时间: 2007-11-27
最后登录: 2024-05-04

先了解一下。
Total 0.045215(s) query 5, Time now is:05-05 21:49, Gzip enabled 粤ICP备07514325号-1
Powered by PHPWind v7.3.2 Certificate Code © 2003-13 秋无痕论坛