NVIDIA RTX4070 SUPER显卡使用评测

时间:2024-01-17 15:06:14来源:互联网

下面小编就为大家分享一篇NVIDIA RTX4070 SUPER显卡使用评测,具有很好的参考价值,希望对大家有所帮助。

NVIDIA RTX4070 SUPER怎么样?这张显卡能不能满足用户的需求呢?阿里西西小编为大家带来了NVIDIA RTX4070 SUPER显卡使用评测,一起来看看吧!

S823664f9-ee9d-496a-a40e-511a15e7c15e.png

NVIDIA RTX4070 SUPER显卡使用评测

一、前言:性价比爆棚的GeForce RTX 40 SUPER系列显卡

新一代的Ada Lovelace架构带来了令人咋舌的能效比,RTX 40系列显卡在性能相同的情况下,功耗只有上代一半甚至更低,只是价格并不是那么亲民。

2024年1月9日,NVIDIA发布了GeForce RTX 40 SUPER系列显卡,包括RTX 4070 SUPER、RTX 4070 Ti SUPER和RTX 4080 SUPER三款型号。

其中RTX 4070 SUPER以4899元的售价提供了接近于RTX 4070 Ti的性能;

而RTX 4070 Ti SUPER售价与RTX 4070 Ti同为6499元,但性能与9499元的RTX 4080相差无几;

至于RTX 4080 SUPER,它在规格大幅度提升的情况下,将售价降到了8099元,比起RTX 4080足足便宜了1400元。

新一代RTX 40系列SUPER GPU的到来,瞬间让NVIDIA显卡性价比爆棚!

S5866016d-b14c-4d00-8c1a-82a8ff72e87b.png

完整的AD104核心

RTX 4070 SUPER使用了与RTX 4070(Ti)相同的AD104核心。

完整的AD104核心共有7680个CUDA核心(分为5组GPC/30组TPC/60组SM)、240个第四代Tensor Core张量核心、60个第三代RT Core光追核心、240个纹理单元、80个ROP单元、3MB一级缓存、48MB二级缓存。

S5bd753a1-e8d5-42ae-8133-fbb159e683bb.png

AD104-350核心(RTX 4070 SUPER)

RTX 4070 SUPER做了部分精简,依然是5组GPC,只是将其中2组中的6个TPC减到了5个,也就是5组GPC、28个TPC、7168个流处理器、228个Tensor Core、56个RT Core、80个ROP单元、48MB二级缓存。

与比RTX 4070 Ti起来,规格削减不到7%,而显存规格以及二级缓存容量维持不变,可以想象,二者的性能会非常接近。

RTX 4070 SUPER的详细规格参数如下:

s_4828caecb12443109b711b1aed68cf3a.jpg

二、图赏:与RTX 4070长一样 6+3相供电电路

S5993b5d9-00a0-422f-949c-c4b556c3a171.jpg

包装盒和RTX 4070公版差不多,区别在于原来是白字,现在改成了黑色字体。

Sa17589c5-dacf-4072-9878-375f713d4685.jpg

开箱。

S06f54f2e-50b2-4b5f-be5b-c3b2c3dda198.jpg

附赠一条2x8Pin转16Pin的电源线。

S75ded3ba-9f33-4270-b851-beeb8694c45f.jpg

上面是RTX 4070 SUPER,下面是RTX 4070,长相也几乎一模一样,差别在于4070的金属条是银灰色,4070 SUPER是深黑色,而且还能反光。

S500bc568-9fa7-4e30-96bd-538ed5bf571a.jpg

背面。

S190f33d2-fb8c-4ffe-995b-8d732ffde9dc.jpg

依然是16Pin供电接口,不过功耗很低,完全不用担心烧化接口的情况。

S1f3ab6b1-6062-40de-bba7-a540608f85f1.jpg

3个DP1.4和1个HDMI 2.1接口。

S3c4b337e-b198-49dd-9dba-16129f9d2e1c.jpg

没有用均热板,和RTX 4070一样,都是铜底+热管的散热设计。

S318d23bf-9906-463b-a709-d3819809730e.jpg

依旧是RTX 4070的PCB版,非常mini,改造成ITX版型也不难。

6+3相供电电路设计,虽然简单,但也足够应付220W的TGP。

9dcb5673-3638-4857-a5a3-d3df3b85336a.jpg

这是RTX 4070的PCB板,对比一下,二者区别在于RTX 4070多一个空焊位,也就是少一相供电。

S692903c2-bc55-431e-9597-bc82fc643633.jpg

PCB板背面。

S790b33b3-c647-41e6-97d3-dbae866c6665.jpg

RTX 4070 SUPER采用的是AD104-350核心,芯片面积295mm2,拥有358亿晶体管。

GPU旁边是6颗美光GDDR6X显存,单颗2GB,总容量12GB,等效频率21GHz,带宽504GB/s。

三、理论性能测试:3DMark运行频率可达2805MHz

测试平台如下:

s_786da0b26866476da8358dd951a117fc.jpg

1、3DMark Fire Strike

Sc598b380-238c-4e94-9ba7-762141a2e589.jpg

在2K分辨率3DMark Fire Strike Extreme测试中,RTX 4070 SUPER图形分数达到了24185分,核心温度最高68℃,热点温度最高85℃,核心运行最高频率为2805MHz,最高风扇转速1397PM,整卡最高功耗222W。

S9e352ce8-3e12-4890-89a1-ba6c41eb9edf.jpg

在4K分辨率3DMark Fire Strike Ultra测试中,RTX 4070 SUPER图形分数达到了12112分,核心温度最高69℃,核心运行最高频率为2805MHz,最高风扇转速1397RPM,最高功耗222W。

S15f9e416-b064-4e94-ac48-cedced5f60cc.jpg

2、3DMark Time Spy

S837298c6-4b9d-4e36-b6c4-c017a6a1bc1e.jpg

在2K分辨率3DMark Time Spy测试中,RTX 4070 SUPER图形分数达到了20649分,核心温度最高75℃,核心运行最高频率为2790Hz,最高风扇转速2028RPM,最高功耗223W。

Sc3b9c4dc-ca77-4ad4-a114-e0ffa2a3a8f4.jpg

在4K分辨率3DMark Time Spy Extreme测试中,RTX 4070 SUPER图形分数达到了9948分,核心温度最高74℃,核心运行最高频率为2790Hz,最高风扇转速1399RPM,最高功耗224W。

Sbec16d01-a30f-4841-95f0-939a980e7c04.jpg

四、1080P游戏性能测试:与RTX 3090 Ti旗鼓相当

1、刺客信条:英灵殿

Sebce1f56-4e8b-4642-91e9-35c12d584352.jpg

S48dc418f-a577-47da-acad-bd5243b21574.jpg

2、地平线:零之曙光

Sb62a5a64-55a7-430c-91f1-1d79670a9cde.jpg

Sfd936dbe-8adf-4036-9da9-f106fbb606c9.jpg

3、孤岛惊魂5

See35a993-6527-4e03-b866-e8b4386d3661.jpg

S6f3fb95c-4e15-4ae1-8deb-30de72d8b9f1.jpg

4、孤岛惊魂6

Sffb9f32c-a671-4223-8599-dd5abbecfb69.jpg

S23c2ad7c-0776-405b-b2f7-688e6fe5f0ba.jpg

5、古墓丽影:暗影

S41c85950-8d7b-452d-a6c3-7ef46998842a.jpg

S07325360-32a7-4387-8a8e-f9eff4134ac1.jpg

6、霍格沃茨之遗

S01daad12-3dc9-4730-8056-571d3db8b71b.jpg

Sb0bcd29f-676b-44f4-9ffe-281e25bc6c1e.jpg

7、极限竞速:地平线5

Scb8ae31a-c6bf-4da6-96d0-3df75fde2c47.jpg

S9a0181f2-7f09-4fbd-92f2-262bceccd3ed.jpg

8、赛博朋克2077

S1e3fd2ff-e388-4a88-8f81-e68c3410eda1.jpg

S480c817d-d094-435e-845f-ac75967ccc47.jpg

9、巫师3

Scc6476b3-a641-4fd1-9adf-a07cfa861094.jpg

Sfda1233c-baae-4d5c-9f50-660f2033e840.jpg

10、无主之地3

S307d43c9-5d2b-4c11-96d6-03baef5cb0e7.jpg

S5ddf5685-8f40-4fbe-85a2-c46ae475675e.jpg

11、星空

Sc2c478c2-0606-4a05-9f34-8ee57cfe15df.jpg

S982205e4-d9d1-4c32-a41f-48a650756d66.jpg

12、战争机器5

S7bb7f4c1-0fb6-48c7-8f90-b9ec5366113c.jpg

S65149847-c9ef-4523-984f-7b2641367fdd.jpg

测试结果汇总如下:

S2bfefb1d-38e5-4bec-8e2a-4e035e4cc5a5.jpg

在1080P分辨率下,RTX 4070 SUPER的性能已经超过RTX 3080  Ti,并且和RTX 3090 Ti不相上下,差距只有1%。比起RTX 4070强了13%,和RTX 4070 Ti相比就差了3%。

六、2K性能测试:强于RTX 3080 Ti

1、刺客信条:英灵殿

S7038dad3-b739-4398-8224-d7e0811036c1.jpg

Sbb06eb7d-bb8e-4ff7-8462-988e3011be51.jpg

2、地平线:零之曙光

Scc37e598-5012-4b24-888e-a258487bc3ec.jpg

S4989ef02-b288-465a-bb97-c22651442812.jpg

3、孤岛惊魂5

Sd7e06631-bf89-4e43-980f-5aea07ae1a38.jpg

S38c24ce5-7ce2-4cbb-9d5d-e021c688ecf0.jpg

4、孤岛惊魂6

Sfea148d1-f2d4-4143-a09d-71c0cd923171.jpg

S2ee036b4-5867-4d4f-b3f7-8a6ed23354f8.jpg

5、古墓丽影:暗影

S438be9a8-4c31-4899-93a5-c4218b0446fe.jpg

Sdd655475-6ae9-44f5-bc64-dfe224d8759f.jpg

6、霍格沃茨之遗

Sfd4861a1-ba85-416d-8ee0-8091dbc2f81b.jpg

S54304952-3aba-406b-8240-1e51af242a5a.jpg

7、极限竞速:地平线5

Sa2ad9720-174f-4273-addf-ccf59b1098e3.jpg

S3796712c-2fdc-4cf6-b921-b1efd2eeaf53.jpg

8、赛博朋克2077

S487da3d8-4d7c-4f9b-a2e6-a77a6ffdaf53.jpg

Sc17a6582-b840-4f5a-abec-baee38693ff8.jpg

9、巫师3

S7acf5240-4921-4baf-b57b-f13a77081d1d.jpg

S22554e6c-3279-4054-976e-07a53fe12848.jpg

10、无主之地3

S42b8b48a-99c1-4e7e-9351-19c0c30f836c.jpg

Sf6464ed9-f468-4c6d-a239-95f3c9d77d28.jpg

11、星空

Scea2a3ec-336c-450c-982d-6295b7b55dd8.jpg

S2e515421-7b68-4a78-a09e-cec106c4f0e5.jpg

12、战争机器5

S99dc43f6-8ebd-4854-a8e8-12503da3851b.jpg

S3e27fffe-62c8-48e8-97be-2cddb267ed31.jpg

测试数据汇总如下:

S3e6039e7-b37e-4034-83da-5af00661ba41.jpg

2K分辨率下,RTX 4070 SUPER依然比RTX 3080 Ti强2%,与RTX 4070相比,也有14%的优势,但是比RTX 4070 Ti则有5%的差距。

此外我们还测试了4K分辨率下的成绩,汇总如下:

S82e66c9d-cf9c-48c3-be4f-70ae95e0f2ef.jpg

由于192Bit显存位宽的关系,RTX 4070 SUPER在4K分辨率下的性能会明年不如RTX 3080 Ti,但大多数游戏依旧能保持60FPS以上的帧率。

我们测试的12款3A大作,有3款帧率低于60FPS,但这几款游戏都支持DLSS 3,开启之后帧率会有翻倍提升。

六、Stable Diffusion体验:TensorRT加持 生图速度提升350%

2023年9月,NVIDIA推出了用于Stable Diffusion Web UI 的TensorRT 加速插件,能让具备Tensor单元的GeForce显卡在Stable Diffusion Web UI 中获得翻倍的性能。

本次我们将对比SDXL加速方法与PyTorch xFormers(常规加速方法)的性能差异。

Sacf62fd6-91a3-49bf-9f6c-4ed7d99443fa.jpg

我们生成10张太空大战图像,分辨率1024*1024,使用PyTorch xFormers加速时,耗时9分17秒。

Sd73ebf78-363b-450f-a746-be7983730557.jpg

使用SDXL加速之后,耗时仅为2分02秒,性能提升350%。

S35670635-a40e-4032-a2e7-8ea87d9165a1.jpg

从终端中也可以看到,RTX 4070 SUPER使用默认加速器时,生图速度只有1.1it/s,而在TensorRT加持下,生图速度猛然提升到了4.50it/s。

七、DLSS 3游戏测试之一:3款DLSS 3游戏

此次我们一共测试了6款游戏,包括3款支持DLSS 3的游戏:《3DMark》、《毁灭全人类》、《燕云十六声》。

另外还有3款同时支持DLSS与光追的游戏:《光明记忆》:《生死轮回》、《赛博朋克2077》。

所有DLSS 3以及光追测试都是在2K分辨率下进行。

1、DLSS3 测试--燕云十六声

《燕云十六声》是一款开放世界中国风武侠动作游戏,画质精良,号称国产3A破阵之作。目前这款游戏还处于内测阶段。

Sf98f3688-7f3c-41c9-a878-1beb0229e689.png

这款游戏于日前推送了对于DLSS 3支持的更新,下面我们来看看RTX 4070 SUPER的表现,测试分辨率为2560*1440,画质选项为“超高”。

Sd0b9042f-75f9-405c-b195-7023feb90ec2.png

默认超高画质下,游戏帧率为91FPS。

Sf77fc00c-13da-4454-9bcf-028e95eafe5d.png

开启DLSS 2(性能模式)之后,帧率达到了146FPS,提升了60%。

S1d798906-0c41-465b-9c4a-ed94d1d252f4.png

打开DLSS 3(插帧)之后,帧率来到了198FPS,相比默认画质帧率提升了117%。

S55dc978c-1a59-40de-8460-81400fabee08.png

2、3DMark

Sa6462dd1-a4f6-4b0b-90e2-fbfb85187869.jpg

DLSS 2模式下帧率为140FPS,比默认的65FPS提升了133%。

S6929d655-6cd9-4a89-8519-b52ce9bfddca.jpg

DLSS 3的成绩为150FPS,相比默认提升了150%。

S8bb51a91-d586-4d7a-8616-90e265b509c7.png

3、毁灭全人类2:重新探测

Se1c84d6a-5db3-4056-b938-d678bda2d132.jpg

最高画质下,RTX 4070 Ti的帧率为131FPS。

S60d091c3-e8d6-41a8-b314-adf0efc21c22.jpg

开启DLSS 3之后,帧率来到了242FPS,近乎翻倍。

Sa110a264-4c31-4d71-9b50-1cd9cdd5489b.jpg

八、DLSS 3游戏测试之二:3款支持DLSS 3的光追游戏

1、光明记忆:无限

S51f71068-dc3b-4a80-a261-347d1066e302.jpg

开启RTX时,游戏的帧率为109FPS。

Sf16202b5-1d52-48b7-b4a4-c2c40c03e305.jpg

开启DLSS 3之后,帧率提升到了235FPS,提升了116%。

s_265e02b5f3ea41b3bd2a0c53d4fc54c2.jpg

2、生死轮回

Sac9f2620-9898-4a87-ba94-e924acecbfa7.jpg

开启光追之后,游戏的帧率仅有65FPS。

Sd636bbc1-4e5a-49b3-818e-d9e2b44debef.jpg

打开DLSS 3之后,帧率提升到了195FPS,提升幅度为195%。

s_9e90d93667f0498a8e394238ea2a4fba.jpg

3、赛博朋克2077

S84f849c6-418e-443c-a7d9-04dfebcd5296.jpg

开启光追时,帧率为40FPS。

Sc894dcc5-0c35-4df1-94b6-3285d3ad2235.jpg

这是DLSS 3的画面,与原生画面的差距难以分辨,但是帧率提升到了155FPS。

s_ede1b88d7cdb46b49690e9900b767767.jpg

测试数据汇总如下:

Sf242d9f4-3b45-4dad-8d1c-ef43e008d5ed.jpg

九、功耗测试:2K游戏平均功耗仅为3080 Ti的62%

S1fc3ff56-37d4-43ee-8200-0fcf4a78fbae.jpg

将Furmark的参数设定为1920*1200分辨率、0AA。

运行13分钟之后,RTX 4070 SUPER的温度稳定在74度附近,功耗稳定在220W,烤机时GPU频率为1620MHz,CPU风扇转速只有2153RPM。

2)、真实游戏功耗测试

1、GTA V

S7e7c616a-e39c-4f7c-80e1-dcf8c293aae5.jpg

这是1080P分辨率。RTX 4070 SUPER功耗126W,温度53度。

S51d3894d-d088-4cdb-a184-d939943c76d3.jpg

2K分辨率下,RTX 4070 SUPER功耗164W。

2、绝地求生

S5435a7fe-e9c3-4b7e-833a-0517dd7e31b3.jpg

1080P分辨率下,RTX 4070 SUPER功耗203W,温度689度,运行频率2760MHz。

Sd364283a-54cd-434a-925c-d7cf74661184.jpg

2K分辨率下,RTX 4070 SUPER0功耗212W。

3、古墓丽影:暗影

S521487da-a3d3-436f-b55e-cb75c7754e40.jpg

1080P分辨率下,RTX 4070 SUPER的功耗为207W。

S32b3a498-7087-49e6-8719-59fd9b5dbf58.jpg

2K分辨率下,RTX 4070 SUPER功耗是212W,运行频率2745MHz,温度64度。

测试数据汇总如下:

S3b288861-7fc8-4f53-b738-65429df12510 (1).jpg

在1080P分辨率下,RTX 4070 SUPER在3A游戏中的平均功耗不到200W,2K分辨率也只有207W;就算是到了4K分辨率,平均功耗也只有214W,仅相当于RTX 3080 Ti的62%。

十、总结:堪称业界良心

本次测试小结如下:

1、AI性能

即使没有TensorRT 加速插件,RTX 40系列GPU也是Stable Diffusion画图首选,而今在TensorRT加持下,RTX 4070 SUPER的生图速度在原有基础上提升了350%,这样的表现相信是不会再有任何竞争对手了。

2、1080P游戏性能

Sf92aa13d-1a36-405f-a364-792de2ed9ee7.png

我们所测的12款游戏,除了《星空》之外 ,剩余11款游戏RTX 4070 SUPER的帧率全部都超过了160FPS,就连显卡杀手《赛博朋克2077》也有169FPS。

就性能而言,1080P分辨率下,RTX 4070 SUPER几乎能与RTX 3090 Ti并驾齐驱,相比RTX 3080 Ti强了6%,比RTX 4070则强了13%,和4070 Ti的差距只有3%。

3、2K游戏性能

Sd1f2afd4-c102-4b36-8b04-b75a63231699.png

2K分辨率下,同样是除了《星空》之外,RTX 4070 SUPER在其他11款游戏中都能保持120FPS以上的帧率。

在2K分辨率下,RTX 4070 SUPER依旧能比RTX 3080 Ti强2%,不过和RTX 4070 Ti的差距也拉大到了5%,比起RTX 4070则强了15%左右。

另外,我们也测试了4K,RTX 4070 SUPER在此分辨率下帧率会有较大损失,不过在绝大部分游戏中依旧能够跑出60FPS以上的帧率。

少数几款显卡杀手游戏虽然帧率只有50PFS左右,但好在这些游戏都支持DLSS 3,开启之后帧率甚至能突破100FPS。

4、功耗

S3b288861-7fc8-4f53-b738-65429df12510.jpg

我们测试了6款3A大作的真实游戏功耗,在1080P分辨率下,RTX 4070 SUPER的平均功耗是192W,而RTX 3080 Ti是312W。

2K分辨率下,RTX 4070 SUPER在6款游戏中的平均功耗是207W,RTX 3080 Ti则是332W。

4K分辨率下,RTX 4070 SUPER在6款游戏中的平均功耗为214W,RTX 3080 Ti则已经跑到了350W的TGP上限。

5、DLSS 3和光追

目前能玩的DLSS 3游戏多达数十款,我们测试了6款。

在开启DLSS 2之后,游戏帧率平均提升幅度为107%。打开DLSS 3,游戏帧率平均提升幅度达到了159%。

S580abb71-9f59-4572-b32e-f9703b5eefb8.jpg

如今的NVIDIA GPU早已不是单纯的游戏显卡,特别是在AI应用方面,有了SDXL,能将Stable Diffusion生图速度提升4倍左右,让原本已经大幅度领先对手的N卡彻底无敌。

至于价格,4899元就能买到一块1080P性能堪比RTX 3090 Ti、2K性能强于RTX 3080 Ti的显卡,同时游戏功耗仅有200W左右,堪称业界良心。

本站部分内容转载自互联网,如果有网站内容侵犯了您的权益,可直接联系我们删除,感谢支持!