RTX 4090、RTX 4080正式发布:性能暴涨4倍
9月20日深夜,万众期待的NVIDIA RTX 40系列显卡终于来了!首发宣布的有三款,分别是RTX 4090、RTX 4080 16GB、RTX 4080 12GB。RTX 40系列基于全新设计的Ada Lovelace GPU架构,在性能、效率上都实现了巨大的代际飞跃,无论是实时光线追踪,还是AI神经网络渲染,都可以说开启了新时代。
RTX 40系列的主要创新提升有:
1、流式多处理器(SM)
着色器能力高达83TFlops(83万亿次运算每秒),吞吐量超过上一代产品的2倍。
2、第三代RT Cores光追核心
有效光追算力达到191TFlops(每秒191万亿次运算),是上一代产品的2.8倍,光线与三角形求交性能是上代的2倍。
同时,并加入两个全新的重要硬件单元:
一是Opacity Micromap引擎,可将光追的Alpha-Test几何性能提升2倍。
二是Micro-Mesh引擎,可动态生成微网格、产生额外的几何图形,提升几何图形丰富度的同时,不会像传统复杂几何图形处理那样牺牲性能、存储成本。
NVIDIA还以《赛博朋克2077》为例,号称RTX 40系列可对每个像素执行超过600次的光追计算来确定光照,比四年前的首批光追游戏增加了多达16倍。
3、第四代Tensor Cores张量核心
FP8张量处理性能高达1.32PFlops(每秒1320万亿次运算),超过上一代使用FP8加速性能的5倍。
4、支持着色器执行重排序(SER)
通过即时重新安排着色器负载,提高执行效率,更好地利用GPU资源,为光追带来最高3倍的性能提升,整体游戏性能提升也可达25%。
NVIDIA声称,该技术的创新力度,堪比CPU处理器的乱序执行。
5、集成光流加速器
带来2倍的性能提升,搭配DLSS 3可以预测场景中的运动,神经网络保持图像质量的同时提高帧率。
6、集成两个第八代NVIDIA编码器(NVENC)
输出时间至多缩短一半,并支持AV1视频格式编解码,得到了OBS、Blackmagic Design DaVinci Resolve、Discord等公司的采纳。
NVIDIA Broadcast软件开发工具包也有三个更新,包括面部表情预估、眼神追踪、虚拟绿幕质量改进
7、能耗比
架构改进结合台积电N4 4nm定制工艺技术,能耗比提升2倍。
再看产品,这次公布了最核心的一些规格参数——
RTX 4090:
旗舰产品,这一代首发,集成760亿个晶体管、16384个CUDA核心,搭配美光的24GB GDDR6X显存。
功耗和RTX 3090 Ti一样都是450W,但号称游戏性能提升2倍,DLSS 3游戏性能提升4倍,同时在4K游戏中也能获得100FPS以上的帧率。
10月12日上市,建议零售价12999元起。
相比之下,RTX 3090首发价为11999元起,RTX 3090 Ti首发则是14999元起。
RTX 4080 16GB:
9728个CUDA核心,搭配美光的16GB GDDR6X显存,游戏性能2倍于RTX 3080 Ti,并超过RTX 3090 Ti。
11月上市,建议零售价9499元起。
这对比RTX 3080 5499元首发价自然是贵了太多,但它的定位实际上是在RTX 3080 Ti的层级,后者首发8999元。
RTX 4080 12GB:
据说就是原定的RTX 4070 Ti,7680个CUDA核心,美光的12GB GDDR6X显存,性能也可以超越上代卡皇RTX 4090 Ti。
11月上市,建议零售价7199元起。
这个价格确实有点高,但上一代RTX 3080 Ti 8999元、RTX 3080 5499元之间的空档也有点大,这次算是补上了。