在 2024 年底舉辦的科技大展上,NVIDIA 正式公佈了全新的 Blackwell 架構消費級顯示卡系列──NVIDIA RTX 50 系列。其中最受矚目的,非旗艦級的 NVIDIA RTX 5090 莫屬。這款新卡在規格、散熱設計以及強調 AI 技術的展示上,都讓人對未來的繪圖效能有了更高的期待。以下就讓我們深入剖析 NVIDIA RTX 5090 與該系列其他成員的重點與特色。


全新 Blackwell 架構與產品定位

NVIDIA 表示,新一代的 Blackwell GPU 將在 2025 年 1 月起陸續上市,首波推出的型號包括:

型號 CUDA核心數 記憶體 功耗 建議售價
RTX 5090 21,760 32GB GDDR7 575W $2,000
RTX 5080 10,752 16GB GDDR7 360W $1,000
RTX 5070 Ti 8,960 16GB GDDR7 300W $750
RTX 5070 6,144 12GB GDDR7 250W $550

其中,NVIDIA RTX 5090 擁有多達 21,760 組 CUDA 核心 (前代 RTX 4090 為 16,384 CUDA 核心 ),以及 2.41 GHz 的 Boost Clock 與 2.01 GHz 的 Base Clock;記憶體介面則大幅提升至 512 位元,帶來約 1.8 TB/s 的理論記憶體頻寬。與上一代 RTX 4090 相比,RTX 5090 的 CUDA 核心數字雖然大幅提高,但仍需實際測試才能判斷真實效能表現。

RTX 5090 在理論運算效能上比 RTX 4090 提升了約 50%

RTX 5090 vs RTX 4090

RTX 5090 相較於 RTX 4090 的 CUDA 核心數量增加了 5,376 個,具體數據如下:

  • RTX 5090: 21,760 CUDA 核心
  • RTX 4090: 16,384 CUDA 核心

這代表了約 32.8% 的 CUDA 核心數量提升。這個提升主要歸功於:

  • Blackwell 架構的改進
  • TSMC N4P (4nm) 製程的採用
  • 晶體管數量從 76.3 億增加到 92 億

這樣的核心數量提升,加上新一代 DLSS 4 技術的支援,使 RTX 5090 在理論運算效能上比 RTX 4090 提升了約 50%。


RTX 5090 令人驚訝的耗電與散熱設計

最引人注目的一點,是 NVIDIA RTX 5090 標示的總圖形功耗(TGP)達到 575W。相較前代 450W 的 4090,有明顯的提升。官方展示的創始者版本(Founders Edition)似乎是雙風扇、兩槽厚度的外型設計,這與過去三槽甚至四槽的產品相比顯得相當精巧。如此高功耗卻仍能保持兩槽厚度,推測與全新流道式(Flow-through)散熱器以及更緊湊的 PCB 設計有關。

全新散熱器與 PCB 設計

NVIDIA 在簡報中公開的爆炸圖顯示,顯示卡主 PCB 置中,兩側搭配密集鰭片與 Vapor Chamber(氣室)設計,並有五條熱管進行散熱。如此革新的結構或許得益於早期內部的原型散熱器開發經驗。由於功耗逼近 600W,大面積的氣室搭配強化風扇風道勢必成為關鍵,否則高溫和供電接頭的可靠度都會是挑戰。


其他型號與記憶體配置

在整個系列中,NVIDIA RTX 5090 的顯存規格最為豪華,提供 32GB GDDR7。其他幾款則如下:

  • NVIDIA RTX 5080:16GB GDDR7、256 位元記憶體介面、360W 功耗
  • NVIDIA RTX 5070 Ti:16GB GDDR7、256 位元記憶體介面、300W 功耗
  • NVIDIA RTX 5070:12GB GDDR7、192 位元記憶體介面、250W 功耗

NVIDIA 在宣傳時也特別強調這次最低階只需 $549 USD 的產品 RTX 5070 的表現「可媲美上一代 RTX 4090」,同時聲稱這樣的效能「沒有 AI 與 GDDR7 技術絕對不可能實現」。

DLSS 與多重框架生成技術

隨著 Blackwell 架構的發表,NVIDIA 也帶來了全新升級的 DLSS 多重框架生成技術(Multiframe Generation,簡稱 MFG)。官方資料指出,新一代 AI 模型運算效率更高,可在傳統 1 帧的基礎上生成多達 3 帧影像,最高可達 8 倍效能提升;記憶體用量也比之前更低。

  • DLSS 4 與新一代 MFG 技術相結合
  • 更快的 Tensor Core 和 RT Core
  • 在大作遊戲測試中,達到高畫質、高幀率的理想平衡

不過,需要注意的是官方展示的性能數據大多使用 DLSS 或 MFG 技術,與上一代的測試條件並不完全相同,最終實際效能仍有待獨立測評單位進行客觀測試。


價格與上市時間

根據官方公佈,NVIDIA RTX 5090NVIDIA RTX 5080 將於 1 月 30 日開放購買,而 NVIDIA RTX 5070 TiNVIDIA RTX 5070 預計在 2 月上市。除了 NVIDIA 的黑白雙色創始者版,市場上也會陸續有各家 AIC(Add-in Card)廠商推出不同設計、不同時脈設定的客製化版本,帶來更多元的選擇與價格幅度。

值得一提的是,競爭對手 AMD 遲遲未在公開場合大篇幅提及新一代顯示卡,只私下向媒體透露有關「970 與 970 XD」的訊息,或許還在觀望 NVIDIA RTX 5090 等產品的實際市場反應。未來幾週至幾個月,預期 AMD 也會推出更多資訊來回應。


NVIDIA RTX 5090 規格分析

主要硬體規格

RTX 5090 旗艦規格

  • 92億個電晶體
  • 3,352 TOPS AI運算能力
  • 32GB GDDR7記憶體
  • 575W 總功耗

效能提升分析

DLSS 4的關鍵角色
實際效能提升主要來自DLSS 4技術,而非純硬體升級。在不支援DLSS的遊戲中,效能提升僅約1.25-1.5倍。

多幀生成技術

  • DLSS 4可在每個實際渲染幀之間生成最多三個額外幀
  • 此功能為RTX 50系列獨有
  • 可能會帶來些許延遲問題,特別是在低幀率情況下

AI與創作能力

創意工作效能

  • 支援FP4精度運算,使AI圖像生成速度提升2倍
  • 影片輸出速度比RTX 4090快60%
  • 支援4:2:2色彩格式

筆電版本改進

Max-Q技術升級

  • 效能提升2倍
  • 電池續航力提升40%
  • 保持輕薄設計
RTX 50系列確實帶來了顯著的技術進步,但其宣傳的2倍效能提升主要依賴DLSS 4技術實現。對於不支援DLSS的應用程序,實際效能提升較為溫和。

RTX 5090 vs AMD GPU?

GPU 名稱 架構 記憶體 AI 運算能力 (TOPS) 功耗 光線追蹤效能
NVIDIA RTX 5090 Blackwell 32GB GDDR7 3,352 TOPS 575W 318 TFLOPS,搭載第四代 RT 核心
AMD Radeon RX 9070 XT RDNA 4 16GB GDDR6 - 260W 效能顯著提升,較前代提升 45%
AMD Radeon RX 9070 RDNA 4 16GB GDDR6 - 260W 搭載第三代光線追蹤加速器
AMD Radeon RX 8800 XT RDNA 4 16GB GDDR6 - 220W 較 RX 7900 XTX 提升 45%
效能定位

AMD 的 RDNA 4 架構產品線(RX 9070 系列)主要鎖定中階市場,並未直接與 RTX 5090 競爭。

AI 運算能力

  • RTX 5090 提供 3,352 TOPS 的 AI 運算效能
  • AMD 新一代顯卡採用第二代 AI 加速器,但尚未公布具體數據

製程技術

  • AMD 採用 TSMC 4nm (N4P)製程
  • RTX 5090 採用 Blackwell 架構

市場策略

AMD 這一代選擇避開高端市場的直接競爭,而是專注於中階市場區段,預計主要與 RTX 5070/5070 Ti 系列競爭。這代表 RTX 5090 在高端市場將缺乏直接競爭對手。


DLSS 4 的實際遊戲表現為何?

實際遊戲效益

幀率提升

  • 透過多幀生成技術可產生最多3個額外幀
  • 在某些遊戲中可提升高達50%的幀率
  • 支援4K解析度下240 FPS的光線追蹤遊戲體驗

系統優化

  • VRAM使用量減少30%
  • AI模型運算速度提升40%
  • 透過Reflex 2技術可降低高達75%的延遲

視覺品質改進

  • 採用transformer架構的AI模型,大幅改善畫面細節
  • 提升光線追蹤場景的視覺品質
  • 減少畫面鬼影和提升抗鋸齒效果

遊戲支援情況

首發支援

  • 75款遊戲和應用程式支援多幀生成功能
  • 超過50款遊戲整合新的transformer模型
  • 遊戲包括:
    • Cyberpunk 2077
    • Alan Wake 2
    • Indiana Jones and the Great Circle

使用限制

效能考量

  • 需要較高的基礎幀率才能獲得流暢體驗
  • 在60Hz或120Hz的螢幕上,多幀生成的效果可能不如預期
  • 實際效能提升取決於遊戲優化程度和硬體配置
Nvidia 也釋出 Zorah 的遊戲畫面 - Demo 再開啟 DLSS 下畫面幀數從 20FPS 飆升至 150 FPS

補充: Blackwell 架構如何提升 AI 能力

核心架構創新

運算效能提升

  • AI訓練速度比上一代Hopper快4倍
  • 具備208億個電晶體
  • 支援FP4和FP6數據類型,提升AI推理效率
  • 提供高達3,352 TOPS的AI運算能力

記憶體系統

  • 配備192GB HBM3E記憶體
  • 提供超過8TB/秒的頻寬
  • 採用NVLink技術,GPU間通訊速度達1.8TB/秒

AI應用優化

訓練與推理效能

  • 支援高達10兆參數的AI模型訓練
  • 推理性能比Hopper提升30倍
  • 能耗效率提升25倍

專業功能

  • 第二代Transformer引擎支援動態精度調整
  • 新增專用RAS引擎提升系統可靠性
  • 整合安全AI系統保護數據與模型

實際應用場景

企業應用

  • 支援工程模擬與電子設計自動化
  • 加速藥物設計與量子運算
  • 已獲AWS、Google Cloud等主要雲端服務商採用

開發者工具

  • 透過 Project DIGITS 提供個人AI超級電腦
  • GB10超級晶片可處理2000億參數模型
  • 支援本地開發與雲端無縫部署

RTX 50 系列與先前機種比較

RTX 40 與 50 系列全產品比較
GPU 型號 架構 CUDA 核心數 記憶體 記憶體類型 功耗 (W) 主要特色
RTX 5090 Blackwell 21,760 32GB GDDR7 575 DLSS 4、第四代光線追蹤核心、第五代張量核心、PCIe 5.0 介面、512位元記憶體匯流排、1,792GB/s 記憶體頻寬、AI 強化功能、支援 8K 遊戲
RTX 5080 Blackwell 10,752 16GB GDDR7 360 DLSS 4、光線追蹤、AI 強化功能、PCIe 5.0 介面、DisplayPort 2.1a 支援
RTX 5070 Ti Blackwell 8,960 16GB GDDR7 300 DLSS 4、進階光線追蹤功能、AI 強化功能、第五代張量核心、第四代光線追蹤核心、PCIe 5.0 支援、NVIDIA Reflex 2
RTX 5070 Blackwell 6,144 12GB GDDR7 250 DLSS 4、第四代光線追蹤核心、第五代張量核心、PCIe 5.0、DisplayPort 2.1a、HDMI 2.1b、AI 效能強化
RTX 4090 Ada Lovelace 16,384 24GB GDDR6X 450 DLSS 3、第三代光線追蹤核心、第四代張量核心、光線追蹤功能、AI 強化功能
RTX 4080 Ada Lovelace 9,728 16GB GDDR6X 320 DLSS 3、第三代光線追蹤核心、第四代張量核心、AI 驅動圖形、NVIDIA Reflex、NVIDIA Broadcast、PCIe 4.0
RTX 4070 Ti Ada Lovelace 7,680 12GB GDDR6X 285 DLSS 3、光線追蹤、AI 強化功能、NVIDIA Reflex、NVIDIA Studio、進階散熱系統
RTX 4070 Ada Lovelace 5,888 12GB GDDR6X 200 DLSS 3、即時光線追蹤、AI 加速效能、支援 1440p 遊戲超過 100 FPS
RTX 4060 Ti Ada Lovelace 4,352 8GB GDDR6 160 DLSS 3、光線追蹤、AI 強化功能、第三代光線追蹤核心、第四代張量核心、NVIDIA Studio 支援
RTX 4060 Ada Lovelace 3,072 8GB GDDR6 115 DLSS 3、光線追蹤功能、AI 強化功能、第三代光線追蹤核心、第四代張量核心

功耗比較

RTX 5090 vs RTX 4090

  • RTX 5090: 575W TDP
  • RTX 4090: 450W TDP
  • 增加了125W,約27%的功耗提升

RTX 5080 vs RTX 4080

  • RTX 5080: 360W TDP
  • RTX 4080: 320W TDP
  • 增加了40W,約12.5%的功耗提升

電源供應需求

RTX 5090

  • 建議使用1000W電源供應器
  • 支援PCIe Gen 5接口
  • 配備DisplayPort 2.1b連接器

RTX 5080

  • 建議使用850W電源供應器
  • 功耗較為溫和,相較旗艦型號更容易整合

實際使用考量

散熱設計

  • Founders Edition採用雙風扇設計
  • 配備3D蒸發室散熱系統
  • 針對高功耗進行特殊散熱優化

效能效率

  • 雖然功耗提升,但效能提升更為顯著
  • RTX 5090聲稱效能為RTX 4090的兩倍
  • 採用新一代DLSS 4技術和Blackwell架構
這些數據顯示NVIDIA在追求極致效能的同時,功耗也隨之提升。對於計畫升級的用戶來說,可能需要評估現有電源供應器是否足夠支援新一代顯卡。

結語:Nvidia RTX 50 系列 - AI 與效能的新里程碑

這次 NVIDIA 推出 NVIDIA RTX 5090 為首的 Blackwell 產品線,除了在硬體效能上再度推向新極限,也強調了在 AI 技術應用、散熱設計和記憶體介面上的新突破。雖然官方許多比較數據都基於 DLSS 或多重框架生成等技術,尚需第三方客觀測試來驗證。若你正在觀望新顯示卡,或許不妨關注這波 Blackwell 世代的上市時程,看看它是否能真正帶來撼動市場的新世代標竿。


了解更多關於這次 Nvidia 於 CES 2025 的產品發表

FAQ

Q1: NVIDIA RTX 5090 的效能比 RTX 4090 提升多少? A1: RTX 5090 在理論運算效能上比 RTX 4090 提升了約 50%。這主要歸功於 CUDA 核心數量增加了 32.8%(從 16,384 增加到 21,760),以及新一代 DLSS 4 技術的支援。

Q2: RTX 50 系列的價格區間是多少? A2: RTX 50 系列的建議售價如下:

  • RTX 5090:$2,000
  • RTX 5080:$1,000
  • RTX 5070 Ti:$750
  • RTX 5070:$550

Q3: NVIDIA RTX 5090 的功耗與散熱設計如何? A3: RTX 5090 的總圖形功耗(TGP)達到 575W,比前代 4090 的 450W 更高。採用全新流道式散熱器設計,具備密集鰭片與 Vapor Chamber 設計,配備五條熱管進行散熱。

Q4: DLSS 4 技術能帶來什麼改進? A4: DLSS 4 可在傳統 1 幀的基礎上生成多達 3 幀影像,最高可達 8 倍效能提升。記憶體使用量比前代更低,並且在支援的遊戲中可以將 20FPS 提升至 150FPS。

Q5: RTX 50 系列的上市時間是什麼時候? A5: NVIDIA RTX 5090 與 RTX 5080 將於 2025 年 1 月 30 日開放購買,而 RTX 5070 Ti 與 RTX 5070 預計在 2 月上市。

Share this post