在 2024 年底舉辦的科技大展上,NVIDIA 正式公佈了全新的 Blackwell 架構消費級顯示卡系列──NVIDIA RTX 50 系列。其中最受矚目的,非旗艦級的 NVIDIA RTX 5090 莫屬。這款新卡在規格、散熱設計以及強調 AI 技術的展示上,都讓人對未來的繪圖效能有了更高的期待。以下就讓我們深入剖析 NVIDIA RTX 5090 與該系列其他成員的重點與特色。
全新 Blackwell 架構與產品定位
NVIDIA 表示,新一代的 Blackwell GPU 將在 2025 年 1 月起陸續上市,首波推出的型號包括:
型號 | CUDA核心數 | 記憶體 | 功耗 | 建議售價 |
---|---|---|---|---|
RTX 5090 | 21,760 | 32GB GDDR7 | 575W | $2,000 |
RTX 5080 | 10,752 | 16GB GDDR7 | 360W | $1,000 |
RTX 5070 Ti | 8,960 | 16GB GDDR7 | 300W | $750 |
RTX 5070 | 6,144 | 12GB GDDR7 | 250W | $550 |
其中,NVIDIA RTX 5090 擁有多達 21,760 組 CUDA 核心 (前代 RTX 4090 為 16,384 CUDA 核心 ),以及 2.41 GHz 的 Boost Clock 與 2.01 GHz 的 Base Clock;記憶體介面則大幅提升至 512 位元,帶來約 1.8 TB/s 的理論記憶體頻寬。與上一代 RTX 4090 相比,RTX 5090 的 CUDA 核心數字雖然大幅提高,但仍需實際測試才能判斷真實效能表現。
RTX 5090 vs RTX 4090
RTX 5090 相較於 RTX 4090 的 CUDA 核心數量增加了 5,376 個,具體數據如下:
- RTX 5090: 21,760 CUDA 核心
- RTX 4090: 16,384 CUDA 核心
這代表了約 32.8% 的 CUDA 核心數量提升。這個提升主要歸功於:
- Blackwell 架構的改進
- TSMC N4P (4nm) 製程的採用
- 晶體管數量從 76.3 億增加到 92 億
這樣的核心數量提升,加上新一代 DLSS 4 技術的支援,使 RTX 5090 在理論運算效能上比 RTX 4090 提升了約 50%。
RTX 5090 令人驚訝的耗電與散熱設計
最引人注目的一點,是 NVIDIA RTX 5090 標示的總圖形功耗(TGP)達到 575W。相較前代 450W 的 4090,有明顯的提升。官方展示的創始者版本(Founders Edition)似乎是雙風扇、兩槽厚度的外型設計,這與過去三槽甚至四槽的產品相比顯得相當精巧。如此高功耗卻仍能保持兩槽厚度,推測與全新流道式(Flow-through)散熱器以及更緊湊的 PCB 設計有關。
全新散熱器與 PCB 設計
NVIDIA 在簡報中公開的爆炸圖顯示,顯示卡主 PCB 置中,兩側搭配密集鰭片與 Vapor Chamber(氣室)設計,並有五條熱管進行散熱。如此革新的結構或許得益於早期內部的原型散熱器開發經驗。由於功耗逼近 600W,大面積的氣室搭配強化風扇風道勢必成為關鍵,否則高溫和供電接頭的可靠度都會是挑戰。
其他型號與記憶體配置
在整個系列中,NVIDIA RTX 5090 的顯存規格最為豪華,提供 32GB GDDR7。其他幾款則如下:
- NVIDIA RTX 5080:16GB GDDR7、256 位元記憶體介面、360W 功耗
- NVIDIA RTX 5070 Ti:16GB GDDR7、256 位元記憶體介面、300W 功耗
- NVIDIA RTX 5070:12GB GDDR7、192 位元記憶體介面、250W 功耗
NVIDIA 在宣傳時也特別強調這次最低階只需 $549 USD 的產品 RTX 5070 的表現「可媲美上一代 RTX 4090」,同時聲稱這樣的效能「沒有 AI 與 GDDR7 技術絕對不可能實現」。
DLSS 與多重框架生成技術
隨著 Blackwell 架構的發表,NVIDIA 也帶來了全新升級的 DLSS 多重框架生成技術(Multiframe Generation,簡稱 MFG)。官方資料指出,新一代 AI 模型運算效率更高,可在傳統 1 帧的基礎上生成多達 3 帧影像,最高可達 8 倍效能提升;記憶體用量也比之前更低。
- DLSS 4 與新一代 MFG 技術相結合
- 更快的 Tensor Core 和 RT Core
- 在大作遊戲測試中,達到高畫質、高幀率的理想平衡
不過,需要注意的是官方展示的性能數據大多使用 DLSS 或 MFG 技術,與上一代的測試條件並不完全相同,最終實際效能仍有待獨立測評單位進行客觀測試。
價格與上市時間
根據官方公佈,NVIDIA RTX 5090 與 NVIDIA RTX 5080 將於 1 月 30 日開放購買,而 NVIDIA RTX 5070 Ti 與 NVIDIA RTX 5070 預計在 2 月上市。除了 NVIDIA 的黑白雙色創始者版,市場上也會陸續有各家 AIC(Add-in Card)廠商推出不同設計、不同時脈設定的客製化版本,帶來更多元的選擇與價格幅度。
值得一提的是,競爭對手 AMD 遲遲未在公開場合大篇幅提及新一代顯示卡,只私下向媒體透露有關「970 與 970 XD」的訊息,或許還在觀望 NVIDIA RTX 5090 等產品的實際市場反應。未來幾週至幾個月,預期 AMD 也會推出更多資訊來回應。
NVIDIA RTX 5090 規格分析
主要硬體規格
RTX 5090 旗艦規格:
- 92億個電晶體
- 3,352 TOPS AI運算能力
- 32GB GDDR7記憶體
- 575W 總功耗
效能提升分析
DLSS 4的關鍵角色
實際效能提升主要來自DLSS 4技術,而非純硬體升級。在不支援DLSS的遊戲中,效能提升僅約1.25-1.5倍。
多幀生成技術
- DLSS 4可在每個實際渲染幀之間生成最多三個額外幀
- 此功能為RTX 50系列獨有
- 可能會帶來些許延遲問題,特別是在低幀率情況下
AI與創作能力
創意工作效能:
- 支援FP4精度運算,使AI圖像生成速度提升2倍
- 影片輸出速度比RTX 4090快60%
- 支援4:2:2色彩格式
筆電版本改進
Max-Q技術升級:
- 效能提升2倍
- 電池續航力提升40%
- 保持輕薄設計
RTX 50系列確實帶來了顯著的技術進步,但其宣傳的2倍效能提升主要依賴DLSS 4技術實現。對於不支援DLSS的應用程序,實際效能提升較為溫和。
RTX 5090 vs AMD GPU?
GPU 名稱 | 架構 | 記憶體 | AI 運算能力 (TOPS) | 功耗 | 光線追蹤效能 |
---|---|---|---|---|---|
NVIDIA RTX 5090 | Blackwell | 32GB GDDR7 | 3,352 TOPS | 575W | 318 TFLOPS,搭載第四代 RT 核心 |
AMD Radeon RX 9070 XT | RDNA 4 | 16GB GDDR6 | - | 260W | 效能顯著提升,較前代提升 45% |
AMD Radeon RX 9070 | RDNA 4 | 16GB GDDR6 | - | 260W | 搭載第三代光線追蹤加速器 |
AMD Radeon RX 8800 XT | RDNA 4 | 16GB GDDR6 | - | 220W | 較 RX 7900 XTX 提升 45% |
效能定位
AMD 的 RDNA 4 架構產品線(RX 9070 系列)主要鎖定中階市場,並未直接與 RTX 5090 競爭。
AI 運算能力
- RTX 5090 提供 3,352 TOPS 的 AI 運算效能
- AMD 新一代顯卡採用第二代 AI 加速器,但尚未公布具體數據
製程技術
- AMD 採用 TSMC 4nm (N4P)製程
- RTX 5090 採用 Blackwell 架構
市場策略
AMD 這一代選擇避開高端市場的直接競爭,而是專注於中階市場區段,預計主要與 RTX 5070/5070 Ti 系列競爭。這代表 RTX 5090 在高端市場將缺乏直接競爭對手。
DLSS 4 的實際遊戲表現為何?
實際遊戲效益
幀率提升
- 透過多幀生成技術可產生最多3個額外幀
- 在某些遊戲中可提升高達50%的幀率
- 支援4K解析度下240 FPS的光線追蹤遊戲體驗
系統優化
- VRAM使用量減少30%
- AI模型運算速度提升40%
- 透過Reflex 2技術可降低高達75%的延遲
視覺品質改進
- 採用transformer架構的AI模型,大幅改善畫面細節
- 提升光線追蹤場景的視覺品質
- 減少畫面鬼影和提升抗鋸齒效果
遊戲支援情況
首發支援
- 75款遊戲和應用程式支援多幀生成功能
- 超過50款遊戲整合新的transformer模型
- 遊戲包括:
- Cyberpunk 2077
- Alan Wake 2
- Indiana Jones and the Great Circle
使用限制
效能考量
- 需要較高的基礎幀率才能獲得流暢體驗
- 在60Hz或120Hz的螢幕上,多幀生成的效果可能不如預期
- 實際效能提升取決於遊戲優化程度和硬體配置
補充: Blackwell 架構如何提升 AI 能力
核心架構創新
運算效能提升
- AI訓練速度比上一代Hopper快4倍
- 具備208億個電晶體
- 支援FP4和FP6數據類型,提升AI推理效率
- 提供高達3,352 TOPS的AI運算能力
記憶體系統
- 配備192GB HBM3E記憶體
- 提供超過8TB/秒的頻寬
- 採用NVLink技術,GPU間通訊速度達1.8TB/秒
AI應用優化
訓練與推理效能
- 支援高達10兆參數的AI模型訓練
- 推理性能比Hopper提升30倍
- 能耗效率提升25倍
專業功能
- 第二代Transformer引擎支援動態精度調整
- 新增專用RAS引擎提升系統可靠性
- 整合安全AI系統保護數據與模型
實際應用場景
企業應用
- 支援工程模擬與電子設計自動化
- 加速藥物設計與量子運算
- 已獲AWS、Google Cloud等主要雲端服務商採用
開發者工具
- 透過 Project DIGITS 提供個人AI超級電腦
- GB10超級晶片可處理2000億參數模型
- 支援本地開發與雲端無縫部署
RTX 50 系列與先前機種比較
RTX 40 與 50 系列全產品比較
GPU 型號 | 架構 | CUDA 核心數 | 記憶體 | 記憶體類型 | 功耗 (W) | 主要特色 |
---|---|---|---|---|---|---|
RTX 5090 | Blackwell | 21,760 | 32GB | GDDR7 | 575 | DLSS 4、第四代光線追蹤核心、第五代張量核心、PCIe 5.0 介面、512位元記憶體匯流排、1,792GB/s 記憶體頻寬、AI 強化功能、支援 8K 遊戲 |
RTX 5080 | Blackwell | 10,752 | 16GB | GDDR7 | 360 | DLSS 4、光線追蹤、AI 強化功能、PCIe 5.0 介面、DisplayPort 2.1a 支援 |
RTX 5070 Ti | Blackwell | 8,960 | 16GB | GDDR7 | 300 | DLSS 4、進階光線追蹤功能、AI 強化功能、第五代張量核心、第四代光線追蹤核心、PCIe 5.0 支援、NVIDIA Reflex 2 |
RTX 5070 | Blackwell | 6,144 | 12GB | GDDR7 | 250 | DLSS 4、第四代光線追蹤核心、第五代張量核心、PCIe 5.0、DisplayPort 2.1a、HDMI 2.1b、AI 效能強化 |
RTX 4090 | Ada Lovelace | 16,384 | 24GB | GDDR6X | 450 | DLSS 3、第三代光線追蹤核心、第四代張量核心、光線追蹤功能、AI 強化功能 |
RTX 4080 | Ada Lovelace | 9,728 | 16GB | GDDR6X | 320 | DLSS 3、第三代光線追蹤核心、第四代張量核心、AI 驅動圖形、NVIDIA Reflex、NVIDIA Broadcast、PCIe 4.0 |
RTX 4070 Ti | Ada Lovelace | 7,680 | 12GB | GDDR6X | 285 | DLSS 3、光線追蹤、AI 強化功能、NVIDIA Reflex、NVIDIA Studio、進階散熱系統 |
RTX 4070 | Ada Lovelace | 5,888 | 12GB | GDDR6X | 200 | DLSS 3、即時光線追蹤、AI 加速效能、支援 1440p 遊戲超過 100 FPS |
RTX 4060 Ti | Ada Lovelace | 4,352 | 8GB | GDDR6 | 160 | DLSS 3、光線追蹤、AI 強化功能、第三代光線追蹤核心、第四代張量核心、NVIDIA Studio 支援 |
RTX 4060 | Ada Lovelace | 3,072 | 8GB | GDDR6 | 115 | DLSS 3、光線追蹤功能、AI 強化功能、第三代光線追蹤核心、第四代張量核心 |
功耗比較
RTX 5090 vs RTX 4090
- RTX 5090: 575W TDP
- RTX 4090: 450W TDP
- 增加了125W,約27%的功耗提升
RTX 5080 vs RTX 4080
- RTX 5080: 360W TDP
- RTX 4080: 320W TDP
- 增加了40W,約12.5%的功耗提升
電源供應需求
RTX 5090
- 建議使用1000W電源供應器
- 支援PCIe Gen 5接口
- 配備DisplayPort 2.1b連接器
RTX 5080
- 建議使用850W電源供應器
- 功耗較為溫和,相較旗艦型號更容易整合
實際使用考量
散熱設計
- Founders Edition採用雙風扇設計
- 配備3D蒸發室散熱系統
- 針對高功耗進行特殊散熱優化
效能效率
- 雖然功耗提升,但效能提升更為顯著
- RTX 5090聲稱效能為RTX 4090的兩倍
- 採用新一代DLSS 4技術和Blackwell架構
這些數據顯示NVIDIA在追求極致效能的同時,功耗也隨之提升。對於計畫升級的用戶來說,可能需要評估現有電源供應器是否足夠支援新一代顯卡。
結語:Nvidia RTX 50 系列 - AI 與效能的新里程碑
這次 NVIDIA 推出 NVIDIA RTX 5090 為首的 Blackwell 產品線,除了在硬體效能上再度推向新極限,也強調了在 AI 技術應用、散熱設計和記憶體介面上的新突破。雖然官方許多比較數據都基於 DLSS 或多重框架生成等技術,尚需第三方客觀測試來驗證。若你正在觀望新顯示卡,或許不妨關注這波 Blackwell 世代的上市時程,看看它是否能真正帶來撼動市場的新世代標竿。
了解更多關於這次 Nvidia 於 CES 2025 的產品發表
- NVIDIA RTX 50 系列效能解密:該升級了嗎? 還是再等等?
- 黃仁勳談AI晶片、機器人與未來
- Nvidia Project DIGITS:桌面AI超級電腦的革命進化
- AMD ROCm:挑戰 CUDA 的利器?AI 伺服器市場的競爭
- RTX 5090 即將上市?售價曝光,漲幅驚人
FAQ
Q1: NVIDIA RTX 5090 的效能比 RTX 4090 提升多少? A1: RTX 5090 在理論運算效能上比 RTX 4090 提升了約 50%。這主要歸功於 CUDA 核心數量增加了 32.8%(從 16,384 增加到 21,760),以及新一代 DLSS 4 技術的支援。
Q2: RTX 50 系列的價格區間是多少? A2: RTX 50 系列的建議售價如下:
- RTX 5090:$2,000
- RTX 5080:$1,000
- RTX 5070 Ti:$750
- RTX 5070:$550
Q3: NVIDIA RTX 5090 的功耗與散熱設計如何? A3: RTX 5090 的總圖形功耗(TGP)達到 575W,比前代 4090 的 450W 更高。採用全新流道式散熱器設計,具備密集鰭片與 Vapor Chamber 設計,配備五條熱管進行散熱。
Q4: DLSS 4 技術能帶來什麼改進? A4: DLSS 4 可在傳統 1 幀的基礎上生成多達 3 幀影像,最高可達 8 倍效能提升。記憶體使用量比前代更低,並且在支援的遊戲中可以將 20FPS 提升至 150FPS。
Q5: RTX 50 系列的上市時間是什麼時候? A5: NVIDIA RTX 5090 與 RTX 5080 將於 2025 年 1 月 30 日開放購買,而 RTX 5070 Ti 與 RTX 5070 預計在 2 月上市。