T客邦 October 12, 2022
NVIDIA在台灣時間2022年9月21日晚間的GTC大會上發表了GeForce RTX 4090顯示卡,就讓我們一起來看看它的效能表現。7c75cdf43363925fb5f9e92a448a3f6d

NVIDIA在台灣時間2022年9月21日晚間的GTC大會上發表了GeForce RTX 4090顯示卡,就讓我們一起來看看它的效能表現。

旗艦王者先行

NVIDIA將於10月12日起正式銷售NVIDIA GeForce RTX 4090,而GeForce RTX 4080 16GB與12GB雙版本將於11月開賣。

需要注意的是,這3張顯示卡都會有各AIC板卡廠商推出的自製卡,但僅有NVIDIA GeForce RTX 4090與RTX 4080 16GB會推出等同於公板卡的Founder Edition(創始版),且2者搭載相同的散熱器。

由於我們先前已經準備了GeForce RTX 4090 Founder Edition的開箱報導,所以這邊就跳過顯示卡的外觀介紹,並聚焦於電源端子部分。

GeForce RTX 4090 Founder Edition採用ATX 3.0規範的12VHPWER,它採用12Pin+4 Pin的端子,其中12Pin部分為6條12V火線與6條地線,4Pin部分則為訊號偵測用途,並可以透過單一纜線傳輸最高達600W的電力。ATX 3.0規範的另一重點,就是它需要能夠承受2倍的峰值功耗和3倍顯示卡瞬間峰值功耗,舉例來說,600W的顯示卡電力功率規格,需能在100µs(等於0.0001秒)的時間內提供1800W電力輸出,避免因瞬間超抽而造成重開機或當機等問題,以提升系統穩定性。

(若下方表格無法完整顯示,請點選我看圖片版

GeForce RTX 40系列顯示卡規格簡表      
顯示卡型號 CUDA核心數量 基礎時脈 Boost時脈 顯示記憶體容量 記憶體類別 顯示卡功耗
GeForce RTX 4090 16384 2230MHz 2520MHz 24GB 384bit GDDR6X 450W
GeForce RTX 4080 16GB 9728 2210MHz 2505MHz 16GB 256bit GDDR6X 320w
GeForce RTX 4080 12GB 7680 2310MHz 2610MHz 12GB 192bit GDDR6X 285

 

GeForce RTX 4090 Founder Edition的外型與前代GeForce RTX 3090 Ti Founder Edition相當接近,更多圖片可以參考先前的開箱報導。 ▲ GeForce RTX 4090 Founder Edition的外型與前代GeForce RTX 3090 Ti Founder Edition相當接近,更多圖片可以參考先前的開箱報導

我們藉由MSI推出的MPG A1000G PCIE5電源供應器來說明12VHPWER的特色。 ▲ 我們藉由MSI推出的MPG A1000G PCIE5電源供應器來說明12VHPWER的特色。

右側即為12VHPWER纜線,口徑較大的12Pin端部分為電力傳輸,效小的4Pin部分則為偵測與訊號用途。 ▲ 右側即為12VHPWER纜線,口徑較大的12Pin端子部分為電力傳輸,效小的4Pin部分則為偵測與訊號用途。

使用12VHPWER的話,只需單一纜線就能提供600W的電力,滿足GeForce RTX 4090 Founder Edition的需求。 ▲ 使用12VHPWER的話,只需單一纜線就能提供600W的電力,滿足GeForce RTX 4090 Founder Edition的需求。

若使用GeForce RTX 4090 Founder Edition附帶的轉接器配傳統的8Pin PCIe電源纜線,則需要使用4條纜線,不但相當麻煩,也會增加走線與散熱的困難。 ▲ 若使用GeForce RTX 4090 Founder Edition附帶的轉接器搭配傳統的8Pin PCIe電源纜線,則需要使用4條纜線,不但相當麻煩,也會增加走線與散熱的困難。

需要注意的是,型號有PCIE5樣的新版MPG A1000G PCIE5才有12VHPWER端。若是舊版MPG A1000G則無。 ▲ 需要注意的是,型號中有PCIE5字樣的新版MPG A1000G PCIE5才有12VHPWER端子。若是舊版MPG A1000G則無。

MPG A1000G PCIE5也提供4組CPU與PCIe共用的8Pin端,並附上12VHPWER轉雙PCIe 8Pin線材,能夠提供高度相容舊規格顯示卡的便利。 ▲ MPG A1000G PCIE5也提供4組CPU與PCIe共用的8Pin端子,並附上12VHPWER轉雙PCIe 8Pin線材,能夠提供高度相容舊規格顯示卡的便利。

測試環境與條件

在下列測試過程中,筆者會開啟顯示卡的Resizable BAR功能,所有成績都是進行2輪測試,在確定沒有極端值後取平均,遊戲效能使用遊戲內建的測試模式

而《要塞英雄》與《絕對武力:全球攻勢》分別使用Titled Tower Benchmark、FPS Benchmark地圖搭配NVIDIA FrameView進行測試,並在1080p、2K、4K解析度搭配最高畫質設定,若有設定範本則套用最高範本,若無則將所有畫質相關項目調至最高,關閉VRS或動態解析度等設定,並僅進行開、關光線追蹤功能的調整。對照組成績為本次重新測試。

測試平台:
處理器:AMD Ryzen 7 7700X
散熱器:MSI MEG Coreliquid S360
主機板:ASRock X670E Taichi(UEFI版號:1.08.AS02 Beta)
記憶體:G.Skill Trident Z5 Neo 16GBx2(@DDR5-6000)
顯示卡:NVIDIA GeForce RTX 4090 Founder Edition、NVIDIA GeForce RTX 3080 Founder Edition、AMD Radeon RX 6800 XT
儲存裝置:Seagate FireCuda 520 SSD 1TB
電源供應器:Seasonic Prime Titanium 850W
軟體環境:Windows 11專業版21H2(Build 22000.978),GeForce Game Ready 521.90,Radeon Software 22.5.1

測試選用AMD新推出的AM5平台,配Ryzen 7 7700X處理器。 ▲ 測試選用AMD新推出的AM5平台,搭配Ryzen 7 7700X處理器。

主角當然是GeForce RTX 4090 Founder顯示卡。 ▲ 主角當然是GeForce RTX 4090 Founder顯示卡。

(下頁開始分析測試成績)

3D渲染與3DMark測試套餐

在測試的前半部,我們先透過下列圖表來瞭解V-Ray 3D渲染以及3DMark的效能表現。

V-Ray是由保加利亞的Chaos Group公司所開發3D圖像渲染應用程式。RTX 4090無論是使用CUDA運算或是RTX光線追蹤運算,效能都是RTX 3080的2.3倍以上。 ▲ V-Ray是由保加利亞的Chaos Group公司所開發3D圖像渲染應用程式。RTX 4090無論是使用CUDA運算或是RTX光線追蹤運算,效能都是RTX 3080的2.3倍以上。

3DMark Fire Strik採用Direct X 11繪圖API配1080p解析度(1920 x 1080),由於各張顯示卡都配一樣的處理器,所以物理分數會相當接近,圖像分數部分無疑是由RTX 4090大幅領先。 ▲ 3DMark Fire Strik採用Direct X 11繪圖API搭配1080p解析度(1920 x 1080),由於各張顯示卡都搭配一樣的處理器,所以物理分數會相當接近,圖像分數部分無疑是由RTX 4090大幅領先。

Fire Strike Extreme將解析度提升至2K(2560 x 1440),RTX 4090的圖像分數能夠領先RTX 3080達112.7%。 ▲ Fire Strike Extreme將解析度提升至2K(2560 x 1440),RTX 4090的圖像分數能夠領先RTX 3080達112.7%。

Fire Strike Ultra進一將解析度提升至4K(3840 x 2160),RTX 4090將圖像分數的領先擴大至128.96%。 ▲ Fire Strike Ultra進一步將解析度提升至4K(3840 x 2160),RTX 4090將圖像分數的領先擴大至128.96%。

3DMark Time Spy採用Direct X 12配2K解析度,比較能反映現今遊戲的效能趨勢。RTX 4090的圖像分數仍以116.3%巨幅領先RTX 3080。 ▲ 3DMark Time Spy採用Direct X 12搭配2K解析度,比較能反映現今遊戲的效能趨勢。RTX 4090的圖像分數仍以116.3%巨幅領先RTX 3080。

Time Spy Extreme將解析度提升至4K,,RTX 4090圖像分數能夠領先RTX 3080達126.01%。 ▲ Time Spy Extreme將解析度提升至4K,,RTX 4090圖像分數能夠領先RTX 3080達126.01%。

3DMark Port Royal採用DirectX Raytracing(DXR)光線追蹤繪圖技術配2K解析度,是考驗顯示卡光線追蹤效能的競技場。RTX 4090領先幅度高達130.61%。 ▲ 3DMark Port Royal採用DirectX Raytracing(DXR)光線追蹤繪圖技術搭配2K解析度,是考驗顯示卡光線追蹤效能的競技場。RTX 4090領先幅度高達130.61%。

3DMark DirextX光線追蹤功能測試同樣採用DXR技術,RTX 4090將領先幅度拉開至190.54%。 ▲ 3DMark DirextX光線追蹤功能測試同樣採用DXR技術,RTX 4090將領先幅度拉開至190.54%。

Xess功能測試是3DMark最新加入的項目,它可以用於測試Intel提出的Xess升頻技術所帶來的效能增益。AMD與NVIDIA的表現落差不大,但RTX 4090透過升頻提高的FPS效果最不顯著。 ▲ Xess功能測試是3DMark最新加入的項目,它可以用於測試Intel提出的Xess升頻技術所帶來的效能增益。AMD與NVIDIA的表現落差不大,但RTX 4090透過升頻提高的FPS效果最不顯著。

回到NVIDIA自家DLSS升頻技術的主場,開啟DLSS 2之後,RTX 3080、RTX 4090都有超過100%的FPS效能提升。AMD顯示卡因不支援DLSS故無法進行測試。 ▲ 回到NVIDIA自家DLSS升頻技術的主場,開啟DLSS 2之後,RTX 3080、RTX 4090都有超過100%的FPS效能提升。AMD顯示卡因不支援DLSS故無法進行測試。

NVIDIA新推出的DLSS 3除了包含Super Resolution升頻,還有全新的Frame Generation,將升頻效率提高到203.64%,讓FPS效能達到關閉DLSS時的3倍。 ▲ NVIDIA新推出的DLSS 3除了包含Super Resolution升頻,還有全新的Frame Generation,將升頻效率提高到203.64%,讓FPS效能達到關閉DLSS時的3倍。

遊戲效能實測

接下來我們一起深入瞭解GeForce RTX 4090的實際遊戲的效能表現如何。由於這次我們將測試基準平台的處理器由原本的Ryzen 7 5800X升級為Ryzen 7 7700X,因此能緩解處理器效能瓶頸(CPU Bond)狀況,尤其對競技類遊戲的幫助更是顯著。

首先我們看到競技類遊戲的《要塞英雄》,RTX 4090能將4K解析度平均FPS拉抬到接近144幀,而各解析度的99百分位FPS(指僅有1%的畫格低於速度)相較於對照組也有明顯提升,可以有效緩解操作延遲與卡頓情況。 ▲ 首先我們看到競技類遊戲的《要塞英雄》,RTX 4090能將4K解析度平均FPS拉抬到接近144幀,而各解析度的99百分位FPS(指僅有1%的畫格低於此速度)相較於對照組也有明顯提升,可以有效緩解操作延遲與卡頓情況。

從數據可以推測Ryzen 7 7700X《絕對力:全球攻勢》的處理器效能瓶頸大約就是在FPS為870幀左右,至於在4K解析度下,RTX 4090的平均FPS也有超過 400幀的表現。 ▲ 從數據可以推測Ryzen 7 7700X《絕對武力:全球攻勢》的處理器效能瓶頸大約就是在FPS為870幀左右,至於在4K解析度下,RTX 4090的平均FPS也有超過 400幀的表現。

在我們新加入的《電叛客2077》效能測試,關閉光線追蹤的情況下,RTX 4090能夠在不同且解析度領先RTX 3080達54.45~89.07%不。 ▲ 在我們新加入的《電馭叛客2077》效能測試中,關閉光線追蹤的情況下,RTX 4090能夠在不同且解析度領先RTX 3080達54.45~89.07%不等。

《電叛客2077》開啟光線追蹤後,RTX 4090的領先幅度擴大至84.43~170.95%。比較可惜的是RTX 4090仍然無法將4K光線追蹤的平均FPS表現扛過60幀大關,不過開啟DLSS 3升頻後表現可達144幀,我們會在後續專題進行詳細介紹。 ▲ 《電馭叛客2077》開啟光線追蹤後,RTX 4090的領先幅度擴大至84.43~170.95%。比較可惜的是RTX 4090仍然無法將4K光線追蹤的平均FPS表現扛過60幀大關,不過開啟DLSS 3升頻後表現可達144幀,我們會在後續專題中進行詳細介紹。

《大地長征5》關閉光線追蹤的情況下,RTX 4090在4K解析度的效能領先RTX 3080達到118.91%。 ▲ 《大地長征5》關閉光線追蹤的情況下,RTX 4090在4K解析度的效能領先RTX 3080達到118.91%。

《大地長征5》開啟光線追蹤後,RTX 4090拉大領先幅度達126.9%。 ▲ 《大地長征5》開啟光線追蹤後,RTX 4090拉大領先幅度達126.9%。

從數據可以推測,《古墓奇兵:暗影》的處理器效能瓶頸大約在FPS為215幀左右,RTX 4090在2K解析度已經快要碰到瓶頸。 ▲ 從數據中可以推測,《古墓奇兵:暗影》的處理器效能瓶頸大約在FPS為215幀左右,RTX 4090在2K解析度已經快要碰到瓶頸。

《古墓奇兵:暗影》開啟光線追蹤後,RTX 4090可以在4K解析度提供平均FPS近120幀的流暢效能。 ▲ 《古墓奇兵:暗影》開啟光線追蹤後,RTX 4090可以在4K解析度提供平均FPS近120幀的流暢效能。

在《戰慄深隧:流亡》不使用光線追蹤的情況下,RTX 4090可以在4K解析度的平均FPS效能超過120幀。 ▲ 在《戰慄深隧:流亡》不使用光線追蹤的情況下,RTX 4090可以在4K解析度的平均FPS效能超過120幀。

《戰慄深隧:流亡》開啟光線追蹤後,RTX 4090也能提供遠高於60幀的平均FPS,能夠流暢執行遊戲。 ▲ 《戰慄深隧:流亡》開啟光線追蹤後,RTX 4090也能提供遠高於60幀的平均FPS,能夠流暢執行遊戲。

在不使用光線追蹤的情況下,RTX 4090的效能在《看門狗:自由軍團》領先RTX 3080達到1倍以上。 ▲ 在不使用光線追蹤的情況下,RTX 4090的效能在《看門狗:自由軍團》領先RTX 3080達到1倍以上。

開啟光線追蹤後,RTX 4090不需DLSS升頻技術就能在《看門狗:自由軍團》提供60幀以上的平均FPS,表現相當出色。 ▲ 開啟光線追蹤後,RTX 4090不需DLSS升頻技術就能在《看門狗:自由軍團》提供60幀以上的平均FPS,表現相當出色。

《極地戰嚎6》對顯示卡的效能需求較低,RTX 4090能在4K解析度下輕鬆將平均FPS推上120幀。 ▲ 《極地戰嚎6》對顯示卡的效能需求較低,RTX 4090能在4K解析度下輕鬆將平均FPS推上120幀。

《極地戰嚎6》開啟光線追蹤後,RTX 4090還是能在4K解析度提供破100幀的平均FPS。 ▲ 《極地戰嚎6》開啟光線追蹤後,RTX 4090還是能在4K解析度提供破100幀的平均FPS。

在《火線獵殺:絕境》,RTX 4090能在4K解析度達到平均FPS近144幀的表現,能夠滿足進階射擊遊戲玩家的需求。 ▲ 在《火線獵殺:絕境》中,RTX 4090能在4K解析度達到平均FPS近144幀的表現,能夠滿足進階射擊遊戲玩家的需求。

RTX 4090在《刺客教條:京紀元》的4K解析度,效能表現較RTX 3080高出94.83%。 ▲ RTX 4090在《刺客教條:維京紀元》的4K解析度中,效能表現較RTX 3080高出94.83%。

《刺客任務III》Dubai(杜拜)測試項目包含多種場景與NPC角色,整體繪圖負擔較低,RTX 4090能將平均FPS拉抬超過200幀。 ▲ 《刺客任務III》Dubai(杜拜)測試項目包含多種場景與NPC角色,整體繪圖負擔較低,RTX 4090能將平均FPS拉抬超過200幀。

《刺客任務III》Dartmoor(達特穆爾)測試項目則包含許多槍枝射擊與爆炸效果,充滿物理與粒模擬,對處理器與顯示卡的考驗更加嚴苛,RTX 4090也有平均FPS超過144幀的優秀表現。 ▲ 《刺客任務III》Dartmoor(達特穆爾)測試項目則包含許多槍枝射擊與爆炸效果,充滿物理與粒子模擬,對處理器與顯示卡的考驗更加嚴苛,RTX 4090也有平均FPS超過144幀的優秀表現。

《刺客任務III》也終於透過更新加入光線追蹤功能,因我們也將其納入測試。開啟光線追蹤後,RTX 4090在Dubai測試項目的平均FPS為66.04幀 ▲ 《刺客任務III》也終於透過更新加入光線追蹤功能,因此我們也將其納入測試。開啟光線追蹤後,RTX 4090在Dubai測試項目的平均FPS為66.04幀

至於負擔較重的Dartmoor項目加上光線追蹤,RTX 4090的平均FPS為56.86幀,略低於60幀門檻,不過這種幅度的落後可以透過G-Sync增強同功能彌補,達到目視與60幀無差別的遊戲體驗。 ▲ 至於負擔較重的Dartmoor項目加上光線追蹤,RTX 4090的平均FPS為56.86幀,略低於60幀門檻,不過這種幅度的落後可以透過G-Sync增強同步功能彌補,達到目視與60幀無差別的遊戲體驗。

真4K光線追蹤顯示卡登場

比較可惜的是筆者來不及在這次測試專題進行GeForce RTX 3090 / 3090 Ti或是Radeon RX 6950 XT等前一代旗艦顯示卡的測試,但從過去的數據推測,GeForce RTX 4090與GeForce RTX 3090相比,在傳統光柵化繪圖或是光線追蹤的效能表現分別約有8、9成的提升,就算保守估計也可達6成以上,而官方定價僅從美金1,499元上調至1,599元,漲幅僅有6.67%,從性價比的觀點來分析,世代升級效益相當明顯。

GeForce RTX 4090也能將多款遊戲的4K解析度、最高畫質搭配光線追蹤的平均FPS效能表現扛過60幀門檻,成為首張「真4K光線追蹤」顯示卡,對於效能略有不足的遊戲,或是即將透過更新追加的《電馭叛客2077》Overdrive Mode超高畫質光線追蹤模式,都可以藉由DLSS 3升頻技術大幅提升效能表現,帶來更好的遊戲體驗。DLSS 3的解說與實測請參考下方相關文章連結。

另一點值得注意的是,NVIDIA官方表示他們也觀察到有越來越多從事多媒體創作、3D開發的個人工作室,他們不見得需要Quadro系列繪圖卡針對企業用戶提供的功能與服務,因此也開始為GeForce系列顯示卡提供Studio驅動程式,並在RTX 40系列顯示卡開始搭載雙硬體編碼器(NVENC)等功能,提供更強大的工具協助創作者揮灑創意,可以說是適合頂級玩家與創意工作者參考的新世代卡王。

系列文章:
NVIDIA GeForce RTX 4090創始版開箱搶先看,新世代卡王即將降臨!
NVIDIA GeForce RTX 4090效能實測,新世代卡王暢玩4K光線追蹤(本文)
NVIDIA Ada Lovelace架構解析(一):光線追蹤效能大爆發
NVIDIA Ada Lovelace架構解析(二):實測DLSS 3讓遊戲效能再次翻倍(製作中)

加入T客邦Facebook粉絲團 固定链接 'NVIDIA GeForce RTX 4090效能實測,新世代卡王暢玩4K光線追蹤' 提交: October 11, 2022, 5:00am CST