阅读疯子

阅读视图

发现新文章,点击刷新页面。

Framework推出Desktop桌上型電腦,採AMD Ryzen AI Max + 395處理器還可選貓扇

以模組化筆記型電腦聞名的Framework先前在Computex 24台北國際電腦展就預告他們會推出筆記型電腦以外的產品,如今揭曉答案為模組化桌上型電腦。4b881b62c90af94bea678ba82db08802

以模組化筆記型電腦聞名的Framework先前在Computex 24台北國際電腦展就預告會推出筆記型電腦以外的產品,如今揭曉答案為模組化桌上型電腦。

採用最強內顯處理器

Framework Desktop是款延續模組化設計概念的桌上型電腦,它的體積僅有4.5公升,採用代號為Strix Halo的AMD Ryzen AI Max 300系列處理器,可選擇Ryzen AI Max + 395或Ryzen AI Max 385。

延伸閱讀:
Framework模組化筆電跟上Intel Core Ultra AIPC風潮,終於推出SD讀卡機模組
Framework跳出x86!模組化筆電新增RISC-V架構主機板選擇
改造空間大的DIY筆電!Framework模組化筆電開放預購,最低價格22,500元起

其中Ryzen AI Max + 395的處理器部分採用Zen 5運算架構,具有16組實體核心並支援32條執行緒,L2、L3快取記憶體容量分別為16 MB、 64 MB,最高Boost時脈可達5.1 GHz。它搭配具有40組RDNA 3.5繪圖架構的Radeon 8060S內建顯示晶片,具有40組運算單元(CU),最高時脈可達2900 MHz。

在AI運算功能方面,Ryzen AI Max + 395支援AMD Ryzen AI 平台,並搭載AI運算效能達50 TOPS的NPU(神經處理器),全機AI運算效能高達126 TOPS。

Ryzen AI Max + 395之型號可搭配64 GB或128 GB的LPDDR5x-8000記憶體(On-Board設計,不可更換),Ryzen AI Max 385則僅有32GB容量選項。儲存裝置部分則提供2組PCIe Gen 4x4的M.2 2280插槽,消費者可選購500 GB到8 TB等容量的固態硬諜,或是不選購(自行準備)。

消費者也可在訂購時選擇Windows 11 Home / Pro等作業系統,或自行安裝Windows或Linux等作業系統。

Framework Desktop是款尺寸為20.55 x 9.68 x 22.61公分的迷你模組化桌上型電腦,體積僅有4.5公升。

它具有高度改裝的彈性,使用者可以輕鬆改裝面板、側板、內裝,並透過擴充模組調整前置I/O功能。

Framework Desktop的尺寸相當小巧,放在桌上也不會佔用太多空間。

放到背包也能輕鬆攜帶外出。

自由更換各種模組

Framework Desktop除了繼承Framework多元的擴充模組設計,能夠自由更換USB、USB Type-C、SD讀卡機、microSD讀卡機、固態硬碟、乙太網路、3.5mm音訊等模組。

此外Framework Desktop也提供了前面板裝飾模組以及透明側板等選購品,消費者可以購買各種顏色或是Framework、AMD、Tux(Linux小企鵝)、Arch Linux、Linux Mint等裝飾模組,自行改造視覺風格。

Framework Desktop的前面板也採模組化設計,能夠像積木一般自由更換面板模組。

使用者能在訂購時選擇多種前面板裝飾模組,打造喜歡的外觀風格。

在機身背面的I/O背板部分,提供USB 3.2 Gen 1、USB4、DisplayPort 2.1各2組,以及5GbE乙太網路、HDMI 2.1、3.5mm音訊端子各1組。

機身前方下側則提供2組Framework獨有的擴充模組空間,可以自由更換USB、USB Type-C、SD讀卡機、microSD讀卡機、固態硬碟、乙太網路、3.5mm音訊等模組。

在處理器散熱器方面,Framework Desktop也提供Cooler Master以及俗稱貓頭鷹的Noctua等多款風扇的搭配選擇。

使用者也可自行選擇要非透明或透明的機殼側板。

Framework Desktop預計於2025年第3季上市,目前已可預購(將按預購批次順序出貨),Ryzen AI Max + 395處理器搭配64 GB記憶體之價格為新台幣54,500元起,並依不同客製化選項而異。

加入T客邦Facebook粉絲團

RDNA 4繪圖架構之AI運算與FSR 4效能禁藥解析:遊戲FPS效能催上3.7倍

AMD在RDNA 4繪圖架構改善AI運算加速器,並新增支援更多資料類型,以及透過軟體最佳化提升運算效能,也帶來以機器學習為基礎的FSR 4升頻技術。0b32f2f6ab67b5b402bfad61460b81fc

AMD在RDNA 4繪圖架構改善AI運算加速器,並新增支援更多資料類型,以及透過軟體最佳化提升運算效能,也帶來以機器學習為基礎的FSR 4升頻技術。

回到系列文章目錄:AMD發表RDNA 4繪圖架構與Radeon RX 9070系列顯示卡,支援全新ML加持FSR 4升頻功能

AI效能最高翻8倍

筆者在先前《AMD RDNA 4繪圖架構說明》一文中提到RDNA 4架構的硬體設計改進,其中的第3代AI加速器(矩陣運算加速器)同樣支援Wave Matrix Multiply Accumulate指令集,並新增FP8與BF8(E4M3、E5M2)等資料類型,以及新增支援結構稀疏性(Structured Sparsity,可提升1倍峰值效能)。

與前代RDNA 3相比,RDNA 4的每組運算單元(CU)在FP64、FP32資料類型的基本運算效能相同,但在FP16有2倍效能表現,INT8、INT4則達到4倍,若再搭配結構稀疏性則可分別提高到4倍、8倍,提升相當顯著。

另一方面AMD也持續改善AI運算環境的框架,透過對模型的最佳化來提高整體運算效能,並簡化部署模型的工作流程。

RDNA 4除了延續支援FP64、FP32、FP16、BF16、INT8、INT4等資料類型的AI運算之外,還新增FP8與BF8等資料類型,以及新增支援結構稀疏性,提升各種運算條件下的峰值效能。

RDNA 3 / 4之每組CU能夠提供的基本運算量(Ops per CU)對照表。

從圖表可以清楚看出,RDNA 4的AI運算在不同資料類型搭配結構稀疏性最高可以達到RDNA 3峰值效能之8倍。

RDNA 4繪圖架構之AI運算與FSR 4效能禁藥解析:遊戲FPS效能催上3.7倍

▲在進行Stable Diffusion XL、Stable Diffusion 3、Flash Stable Diffusion 3、FLUX.1等模型的AI圖像生成運算時,RDNA 4架構能透過Microsoft Olive框架與最佳化的ONNX框架加速運算效能。

改善FSR 4與AFMF 2.1效能禁藥畫質

AMD也在FSR 4(FidelityFX Super Resolution 4)升頻功能導入機器學習(Machine Learning,AI運算的一個分枝)類型的模型,能夠在提升遊戲FPS效能的同時,改善升頻後的畫質表現。不過AMD資深副總裁暨GPU技術與工程研發王啟尚在Radeon RX 9000系列顯示卡發表會說明,FSR 4的模型採用FP8資料類型,然而RDNA 3 / 3.5以及先前的顯示架構並不支援FP8,代表只有採用RDNA 4架構的有Radeon 9000系列顯示卡才能使用這項功能。

值得注意的是AMD在FSR 3.1導入可升級式API,能夠降低已支援FSR 3.1的遊戲可以升級至FSR 4的開發門檻,讀者可以參考AMD提供的FSR 4遊戲相容清單,並在AMD Software Adrenalin Edition驅動程式中開啟FSR 4升頻功能。

另一方面,AMD也推出強化畫質的AFMF 2.1畫格生成(AMD Fluid Motion Frames)功能,它以先前推出的AFMF 2為基礎,能在所有使用DirectX 11、DirectX 12、OpenGL、Vulkan等繪圖API的遊戲強制開啟畫格生成,提升遊戲的FPS效能表現。

另一方面,AMD也在AMD Software中透過HYPR-RX整合多種改善遊戲效能與延遲的技術,讓玩家只需開啟HYPR-RX,就能自動套用多種技術為遊戲效能最佳化,簡化設定的操作流程。

FSR 4升頻技術以機器學習為基礎,能夠進一步改善升頻後的畫質。值得注意的是它能透過FSR 3.1的可升級式API直接套用於現有遊戲。

AMD利用搭載自家Instinct加速器的伺服器訓練FSR 4的機器學習模型,並將模型部署到玩家的電腦,透過RDNA 4架構的顯示卡進行推論運算,但需注意的是FSR 4的模型採用FP8資料類型,代表只有Radeon 9000系列顯示卡才能使用。

AMD特別說明FSR 4架構的「一條龍」生產流程,透過Zen與XDNA架構的處理器、神經處理器(NPU)開發程式,然後透過EPYC伺服器級處理器與Instinct加速器訓練模型,最後在RDNA 4架構的顯示卡進行推論運算。

根據AMDW提供的數據,FSR 4搭配畫格生成功能最高可以帶來3.7倍於原生FPS的效能表現。

受益於更強大的機器學習模型,FSR 4能夠提供更細緻的圖像品質,請注意建築物的尖塔部分。

歷代FSR與顯示卡的相容性列表。其中FSR 3的升頻功能需要Radeon RX 590以上之顯示卡,而畫格生成需要Radeon RX 5000系列以上。FSR 4的升頻與畫格生成皆需要Radeon RX 9000系列以上。

AMD透過HYPR-RX簡化玩家設定流程,可以「一鍵開啟」FSR、Anti-Lag、Boost、RSR、AFMA等多種升頻、最佳化功能。

Anti-Lag能夠降低遊戲操作延遲,透過更敏捷的反應速度提高玩家在遊戲中的競技優勢。

AFMA 2.1可以對幾乎所有遊戲強制開啟畫格生成功能,並相容於Radeon RX 6000系列之後的顯示卡,以及Ryzen AI 300系列處理器之內建顯示晶片。

AFMF 2.1較先前AFMF 2改善了圖像品質,能夠改善鬼影、精細材質、混疊等細節。

其中改善鬼影的效果最為明顯,可以看到AFMF 2(上)的車輪相當模糊,AFMF 2.1(下)則較為清晰。

透過HYPR-RX與AFMA 2.1能為遊戲帶來最多3倍於原生狀態的FPS效能。

AMD的FSR 4與競爭對手NVIDIA的DLSS 4相比,缺少了最多能讓FPS效能提升4倍的多重畫格生成功能,但卻能以同時開啟FSR與AFMF等2種畫格生成的方式達到接近的成效,有興趣的讀者可以參考筆者先前所寫的《AMD AFMF 2畫格生成效能禁藥再升級,疊加FSR 3猛上加猛效能實測!》一文,看看疊加2種效能禁藥的效果如何。

加入T客邦Facebook粉絲團

AMD Radeon RX 9070 XT系列顯示卡效能實測:最佳魔物獵人顯卡

AMD推出Radeon RX 9070 XT與Radeon RX 9070等2張RDNA 4架構顯示卡,不但大幅提高光柵化效能,也擺脫光線追蹤貧弱的印象,讓我們一起看看它的表現。C57c14651043de166aff3255b880d7a7

AMD推出Radeon RX 9070 XT與Radeon RX 9070等2張RDNA 4架構顯示卡,不但大幅提高光柵化效能,也擺脫光線追蹤貧弱的印象,讓我們一起看看它的表現。

回到系列文章目錄:AMD發表RDNA 4繪圖架構與Radeon RX 9070系列顯示卡,支援全新ML加持FSR 4升頻功能

首波RDNA 4顯示卡登場

AMD在2025年1月初的CES消費性電子展發表了採用RDNA 4架構的Radeon RX 9070系列顯示卡,並於2月28日舉辦顯示卡的上市發表會,產品將於3月6日正式發售。

RDNA 4架構的特色包括針對高階遊戲應用最佳化,不但強化了光柵化繪圖(Rasterization,即傳統繪圖)與光線追蹤繪圖的效能,也透過高效能機器學習(Machine Learning,屬於AI應用的範圍),與先前的RDNA 2架構相比,光柵化繪圖、光線追蹤繪圖、AI運算的效能表現大約可提升至2、2.5、4倍。

不過由於AMD這次並未推出Radeon RX 9070 XT以及Radeon RX 9070等2款型號的公板卡,因此我們使用合作夥伴的自製卡進行效能實測。

(若手機版瀏覽器無法顯示表格,請點我看完整表格

Radeon RX 9000系列顯示卡規格簡表
顯示卡型號 運算單元數量 遊戲時脈 Boost時脈 Infinity Cache容量 顯示記憶體容量 記憶體介面 典型顯示卡功耗 發表當時價格
Radeon RX 9070 XT 64 2.4 GHz 3.0 GHz 64 MB 16 GB GDDR6-256bit 304 W $599
Radeon RX 9070 56 2.1 GHz 2.5 GHz 64 MB 16 GB GDDR6-256bit 220 W $549

 

筆者收到的測試樣品為Sapphire Pure Radeon RX9070系列顯示卡,2者的外型完全相同。

Sapphire Pure Radeon RX9070系列顯示卡採用3風扇散熱方案。

顯示卡背面採用穿透式設計,並搭載鋁質金屬背板,可以避免顯示卡彎曲以及卡塵堆積。

比較特別的是在背面開口處有ARGB燈效訊號「Out」端子,但根據官方網站説明,將端子連接到主機板後可以讓主機板控制顯示卡燈光。

Sapphire Pure Radeon RX9070系列顯示卡採用雙槽設計,厚度為6.16公分,長度則為32公分。

電源輸入部分採用2組8-Pin PCIe電源端子。

影音輸出為HDMI 2.1b與DisplayPort 2.1a各2組。

測試環境與條件

本次測試過程除了手動開啟EXPO功能,讓記憶體自動超頻至DDR5-6000之外,其餘BIOS / UEFI的設定皆維持預設值,Resizable BAR為開啟狀態。至於對照組部分,則使用先前測試專題之成績,部分新加入項目則會於圖說中說明。

所有成績除了都是進行2輪測試,在確定沒有極端值後取平均,遊戲效能使用遊戲內建的測試模式,而《絕對武力2》使用CS2 FPS Benchmark工作坊地圖進行測試。

遊戲部分在1080p、2K、4K解析度搭配最高畫質設定,若有設定範本則套用最高範本,若無則將所有畫質相關項目調至最高,關閉VRS或動態解析度等設定,並僅進行開、關光線追蹤功能的調整。

測試平台:
處理器:AMD Ryzen 7 9800X3D
散熱器:MSI MEG Coreliquid S360
主機板:GIGABYTE X870E AORUS MASTER(UEFI版號N5 – AMD AGESA ComboAm5PI 1.2.0.2a)
記憶體:G.Skill Trident Z5 Neo RGB 16GBx2(@DDR5-6000)
顯示卡:Sapphire Pure Radeon RX9070 XT、Sapphire Pure Radeon RX9070
儲存裝置:Solidigm P44 Pro 1TB(系統碟)、Solidigm P41 Plus 1TB(遊戲碟)
電源供應器:MSI MEG Ai1300P PCIE5
軟體環境:Windows 11專業版23H2(Build 26100.3194),AMD Software Adrenalin Edition 24.30.31.03

測試平台之CPU-Z資訊。

Radeon RX9070系列顯示卡之GPU-Z資訊。

《魔物獵人:荒野》4K搭升頻剛剛好

筆者在這邊同樣使用《魔物獵人:荒野》的效能測試工具《Monster Hunter Wilds Benchmark》測試效能,並以正式版遊戲實際感受遊玩體驗。

在效能測試工具方面,Radeon RX9070 XT與Radeon RX9070在2K解析度、最高畫質並開啟光線追蹤(使用高解析度材質包DLC)時平均FPS分別有84.21與91.28幀的表現,高於60幀門檻,將解析度提升至4K之後則落至49.68與55.02幀,略低於門檻,可以搭配FreeSync顯示器降低視覺不流暢的感覺,算是可接受的範圍。而開啟FSR升頻(平衡模式)後,2者皆可衝到130幀左右,表現相當出色。

在實際進行遊戲部分,同樣使用上述4K最高畫質、光線追蹤、FSR升頻,並利用NVIDIA FrameView測量狩獵過程的FPS表現,Radeon RX9070 XT平均與99百分位(1% Low)FPS分別為103.552、65.117幀,Radeon RX9070則為91.977、65.329幀,在肉眼觀查之下,遊戲的畫面與操作皆相當流暢,沒有卡頓或延遲等問題,判定2者皆能滿足《魔物獵人:荒野》的遊戲需求。

▲Radeon RX9070 XT執行《Monster Hunter Wilds Benchmark》效能測試工具展示,影片使用Radron Software進行螢幕錄影,將會稍微影響效能,因此實際效能表現請以下方圖表為準。

▲Radeon RX9070 XT執行《魔物獵人:荒野》正式版遊戲,感覺相當流暢。

▲Radeon RX9070執行《Monster Hunter Wilds Benchmark》效能測試工具。

▲Radeon RX9070執行《魔物獵人:荒野》正式版遊戲,過程FPS大多能保持在100幀以上。

在《魔物獵人:荒野》關閉光線追蹤的情況下,Radeon RX9070 XT在4K解析度的平均FPS突破60幀。

《魔物獵人:荒野》開啟光線追蹤後,Radeon RX9070在4K解析度的表現微幅落後GeForce RTX 5070 Ti約2.85%,但2者價格可是差了美金200元!

《魔物獵人:荒野》開啟光線追蹤搭配升頻,Radeon RX9070系列2款顯示卡之平均FPS都具有超過130幀的表現。

(下頁還有更多效能測試)

 

測試軟體分析

在效能測試前半段,我們先來看RX 9070 XT與RX 9070在3DMark與Procyon等測試軟體的表現如何。

3DMark Fire Strike採用Direct X 11繪圖API搭配1080p解析度(1920 x 1080),RX 9070 XT的圖像分數領先RX 9070約8.27%,而RX 9070領先同價格的RTX 5070約10.49%。

Fire Strike Extreme將解析度提升至2K(2560 x 1440),RX 9070 XT與RX 9070的差距約為9.69%。

Fire Strike Ultra進一步將解析度提升至4K(3840 x 2160),RX 9070 XT與的RTX 5070的差距微幅擴大至9.92%。

3DMark Time Spy採用Direct X 12搭配2K解析度,RX 9070 XT與的RTX 5070的差距拉開至12.55%。

Time Spy Extreme將解析度提升至4K,上述2組對照差距變動為10.4%、22.64%。

Speed Way是採用DirectX 12 Ultimate繪API與DirectX Raytracing tier 1.1光線追蹤技術,具有全域照明與反射等效果,並透過Mesh Shaders進行效能最佳化,可以反映最新AAA大作遊戲的效能表現。RX 9070 XT領先RX 9070約7.61%而AMD陣營的光線追蹤較弱的狀況也在此浮現,RX 9070與RTX 5070僅開出領先0.06%的平盤。

Steel Nomad採用DirectX 12繪圖API搭配14K解析度,雖然不使用光線追蹤技術,但具有目前最高的繪圖運算負載。上述2個組合差距為14.91%、26.51%,RX 9070再次與RTX 5070拉開差距。

3DMark Port Royal採用DirectX Raytracing(DXR)光線追蹤繪圖技術搭配2K解析度,是考驗顯示卡光線追蹤效能的競技場。2個組合的差距約為13.13%、14.76%,RX 9070的表現不錯。

在UL Procyon測試軟體的AI Computer Vision電腦視覺項目中,RX 9070 XT領先RX 9070約5.32%,而2者可以把前代RX 7800 XT甩開。

在Procyon的AI Image Generation圖像生成部分,RX 9070 XT在SD 1.5與SDXL等模型分別領先RX 9070約12.77%、10.64%。

在圖像生成時間部分,RX 9070 XT與RX 9070大約只需前代RX 7800 XT的一半。

Procyon AI Text Generation文字生成部分,RX 9070 XT領先RX 9070的幅度約在4.85%~9.1%之間,然後RX 9070落後同價格的RTX 5070約24.52%~43.57%。

各種模型FTFF(產生第1組字詞)速度表現,NVIDIA陣營的表現明顯較佳。

每秒產生的字詞部分,RX 9070 XT的速度微幅領先RX 9070。

遊戲效能測試

接下來我們繼續分析RX 9070 XT與RX 9070在實際遊戲的效能表現。

在競技類的《絕對武力2》中,RX 9070 XT與RX 9070在1080p與2K解析度的平均FPS與99% FPS(1% Low)皆超過144幀,至於4K解析度平均FPS近120幀,99% FPS皆高於60幀,能夠滿足多數玩家的競技需求。

《看門狗:自由軍團》關閉光線追蹤時,RX 9070在3種解析度大幅領先競爭對手RTX 5070約26.44%、27.35%、27.41%。

《看門狗:自由軍團》開啟光線追蹤後,RX 9070仍以13.89%、13.49%、11.43%的幅度超越RTX 5070。

《戰慄深隧:流亡》關閉光線追蹤時,RX 9070領先RTX 5070約6.57%、8.64%、10.61%。

《戰慄深隧:流亡》開啟光線追蹤後,RX 9070在1080p解析度與RTX 5070開出平盤,2K與4K解析度領先約6.95%、5.15%。

《極地戰嚎6》由於繪圖負擔較低,對處理器的效能較為敏感,RX 9070領先RTX 5070約11.66%、17.93%、26.11%。

《極地戰嚎6》開啟光線追蹤後,差距變為9.83%、17.61%、24.38%。RX 9070的表現甚至追過RTX 5070 Ti。

《刺客任務III》Dubai(杜拜)測試項目包含多種場景與NPC角色,整體負擔較低,RX 9070與RTX 5070差距為21.8%、20.28%、21.57%。

Dubai開啟光線追蹤後,差距約為8.13%、7.74%、6.50%。RX 9070 XT的表現與RTX 5070 Ti接近。

《刺客任務III》Dartmoor(達特穆爾)測試項目則包含許多槍枝射擊與爆炸效果,充滿物理與粒子模擬,對處理器的要求比較高,可以看到1080p解析度皆碰到CPU效能瓶頸限制。RX 9070在3種解析度領先RTX 5070約1.13%、4.30%、12.26%。

Dartmoor開啟光線追蹤後,1080p解析度仍卡在CPU效能瓶頸,各解析度差距約為5.89%、8.12%、8.6%。RX 9070 XT也緊咬RTX 5070 Ti。

《電馭叛客2077》關閉光線追蹤時,RX 9070能夠領先RTX 5070約8.46%、10.84%、15.49%。

《電馭叛客2077》開啟光線追蹤後,RX 9070受益於容量較大的顯示記憶體,仍能以1.7%、1.18%、0.41%的差距微幅領先RTX 5070,表現實著不錯。

《黑神話:悟空》身為新一代效能殺手,RX 9070與RX 9070 XT在1080p解析度都能將平均FPS扛過60幀門檻,4K解析度則分別介於30幀最低標準的2側。

《黑神話:悟空》開啟光線追蹤後,AMD陣營的表現慘不忍睹。

魔物獵人專用卡就是你了!

先從官方定價來看Radeon RX9070與GeForce RTX 5070皆為美金549元,自然是直接捉對廝殺,而Radeon RX9070 XT與GeForce RTX 5070 Ti分別為美金599、749元,雖有明顯價差但我們還是將它們放在同組進行比較。

在近期最熱門的《魔物獵人:荒野》中,無論在何種測試條件下,2張Radeon RX9070系列顯示卡的表現皆優於競爭對手,Radeon RX9070甚至可以在不開升頻的原生畫質下,越級追上GeForce RTX 5070 Ti。雖然目前遊戲只原生支援DLSS 3,在未來更新支援DLSS 4(或透過DLSS覆寫功能強制開啟)後可以再次提升FPS效能,但Radeon RX9070系列提供的130幀平均FPS已經能夠帶來足夠流暢的視覺體驗。

而在《電馭叛客2077》部分,Radeon RX9070的光線追蹤效能也與同價位的GeForce RTX 5070並駕齊驅,一甩AMD陣營在光線追蹤表現不佳的陰影,在筆者測試的眾多遊戲中,只有《黑神話:悟空》的表現較為落後,其餘皆為領先。

Radeon RX9070 XT與Radeon RX9070最大的「問題」,大概就是2者的價格非常接近,筆者建議若預算充足可以直接選擇多付美金50元衝上Radeon RX9070 XT,享受更高的遊戲效能。

(點我回到系列文章目錄)

加入T客邦Facebook粉絲團

AMD RDNA 4繪圖架構說明:2倍光柵繪圖、2.5倍光追、4倍AI的效能躍進之旅

AMD推出的RDNA 4繪圖架構在光柵化、光線追蹤繪圖以及AI運算的效能表現較前代產品都有長足進展,讓我們一起瞭解其中的改進之處。E8a1a7846b29d2bf4df3016522696432

AMD推出的RDNA 4繪圖架構在光柵化、光線追蹤繪圖以及AI運算的效能表現較前代產品都有長足進展,讓我們一起瞭解其中的改進之處。

回到系列文章目錄:AMD發表RDNA 4繪圖架構與Radeon RX 9070系列顯示卡,支援全新ML加持FSR 4升頻功能

較RDNA 2提升2~4倍

RDNA 4繪圖架構在基礎的運算單元(Compute Unit,以下簡稱CU)、光線追蹤加速器、AI加速器等元件都有所改善,能夠帶來顯著的效能提升,筆者將AMD所舉行的說明會內容與簡報整理如下,我們先看到RDNA 4架構的特色說明。

RNDA4的特色包括針對高階遊戲應用最佳化、強化光柵化繪圖(Rasterization,即傳統繪圖)與運算效率、改善光線追蹤效能、支援高效能機器學習(Machine Learning,以下簡稱ML)、強化記憶體頻寬,改進多媒體功能。RNDA4架構的光柵化繪圖光線追蹤繪圖、AI運算的效能表現大約可提升至RDNA 2的2、2.5、4倍。

RDNA 4架構提供許多4K遊戲應用需要的改進,包括第3代光線追蹤單元、矩陣加速器(能提高AI與ML運算效能)、最佳化快取記憶體系統(2MB整合CU快取、8MB L2快取、64MB Infinity Cache)、使用高速GDDR6顯示記憶體、強化的指令處理器、2組媒體引擎、支援DisplayPort 2.1a與HDMI 2.1b的顯示引擎,並使用先進的TSMC(台積電)4nm節點製程。

RDNA 4的媒體引擎能夠提升25% H.264格式在低流量或是11% HEVC(H.265)格式的畫質表現,並改善AV1格式的B Frame(雙向預測畫格)效率,並對FFMAPEG、OBS、Handbreak、VLC等轉檔、直播、播放軟體最佳化。

RDNA 4的媒體引擎強化FreeSync電力最佳化,並支援硬體翻轉佇列(Flip Queue,可節省影片播放時的處理器耗電)、Radeon Image Sharpening 2影像銳利化等功能。

細看各種單元改進

在瞭解RDNA 4架構的特色之後,我們接著看看各種運算單元是如何改進並提升整體效能表現。

其中比較值得注意的部分是全新的定向包圍盒(Oriented Bounding Box),它透過旋轉包圍盒方向的方式,達成以較小包圍盒覆蓋物件,能夠降低整體運算的負載,達到提升光線追縱效能的效果。

在RNDA 4的運算引擎部分,純量運算單元新增支援FP32資料類型,並整合2組SIMD32向量單元、強化光線追蹤與矩形運算效能、改進排程器與指令預取能力。

光線追蹤加速器部分,RNDA 4的單元支援每包圍合8組光線或每三角型2組光線偵測,具獨立硬體光線追蹤個體轉換(Instance Transform)並改善BVH(Bounding Volume Hierarchy)資料結構、支援BVH8光線遍歷(Ray Traversal),以提高運算效能並降低記憶體佔用量。

新增支援定向包圍盒機制能夠旋轉偵測光線是否與物件接處的「包圍盒」,讓原本需要使用尺寸相對大了許多的包圍盒(右上圖),改為使用尺寸較小但可旋轉的包圍盒來覆蓋需要偵測的物件,達到大約提升10%光線遍歷效能的成果。

RDNA 4架構進一步改善亂序記憶體存取的能力,並支援來自不同渲染器(Shaber)的存取需求,進一步降低記憶體子系統統的延持,對光線追蹤繪圖的效能表現有關鍵性的幫助。

將上述多樣改進疊加起來之漏,RDNA 4每組CU的光線追蹤效能能夠提升至RDNA 3的2倍。

過去RDNA 3暫存器的設計概念為設想最差的定址狀況,可能會造成暫存器空間的浪費(右側上圖)。而RDNA 4則可動態排列資料(右側下圖,注意頂部的動態排列區塊),有助於提高暫存器使用率,發揮降低記憶體延遲並大幅提升渲染器效率等功用。

AMD也在簡報中說明,光線追蹤的方式為計算視線(Visibility)之反射、漫射路境並反推光線照射所走過的路徑。而路徑追蹤(Path Tracing,也稱為全光線追蹤)的運作原理則是直接計算大量光線照射路徑,可以提供逼真的光照效果,但運算負載相當吃重。

AMD將與Microsoft合作開發用於路徑追蹤的神經超取樣以及降噪規範,推動這項技術發展。

筆者將持續在下篇文章中說明RDNA 4架構的AI運算細節以及FSR 4升頻等功能,也會待時機成熟帶來Radeon RX 9070 XT與Radeon RX 9070顯示卡的效能實測專題,請讀者持續保持持續關注我們的報導。

點我回到系列文章目錄

加入T客邦Facebook粉絲團

AMD發表RDNA 4繪圖架構與Radeon RX 9070系列顯示卡,光線追蹤與AI運算效能翻倍成長

AMD於中國珠海舉行的Radeon RX 9000系列發表會中介紹RDNA 4繪圖架構,並同步發表Radeon RX 9070 XT與Radeon RX 9070等2款顯示卡,預計於3月6日正式上市。58f3c9b01b89b5ee5ad335ac64e26785

AMD於中國珠海舉行的Radeon RX 9000系列發表會中介紹RDNA 4繪圖架構,並同步發表Radeon RX 9070 XT與Radeon RX 9070等2款顯示卡,預計於3月6日正式上市。

 

系列文章目錄:
AMD發表RDNA 4繪圖架構與Radeon RX 9070系列顯示卡,支援全新ML加持FSR 4升頻功能(本文)
RDNA 4繪圖架構詳細說明(工作中)
Radeon RX 9070系列顯示卡效能實測(工作中)

RNDA 4架構助攻美金600元價位帶

AMD表示內部分析資料指出,有85%的遊戲玩家選購美金700元(約合新台幣22,970元)以下的顯示卡,且有越來越多玩家使用解析度為2K(2560 x 1440)或4K(3840 x 2160)的顯示器,另一方面越來越多遊戲導入光線追蹤繪圖技術,甚至成為主流作品的「標準配備」。

而AMD也在說明會中提到,自家產品規劃相當著重DIY組裝玩家的升級便利性,只需單獨升級顯示卡並沿用現有零組件,就能達到改善遊戲體驗的效益,這個概念可以反映在延續使用PCIe 8Pin電源端子。

RNDA 4具有更高的運算單元(CU)執行效率,並進一步將運作時脈提升至接近3GHz,並改善記憶體子系統與純量單元、新增動態暫存定址功能,讓CU數量較少的Radeon RX 9070系列顯示卡能夠帶來與前代RDNA 3架構Radeon RX 7900系列顯示卡匹敵的效能表現。

另一方面,RNDA 4架構導入第3代光線追蹤加速器(Raytracing Accelerator),具,在運算單元中加入第2組光線交會引擎(Ray Intersection Engine),帶來2倍光線遍歷(Ray Traversal)偵測能力,提高BVH(Bounding Volume Hierarchy,偵測光線是否接觸到3D繪圖中的多邊型)樹狀結構效能,並針對光線追蹤運算最佳化以降低虛耗。

RDNA 4改善BVH資料結構,導入創新的定向包圍盒(Oriented Bounding Box)機制,透過可旋轉方向的光線追蹤偵測方塊降低BVH資料的容量與複雜度,也能發揮節省顯示記憶體使用量的效果。

在AI運算部分,RDNA 4架構採用第2代AI加速器(AI Accelerator),每個CU的運算效能於RDNA 3相比提升1倍,並新增支援FP8與BF8等資料格式(包含E4M3、E5M2),以及新增支援稀疏性(Sparsity,可提升1倍峰值效能),大幅強化AI運算的效能。

AMD資深副總裁暨大中華區總裁潘曉明為發表會揭開序幕。

AMD資深副總裁暨計算級圖型業務集團總經理Jack Huynh在發表會展示RNDA 4架構繪圖處理器。

AMD資深副總裁暨GPU技術與工程研發王啟尚在發表會說明RNDA 4的架構改進與特色。

AMD資深總監暨Ryzen處理器及Radeon顯示卡王嵐志公佈Radeon RX 9070於中國的售價為人民幣4,499元(約合新台幣20,545元,含稅)。美金定價則為549元(約合新台幣18,165元,未稅)。

Radeon RX 9070 XT的售價為人民幣4,999元(約合新台幣2,2830元,含稅)。美金定價則為599元(約合新台幣19,820元,未稅)。

AMD與合作夥伴共同展示多款顯示卡產品。

Asus展示之Radeon RX 9070系列顯示卡。

ASRock展示之Radeon RX 9070系列顯示卡。

GIGABYTE展示之Radeon RX 9070系列顯示卡。

PowerColor展示之Radeon RX 9070系列顯示卡。

AMD分析玩家85%的遊戲玩家選購美金700元以下的顯示卡,2K、4K解析度漸成主流,採用PCIe 8Pin電源端子也顧及升級便利性,言下之意這也是Radeon RX 9000系列顯示卡的設計目標。

RDNA 4架構將帶來更狂熱的遊戲體驗,提供更高的光線追蹤、機器學習效能,並強化價格效益。

RDNA 4架構改善記憶體子系統與純量單元、新增動態暫存定址功能,並強化CU執行效率與運作時脈。

RNDA 4架構透過改善光線追蹤功能與2組光線交會引擎,讓單一CU的光線追蹤效能可達前代RDNA 3的2倍。

RDNA 4架構也大幅提供單一CU的AI運算效能,INT 8稀疏性之峰值效能可達RDNA 3的8倍,此外也新增支援FP8、BF8等資料格式。

RDNA 4架構的媒體引擎也提高20%影片編碼品質,並支援PCIe Gen 5、HDMI 2.1b、DisplayPort 2.1a等規格。

2K價位挑戰4K效能

在RDNA 4架構的產品規劃方面,AMD首波將推出Radeon RX 9070 XT與Radeon RX 9070等2款顯示卡,但是都只有AIC合作夥伴推出的自製卡,而沒有公板卡。

這2款顯示卡瞄準的價位帶自然是美金700元的區間,能夠滿足2K至4K解析度之間的遊戲效能需求。若考量到玩家「隔代升級」的採購行為,Radeon RX 9070 XT適合由Radeon RX 6900 XT以及競爭對手NVIDIA GeForce RTX 3090的使用者升級,而Radeon RX 9070則適合取代Radeon RX 6800 XT與GeForce RTX 3080。

值得注意的是,根據AMD提供的數據,這2款顯示卡在30款遊戲的4K解析度平均FPS能夠領先Radeon RX 7900 GRE分別達21%與42%,表現相當讓人期待。

AMD首波將推出Radeon RX 9070 XT與Radeon RX 9070等2款RDNA 4架構顯示卡。

這2款顯示卡的定位介於2K與4K解析度遊戲應用之間。

Radeon RX 9070 XT與Radeon RX 9070分別具有64、56組CU,前者的Boost時脈可達2.97 GHz,2者皆搭載通道寬度為256 Bit的16GB GDDR6顯示記憶體與64MB Infinity Cache快取記憶體。

根據AMD提供的數據,Radeon RX 9070與Radeon RX 6800 XT以及競爭對手NVIDIA的GeForce RTX 3080相比,在30款遊戲的4K解析度、最高畫質效能分別領先38%、26%。

Radeon RX 9070與Radeon RX 7900 GRE相比,在30款遊戲的4K解析度、最高畫質效能領先21%。(無開啟FSR等升頻功能)

2K解析度部分效能則領先20%。

Radeon RX 9070 XT與Radeon RX 6900 XT以及NVIDIA GeForce RTX 3090相比,在30款遊戲的4K解析度、最高畫質效能分別領先51%、26%。

Radeon RX 9070 XT與Radeon RX 7900 GRE相比,4K解析度下效能領先42%。

2K解析度部分則領先38%。

FSR效能禁藥再進化

AMD也將持續改進FSR與AFMF(FidelityFX Super Resolution、AMD Fluid Motion Frames)等升頻功能,並將上述功能以及Radeon Anti-Lag、Radeon Boost等功能整合為HYPR-RX單一設定窗口,玩家只需開啟HYPR-RX就可以提高FSP效能並降低遊戲延遲,發揮一鍵改善遊戲體驗的效果。

AMD也會推出先前預告的FSR 4升頻技術,透過機器學習(Machine Learning,屬於AI的應用範圍)的方式強化升頻後的圖像品質,並將遊戲的FSP效能推升至3.4倍。AMD也將推出更多AI功能,帶來更流暢且便利的遊戲體驗。


HYPR-RX能夠一鍵改善遊戲效能體驗,帶來高達2.9倍的效能輸出。

FSR 4則會在先前技術的基礎上,進一步透過機器學習強化升頻後的圖像品質。

FSR 4能夠帶來3.4倍的效能倍率。

FSR 4同時也能強化圖像細節,請注意建築物的尖塔部分。

FSR 4推出時將會有超過30款遊戲實裝,到2025年底預計成長超過75款。

根據AMD提供的數據,FSR 4能夠在不同遊戲輸出2.1~3.4倍不等的效能倍率。

AMD也積極在AMD Software驅動程式導入AI功能,包括AI最佳化的內部測試流程、AI當機報告等改善機制,以及透過內建的AI聊天機器人使用驅動程式的各功能。

此外AMD也帶來AI錄影濾鏡、AI麥克風降噪,並為搭載Radeon顯示卡的電腦帶來更多AI PC功能。

RDNA 4架構強化媒體引擎功能,最高支援8K80p的H.264、HEVC(H.265)、AV1格式編解碼。在使用資料流量為6Mbps之H.264編碼錄製影片時,RDNA 4(右)的畫質明顯好很多,RDNA 3(左)則充滿方格狀Macroblock雜訊。

AMD Software也整合離線AI聊天機器人功能,除了可以回答軟、硬體問題與開關多項關鍵功能,還能進行AI圖像生成,目前支援英文與簡體中文。

AMD也在活動會場產品FSR 4之效果。首先看到FSR 3的升頻畫質,圖中的紅地毯有明顯的摩爾紋雜訊,在動態畫面中看了瑕疵會更加明顯。

FSR 4則無此問題,畫質表現更加出色。

另外在會場的One More Thing……,豈不是傳說中的那款處理器快要來了。

筆者也會在後續持續帶來更多RDNA 4架構與Radeon RX 9070系列顯示卡的報導,當然也無會錯過One More Thing,敬請讀者保持關注。

加入T客邦Facebook粉絲團

Arm發表全新Cortex-A32邊緣AI平台,解放記憶體限制支援大語言模型

Arm於邊緣AI平台發表會介紹全新Cortex-A32處理器與搭配的邊緣AI平台,為以電池驅動的IoT裝置帶來更多元且具彈性的AI運算IP搭配組合。Dfdd75352268673b7f910cfee313aa1e

Arm於邊緣AI平台發表會介紹全新Cortex-A32處理器與搭配的邊緣AI平台,為以電池驅動的IoT裝置帶來更多元且具彈性的AI運算IP搭配組合。

首款為IoT設計的Armv9架構處理器

Arm邊緣AI平台發表會由Arm應用工程總監徐達勇開場,Arm物聯網事業部亞太區資深經理黃晏祥主講,Arm主任應用工程師並與林宜均共同進行會後問答訪談。

延伸閱讀:
Arm推出Ethos-U85 NPU與Corstone-320參考設計平台,強化物聯網裝置AI效能
Computex 2024:Arm CEO Keynote重點整理,推動更全面的軟體、硬體生態系統
Arm Tech Day 2024解析終端產品運算子系統(3):完整軟體開發工具靠處理器就能加速AI

Arm於2024年發表Ethos-U85 NPU(神經運算單元),能與Cortex-M系列微控制器協同運作,強化小型或以電池驅動的IoT(物聯網)裝置之AI運算能力,這次推出的Armv9架構邊緣AI運算平台以全新的Cortex-A320處理器搭配Ethos-U85為核心,針對IoT應用進行最佳化,並可支援超過10億個(1B)參數的AI模型,能夠透過Armv9架構提高IoT應用的效能、電力效率和安全性,推動工業自動化、智慧相機等領域的發展。

另一方面,Arm也將Kleidi AI函數庫延伸至IoT領域,除了有助於無縫整合AI運算框架以簡化開發流程,也能達到最高70%的運算效率增益。

Arm邊緣AI平台發表會由黃晏祥、徐達勇、林宜均(左起)共同主持。

Arm分享透過PlumerAI公司透過Helium技術與Ethos NPU打造智慧門鈴的範例,能夠提供人物辨識、移動檢測、相關事件識別等功能○未來結合大型語言模型還能產生即時事件通知,讓功能更加豐富。

全新邊緣AI平台除了提升AI運算效能之外,還能享有Armv9架構帶來的高度安全性,降低連接至網路的IoT裝置之資安風險。

由Cortex-A320處理器搭配Ethos-U85 NPU為核心的邊緣AI平台能夠支援超過10億個(1B)參數的AI模型。

效能提升兼顧省電

Cortex-A320的特色就是具有出色的電力效率,能應用於供電、尺寸限制較高的應用情境,滿足極省電、電池驅動、小尺寸等應用需求。

另一方面,Cortex-A320也適合作為取代Cortex-M85微控制器的升級選項,除了能享有Armv9架構帶來的效能、安全性等優勢之外,最大的好處在於能夠搭配容量更大的外部DRAM記憶體,而非受限於Cortex-M85內建容量較小的SRAM記憶體,滿足動輒需要數GB記憶體的大型語言模型(Large Language Model,LLM)之執行需求,賦予IoT裝置更多元豐富的應用潛力。

將運算單元由Cortex-M85轉換為Cortex-A320的一大優勢是能夠搭配DRAM作為系統記憶體,大幅提高支援的AI模型參數規模。

Cortex-A320最高能將機器學習(Machine Learning,ML)效能提高至Cortex-A35的10倍,並帶來30%純量運算的效能。與Cortex-A520相比的電力效率則高出50%。

有Armv9架構具有多項資安功能,也透過矩陣乘法新指令、SVE2(可擴展向量延伸指令集)並支援BFloat16資料類型提升AI運算的效能。

Arm透過新加入的Cortex-A320,補齊Armv9架構陣容中超高電力效率的產品。

在透過Llama.ccp執行Tiny Stories語言模型的使用情境中, 搭配Kleidi AI函數庫能為Cortex-A320帶來70%效能增益。

Cortex-A320不但支援Linux、Android以及多種一般作業系統(Rich OS)之外,也支援FreeRTOS、Zephyr等即時作業系統(RTOS)。

Cortex-A320的省電特性讓它也能作為Cortex-M85的升級選項,帶來更高的安全性、機器學習效能與記憶體擴充性。

Arm提供多種不同處理器產品組合,能夠滿足上至資料中心、下至穿戴式裝置的運算需求,並為包含環境保育與監測、醫療應用在內的多種應用情境提供充沛的AI運算效能。

Arm預測未來的AI發展趨勢中,邊緣運算的角色將會日益重要,全新Arm邊緣AI運算平台能夠實現在IoT裝置執行經過調校的大型語言模型以及參數數量相對較低的小型語言模型,拓展全新的使用方式,並讓智慧決策將更接近資料獲取的源頭位置,最大幅度降低延遲並有效提升隱私保護。

加入T客邦Facebook粉絲團

Intel推出新款Xeon 6處理器,強化AI運算效能與效益還能跑DeepSeek

Intel於MWC 25(世界行動通訊大會)前夕發表新款Xeon 6處理器,推出多款有搭載效能核心(P-core)以及針對行動通訊內建vRAN Boost的型號。C91865a6277f8ae6d31980fdf3996e50

Intel於MWC 25(世界行動通訊大會)前夕發表新款Xeon 6處理器,推出多款有搭載效能核心(P-core)以及針對行動通訊內建vRAN Boost的型號。

領先對手支援8路處理器

繼先前推出的搭載P-core的Xeon 6 6900P以及搭載E-core的Xeon 6700E處理器之後,這次Intel接著發表Xeon 6700P / 6500P系列等搭載P-core的處理器,提供出色的效能與電力效率之平衡,以滿足現代資料中心的使用需求。

延伸閱讀:Intel說明Xeon 6處理器與Gaudi 3加速器優勢,雙路處理器給你滿滿192條PCIe Gen 5通道

Intel業務暨行銷事業群商用業務總監鄭智成在線上說明會中講解新款Xeon 6處理器之特色,筆者以圖文方式將重點整理如下。

Intel推出多種不同配置的Xeon 6處理器,包含具有最高效能的P-core版本、電力效率較佳的E-core版本,還有針對電信應用設計的SoC版本。

這次推出的Xeon 6700P / 6500P系列處理器搭載P-core核心,並支援AMX加速器(Advanced Matrix Extensions,先進矩陣延伸指令集)加速以強化AI運算效能。

Xeon 6700P / 6500P系列處理器最大的特色包含支援4路、8路處理器(4 / 8 Sockets)。另一方面Xeon 6每個處理器可提供88條PCIe Gen 5通道(單路配置時可以使用136條通道)。

先前推出的Xeon 6900P屬於UCC產品線,由3組運算模塊與2組I/O模塊構成,這次推出的Xeon 6700P / 6500P則屬於XCC產品線,具有運算模塊與I/O模塊各2組。

Xeon 6700P最多支援8路處理器,並支援最佳化的拓樸相連。

Xeon 6處理器支援傳輸速度達8800 MT/s的MRDIMM(Multiplexed Rank DIMM),有助於提升資料吞吐量並強化AI運算效能。

Xeon 6處理器也支援CXL 2.0與Type 1、Type 2、Type 3等不同應用型態,有助於降低記憶體池的建置成本。

Xeon 6單路配置時可以使用136 PCIe Gen 5條通道,提供豐富的擴充能力。

若從第代Xeon升級至Xeon 6系列處理器,在高效能運算、資料中心、圖像分類、網頁伺服器等應用可以提供最高10:1的整合比例(Consolidation),並節省最高67%的總體擁有成本(TCO)。

受益於AMX加速器的協助,Xeon 6900P在多項AI運算的效能領先競爭對手AMD的EPYC 9005。

Xeon 6系列處理器能夠滿足ResNet 50、DLRM、BERT Large等傳統機器學習模型,也能執行包含Llama、Mistral、Phi-3甚至是DeepSeek等200億(20B)組參數以下的大語言模型。

Intel表示Xeon 6系列是最佳AI處理器,同時也能搭配NVIDIA GPU共同組成AI伺服器與超級電腦。

專為電信設計的SoC版

Intel 也為網路與邊緣運算等應用推出SoC(系統單晶片)版Xeon 6處理器,它不但具有高效能、高電力效率等特色,整合多種加速器,提供vRAN(虛擬化無線接取網路)、媒體處理、AI與網路安全等功能,滿足網路和邊緣解決方案對日益高漲的AI運算需求。

Xeon 6 SoC為先前代號Granite Rapids D的處理器產品,其特色為針對網路、電信、邊緣運算設計。

Xeon 6 SoC搭載P-core核心,並整合AMX、vRAN Boost(虛擬化無線接取網路加速)等加速器與200GbE乙太網路、媒體加速器等功能。

內建的AMX加速器有助於提升邊緣AI運算的效能與工作吞吐量。

內建的媒體加速器可以進行AI強化的低延遲多媒體轉檔,適合應用於即時影音服務。

在說明會的最後,Intel也帶來One More Thing,說明下代採用Intel 18A製程、代號為Clearwater Forest處理器樣品已經能夠開機運作。

Intel聯合執行長暨產品執行長Michelle Johnston Holthaus表示:「我們致力於推出領先業界的產品,以解決客戶面臨的巨大挑戰,並協助他們推動業務成長。Xeon 6系列提供業界最佳AI處理器和突破性網路技術,同時提高效率並降低總體擁有成本。」

加入T客邦Facebook粉絲團

ANAVI Handle轉接板把Wii雙截棍變成USB滑鼠與手把

ANAVI Handle是款以RP2040微控制器為基礎的轉接板,能夠把Nintendo Wii的雙截棍控制器轉接為標準滑鼠或遊戲手把,連接至各種具有USB端子的電腦、行動裝置使用。8d9d05557135db75909063a5de157d15

ANAVI Handle是款以RP2040微控制器為基礎的轉接板,能夠把Nintendo Wii的雙截棍控制器轉接為標準滑鼠或遊戲手把,連接至各種具有USB端子的電腦、行動裝置使用。

雙截棍變身雙用電腦控制器

Nintendo於2006年推出Wii遊戲主機,它除了造型如電視遙控器的Wii Remote控制器外,還可接上俗稱雙截棍的英文Nunchuk,進行雙手操作。

延伸閱讀:Raspberry Pi家族新成員,Raspberry Pi Pico只需美金4元!

ANAVI Handle以Seeed Studio推出的XIAO RP2040微控制器為基礎,先接上雙截棍後再透過USB Type-C纜線連接至電腦、智慧型手機、平板電腦、Rapsberry Pi等裝置後,就能將雙截棍當作滑鼠或遊戲手把使用。

ANAVI Handle的韌體以CircuitPython撰寫並以開源形式提供,使用者除了可以自由切換滑鼠或手把模式,還可以自行修改韌體以擴充更多功能。

圖中左側的Nunchuk具有1組類比搖桿與2個按鍵,連接至Wii Remote後整體造型有如雙截棍而得名。

ANAVI Handle能將雙截棍接為USB介面的標準滑鼠或遊戲手把。

ANAVI Handle以Seeed Studio推出的XIAO RP2040微控制器為基礎,2側分別為USB Type-C與雙截棍端子。

安裝完成後可以搭配電腦、智慧型手機、平板電腦、Rapsberry Pi等裝置使用。

雙截棍的類比搖桿讓它適合作為滑鼠使用,方便控制游標移動速度。

ANAVI Handle也能當作遊戲手把使用,具有十字鍵與A、B鍵等功能,適合操作懷舊遊戲。

ANAVI Handle現已開賣,售價為美金19元(約合新台幣630元)。

加入T客邦Facebook粉絲團

NVIDIA於GeForce RTX 50系列顯示卡取消32 bit CUDA相容性,部分Physx物理模擬遊戲受影響

NVIDIA將在CUDA 12.0版取消對32 bit CUDA程式的交叉編譯器,並不會提供GeForce RTX 50系列顯示卡執行32 bit CUDA程式的相容性。91e48c78e5e9f0db84324374dde28f8e

NVIDIA將在CUDA 12.0版取消對32 bit CUDA程式的交叉編譯器,並不會提供GeForce RTX 50系列顯示卡執行32 bit CUDA程式的相容性。

僅影響RTX 50之後產品

NVIDIA先前在支援中心提出說明,在CUDA 12.0與之後的版本將不再支援32 bit CUDA程式的交叉編譯器(Cross-Compilation),此外採用Blackwell架構的GeForce RTX 50系列顯示卡之驅動程式也不支援32 bit CUDA,而先前的GTX 9、GTX 10、GTX 16、GTX 20與RTX 20、RTX 30、RTX 40系列顯示卡則不受影響。

延伸閱讀:NVIDIA 展示 PhysX FleX 流體粒子演算效果,完美模擬煙霧與液體的流體性質

PhysX是Ageia提出的物理模擬引擎,並於2006年推出專用的Ageia PhysX物理加速卡,在公司於2008年被NVIDIA收購後,這項技術被整合至NVIDIA GameWorks SDK,除了可以透過NVIDIA陣營顯示卡以CUDA加速運算,也可在處理器(CPU)。

根據NVIDIA官方網站的介紹,PhysX能在遊戲中提供逼真的物理模擬效果,牆壁會被摧毀,玻璃會碎裂滿地,樹木會因風吹而彎折等,並有超過150款遊戲支援此功能。

然而在GeForce RTX 50系列顯示卡停止支援32 bit CUDA之後,也代表無法透過顯示卡加速PhysX,不過玩家仍可透過處理器使用PhysX功能。根據Pargon在Resetera討論區提供的數據,使用AMD Ryzen 7 9700X3D搭配NVIDIA GeForce RTX 4090執行《靚影特務》時,使用顯示卡加速PhysX之平均、1% Low FPS分別為397、198.3幀,切換至處理器運算後,FPS則下降至184.9、13.1幀,雖然不至於無法遊玩,但對流暢度還是有一定影響。

PhysX能夠在遊戲中提供逼真的物理效果,現在被整合於NVIDIA GameWorks SDK。

舉例來說,2008年推出的《靚影特務》將受到RTX 50系列顯示卡不支援Physx的影響。

根據Pargon提供的影片,GeForce RTX 5080仍可執行《靚影特務》,但效能會受到衝擊。(影片連結)

由於大部分受到影響的遊戲都是比較久以前推出,基本上能夠透過現今處理器「暴力硬算」來滿足Physx所需的運算,因此造成的衝擊相對有限,但若玩家想要回為原汁原味的Physx,則可考慮保存RTX 40系列之前的顯示卡。

加入T客邦Facebook粉絲團

NVIDIA GeForce RTX 5070 Ti效能實測:順跑《魔物獵人:荒野》無壓力,RTX 50系最超值的顯卡

NVIDIA將於2月20日推出第3款RTX 50系列、Blackwell架構顯示卡GeForce RTX 5070 Ti,讓我們來看看它的效能表現。E8d3742c032ff5e46ad6c7779b330a22

NVIDIA將於2月20日推出第3款RTX 50系列、Blackwell架構顯示卡GeForce RTX 5070 Ti,讓我們來看看它的效能表現。

70 Ti率先登板

NVIDIA繼先前於2025年1月30日推出GeForce RTX 5090 / RTX 5080等顯示卡後,接著將在2月20日推出GeForce RTX 5070 Ti,並預計於稍後推出非Ti版的GeForce RTX 5070,成為RTX 50系列首款掛上Ti型號的產品。

延伸閱讀:
CES2025:黃仁勳手持「矽盾」演講,發表Blackwell家族顯示卡、顯示晶片,RTX 5090 71990元月底上市
CES 2025:NVIDIA編輯日(上):RTX 50系列顯示卡與Blackwell架構特色解說
CES 2025 - NVIDIA編輯日(下):RTX 50系列顯示卡獨有DLSS 4多重畫格生成超級效能禁藥與Reflex低延遲技術

GeForce RTX 5070 Ti並不會推出等同於公板卡的Founders Edition,筆者這次收到的測試樣品為MSI GeForce RTX 5070 Ti 16G VENTUS 3X OC,它採用3風扇配置搭配穿透式散熱設計,並搭載金屬材質背板,確保散熱效果與運作穩定性。

(若下方表格無法完整顯示,請點我看圖片版

GeForce RTX 50系列顯示卡規格簡表         
顯示卡型號 CUDA核心數量 基礎時脈 Boost時脈 Tensor核心 光線追蹤核心  記憶體容量 記憶體類別 顯示卡功耗 發售當時定價(美金)
GeForce RTX 5090 21760 2010MHz 2410MHz 3352 AI TOPS(第5代) 318 TFLOPS(第4代) 32GB 512bit GDDR7 575W $1999
GeForce RTX 5080 10752 2300MHz 2620MHz 1801 AI TOPS(第5代) 171 TFLOPS(第4代) 16GB 256bit GDDR7 360W $999
GeForce RTX 5070 Ti 8960 2300MHz 2450MHz 406 AI TOPS(第5代) 133 TFLOPS(第4代) 16GB 256bit GDDR7 300W $749
GeForce RTX 5070 6144 2160MHz 2510MHz 988 AI TOPS(第5代) 94 TFLOPS(第4代) 12GB 192bit GDDR7 250W $549

 MSI GeForce RTX 5070 Ti 16G VENTUS 3X OC搭載3組Torx Fan 5.0風扇,能提供更強大的氣流與散熱效果。

它為雙槽尺寸設計,厚度為49 mm。

顯示卡採用12V-2x6電源端子,TPD為300W。

VENTUS 3X OC採用金屬材質背板,提供更高的強度以避免顯示卡彎曲。

顯示卡採用穿透式散熱設計,後端風扇之氣流可以直接穿透背板。

顯示輸出具有3組DisplayPort 2.1b(UHBR20)與1組HDMI 2.1b。

測試環境與條件

本次測試過程除了手動開啟EXPO功能,讓記憶體自動超頻至DDR5-6000之外,其餘BIOS / UEFI的設定皆維持預設值,Resizable BAR為開啟狀態。至於對照組部分,則使用先前測試專題之成績,部分新加入項目則會於圖說中說明。

所有成績除了都是進行2輪測試,在確定沒有極端值後取平均,遊戲效能使用遊戲內建的測試模式,而《絕對武力2》為手動操作進行與電腦BOT於Dust 2地圖之對戰,搭配NVIDIA FrameView記錄FPS成績。

遊戲部分在1080p、2K、4K解析度搭配最高畫質設定,若有設定範本則套用最高範本,若無則將所有畫質相關項目調至最高,關閉VRS或動態解析度等設定,並僅進行開、關光線追蹤功能的調整。

測試平台:
處理器:AMD Ryzen 7 9800X3D
散熱器:MSI MEG Coreliquid S360
主機板:GIGABYTE X870E AORUS MASTER(UEFI版號N5 – AMD AGESA ComboAm5PI 1.2.0.2a)
記憶體:G.Skill Trident Z5 Neo RGB 16GBx2(@DDR5-6000)
顯示卡:MSI GeForce RTX 5070 Ti 16G VENTUS 3X OC
儲存裝置:Solidigm P44 Pro 1TB(系統碟)、Solidigm P41 Plus 1TB(遊戲碟)
電源供應器:MSI MEG Ai1300P PCIE5
軟體環境:Windows 11專業版23H2(Build 22631.4890),GeForce Game Ready 572.43

測試平台處理器與記憶體之CPU-Z資訊。

測試平台顯示卡之GPU-Z資訊,截稿時最新版本尚未能正確判讀所有資訊。

《魔物獵人:荒野》跑分測試

筆者除了透過《魔物獵人:荒野》的效能測試工具《Monster Hunter Wilds Benchmark》驗證各顯示卡的表現之外,也趁著第2次公開測試的機會實際遊玩,以體驗GeForce RTX 5070 Ti的效能與遊玩感受。

需要注意的是,效能測試工具可以開啟光線追蹤,然而公開測試版本尚不支援。

筆者的測試環境為4K解析度搭配最高畫質設定,關閉光線追蹤,開啟DLSS、畫格生成、Reflex低延遲技術與G-Sync同步的情況,搭配更新頻率為160 Hz的Acer XV272K LV顯示器進行遊戲,在操作過程中並沒有感受到任何操作延遲,畫面顯示也相當滑順流暢且無撕裂,整體體驗讓人滿意,也多次順利狩獵公開測試版最強的魔物「鎖刃龍」。

《魔物獵人:荒野》將於2025年2月28日上市,目前已可下載效能測試工具《Monster Hunter Wilds Benchmark》。

已經結束的第2次公開測試讓玩家可以搶先體驗遊戲內容,但尚不支援光線追蹤功能。

筆者使用GeForce RTX 5070 Ti遊玩的體驗相當理想,畫面流暢顯示,無卡頓也無撕裂,多次順利狩獵公開測試版最強的魔物「鎖刃龍」。

▲《Monster Hunter Wilds Benchmark》效能測試工具展示,影片使用NVIDIA App進行螢幕錄影,將會稍微影響效能,因此實際效能表現請以下方圖表為準。

GeForce RTX 5070 Ti在4K解析度、最高畫質、關閉光線追蹤的設定下執行《魔物獵人:荒野》,平均FPS約為56.9幀。

開啟光線追蹤後平均FPS下降至51.14幀。

不過開啟DLSS升頻(平衡畫質)與畫格生成後,平均FPS可以衝上108.05幀,搭配G-Sync顯示器的視覺體驗相當滑順流暢。

 (下頁還有更多效能測試)

測試軟體分析

在效能測試前半段,照慣例先看看RTX 5070 Ti在3DMark與Procyon等測試軟體的表現如何。

筆者建議將RTX 5070 Ti與RTX 5080進行對照,2者的價格差距約為25.03%,比較時可以將價格落差納入考量。

3DMark Fire Strike採用Direct X 11繪圖API搭配1080p解析度(1920 x 1080),RTX 5070 Ti與RTX 5080的圖像分數落差約為12.63%,考量到2者的價格落差為25.03%,讓RTX 5070 Ti更具價格效益。

Fire Strike Extreme將解析度提升至2K(2560 x 1440),RTX 5070 Ti與RTX 5080的圖像分數落差約為14.86%。

Fire Strike Ultra進一步將解析度提升至4K(3840 x 2160),差距擴大至16.31%,但仍低於價格落差。

3DMark Time Spy採用Direct X 12搭配2K解析度,RTX 5070 Ti與RTX 5080的圖像分數差距分別14.6%。

Time Spy Extreme將解析度提升至4K,差距變動為16.27%。

Speed Way是採用DirectX 12 Ultimate繪API與DirectX Raytracing tier 1.1光線追蹤技術,具有全域照明與反射等效果,並透過Mesh Shaders進行效能最佳化,可以反映最新AAA大作遊戲的效能表現。RTX 5070 Ti與RTX 5080的圖像分數落差約為14.5%。

3DMark Port Royal採用DirectX Raytracing(DXR)光線追蹤繪圖技術搭配2K解析度,是考驗顯示卡光線追蹤效能的競技場。差距約為14.42%。

Steel Nomad採用DirectX 12繪圖API搭配14K解析度,雖然不使用光線追蹤技術,但具有目前最高的繪圖運算負載。RTX 5070 Ti與RTX 5080差距擴大至20.64%。

在DLSS測試部分,RTX 5070 Ti開啟DLSS 4搭配4X多重畫格生成能讓FPS效能上升超過6倍,效果相當顯著。

Procyon AI Image Generation圖像生成部分因為TenosrRT版本問題而無法執行Stable Diffusion 1.5 / XL模型,改以使用Procyon測試版的FLUX.1模型。RTX 5070 Ti在FP8、FP4資料類型的圖像生成費時為RTX 5080的1.45、1.12倍。

Procyon AI Text Generation文字生成部分,RTX 5070 Ti與RTX 5080的分數差距落在6.44%~12.29%之間。

RTX 5070 Ti的FTFF(產生第1組字詞)速度表現比較發散,與RTX 5080互有輸贏。

每秒產生的字詞部分,RTX 5070 Ti的表現也相當發散,在Llama 3.1落後RTX 5080約45.66%,但在Llama 2領先53.95%。

遊戲效能測試

接下來我們繼續分析GeForce RTX 5070 Ti在實際遊戲的效能表現。

在競技類的《絕對武力2》中,RTX 5070 Ti在各解析度的平均FPS皆有不錯的表現,與RTX 5080的落差介於10.79%~18.57%之間。4K解析度下99百分位(1% Low)之FPS效能也有接近144幀的表現。

《看門狗:自由軍團》關閉光線追蹤時,RTX 5070 Ti在3種解析度分別落後RTX 5080約8.06%、10.93%、13.78%。

《看門狗:自由軍團》開啟光線追蹤後,差距則變為12.15%、14.13%、14.81%。

《戰慄深隧:流亡》關閉光線追蹤時,差距為10.58%、13.62%、14.20%。

《戰慄深隧:流亡》開啟光線追蹤後,差距則變為12.69%、14.02%、16.21%。

《極地戰嚎6》由於繪圖負擔較低,對處理器的效能較為敏感,RTX 5070 Ti在3種解析度與RTX 5080的差距約為15.06%、12.06%、12.79%。

《極地戰嚎6》開啟光線追蹤後,差距變為12.77%、12.83%、13.91%。

《刺客任務III》Dubai(杜拜)測試項目包含多種場景與NPC角色,整體負擔較低,2者差距為8.45%、12%、14.05%。

Dubai開啟光線追蹤後,差距約為12.69%、13.5%、13.98%。

《刺客任務III》Dartmoor(達特穆爾)測試項目則包含許多槍枝射擊與爆炸效果,充滿物理與粒子模擬,對處理器的要求比較高,可以看到1080p解析度皆碰到CPU效能瓶頸限制。RTX 5070 Ti在3種解析度與RTX 5080的差距約為5.66%、4.87%、12.84%。

Dartmoor開啟光線追蹤後,1080p解析度仍卡在CPU效能瓶頸,各解析度差距約為2.26%、10.36%、13.13%。

《電馭叛客2077》關閉光線追蹤時,差距約為16.56%、16.13%、19.56%。

《電馭叛客2077》開啟光線追蹤後,落差約為14.33%、15.16%、16.88%。

《電馭叛客2077》開啟DLSS 4(自動升頻畫質、4X畫格生成)後,RTX 5070 Ti能在4K解析度搭配最高的Ray Trace Overdrive畫質模式帶來152.61幀的FPS效能表現。

《黑神話:悟空》身為新一代效能殺手,RTX 5070 Ti在2K解析度之平均FPS為57幀,離60幀大關只差一點。

《黑神話:悟空》開啟光線追蹤後,RTX 5070 Ti在2K解析度之FPS為32幀,可以透過DLSS強化畫面流暢度提高遊玩體驗。

介於旗艦與中階之間的高階卡

姑且不論NVIDIA先前對「70、80、90」等顯示卡等級規劃的慣例,RTX 50系列的GeForce RTX 5090已經超越習慣上對「90」等級的期望,無論是效能或價格,都更接近「Taitan」等級的定位,也功能上更加偏向AI運算等使用情境。因此對玩家而言,或許GeForce RTX 5080更能代表旗艦遊戲卡,若照這個邏輯往下看,GeForce RTX 5070 Ti就可以視為高階遊戲卡。

從測試遊戲的效能數據來看,GeForce RTX 5070 Ti的效能-價格效益優於GeForce RTX 5080,而新台幣26,990元的官方訂價也較後者低了9,000元,價格對玩家來說更具親合力。

如果這樣還是超出採購預算的話,也可以等待NVIDIA後續推出,官方訂價為新台幣19,990元的GeForce RTX 5070,我們也將帶來第一手資訊,請讀者保持關注。

加入T客邦Facebook粉絲團
❌