阅读视图

发现新文章,点击刷新页面。
✇T客邦-Techbang

WD_BLACK SN8100 NVMe SSD固態硬碟效能實測:PCIe Gen 5兼顧低溫與高速

Sandisk於2025年6月推出採用PCIe Gen 5x4匯流排的WD_BLACK SN8100 NVMe SSD固態硬碟,讓我們來看看它的效能表現如何。A277715b94294931754b0282dd17feda

Sandisk於2025年6月推出採用PCIe Gen 5x4匯流排的WD_BLACK SN8100 NVMe SSD固態硬碟,讓我們來看看它的效能表現如何。

多種容量與散熱片可選

WD_BLACK SN8100 NVMe SSD採用M.2 2280尺寸,搭載刻印為SanDisk A101-250800-AC的控制器,據悉為客製化的SMI SM2508,支援理論頻寬達16 GB/s的PCIe Gen 5x4匯流排,以及NVMe 2.0通訊協定,搭配的快閃記憶體顆粒為NAND Sandisk BiCS8 TLC 3D CBA NAND,並具有DRAM緩衝記憶體。以這次測試的2TB版本為例,緩衝記憶體為2GB LPDDR4。

延伸閱讀:SMI展出Gen 5固態硬碟控制器,免散熱片速度飆上14 GB/s

首波WD_BLACK SN8100 NVMe SSD於2025年6月推出1、2、4 TB容量的無散熱片版本,接著在2025年第4季推出1、2、4 TB容量且具散熱片與LED彩色燈光的版本,並於2025年下半推出8 TB之有、無散熱片版本。

Sandisk表示WD_BLACK SN8100 NVMe SSD主打先進的BiCS8 TLC 3D CBA NAND技術,不但具有出色的效能與穩定性,也具備低功耗的特色,而控制器也採用TSMC(台積電)6nm節點製程,整組固態硬碟的運作狀態功耗低於7 W,待機狀態功耗則為5 mW,不需主動式散熱風扇即可穩定運作。

WD_BLACK SN8100 NVMe SSD的另一項特色就是能透過WD_BLACK Dashboard專屬軟體切換遊戲模式,提高遊戲存取效能,進而發揮縮短讀取時間的效果。軟體中提供3種不同運作模式,當處於關閉狀態時,固態硬碟會針對生產力應用進行最佳化,開啟則是針對遊戲最佳化,而自動模式則會偵測執行使用者指定資料夾清單中的遊戲時才啟動。

筆者收到的樣品為2TB、無散熱片的WD_BLACK SN8100 NVMe SSD。

其機身正面僅貼上一般貼紙標籤,並沒有使用金屬或石墨烯等材質。

所有容量的WD_BLACK SN8100 NVMe SSD都採單面設計,安裝於筆記型電腦也沒問題。

將標籤撕下後,可以看到控制器為A101-250800-AC,據悉為客製化的SMI SM2508。

它也搭載Micron 2GB LPDDR4緩衝記憶體,顆粒打印為4GF77 D8CJX。

WD_BLACK SN8100 NVMe SSD規格表,不同容量的效能與寫入壽命有所差異。

WD_BLACK SN8100 NVMe SSD 2TB於CrystalDiskInfo之資訊。

使用工具查詢,控制器顯示為SMI SM2508,快閃記憶體顆粒為218層之NAND Sandisk BiCS8 TLC 3D CBA NAND顆粒。

使用者可以在WD_BLACK Dashboard專屬軟體的右上角開起遊戲模式,縮短遊戲讀取時間。

效能實測與環境

這次測試使用ASRock X870E Taichi主機板,將系統碟安裝於主機板的第2組M.2插槽(PCIe Gen 4x4),並將WD_BLACK SN8100 NVMe SSD 2TB安裝於第1組M.2插槽(PCIe Gen 5x4)。

所有成績都是進行2輪測試,在確定沒有極端值後取較佳者,測試結果如下列圖表。

測試平台:
處理器:AMD Ryzen 9 9800X3D
散熱器:MSI MEG Coreliquid S360
主機板:ASRock X870E Taichi(UEFI版號:3.17.TS03 – AMD AGESA ComboAm5PI 1.2.0.3)
記憶體:G.Skill Trident Z5 Neo RGB 16GBx2(@DDR5-6000)
顯示卡:NVIDIA GeForce RTX 5090 Founders Edition
儲存裝置:Samsung 990 Pro 1TB(系統碟),WD_BLACK SN8100 NVMe SSD 2TB(資料碟)
電源供應器:MSI MEG Ai1300P PCIE5
軟體環境:Windows 11專業版24H2(Build 26100.4351),GeForce Game Ready 576.76

在CrystalDiskMark的預設模式中,使用1 MB資料叢集搭配Q8T1(8佇列,1指令)模式進行測試之連續讀取速度為14957.67 MB/s,連續寫入則為14108.41MB/s,皆高於規格表的標示。

將CrystalDiskMark切換至「SSD」與「真實世界 + Mix」模式,4 KB資料叢集搭配Q1T1之隨機讀寫速度分別為107.83 MB/s、298.26 MB/s,I/O數最高可達72817.63 IOPS。。

在ATTO Disk Behchmark的讀寫頻寬表現則達到13.18 GB/s、13.62 GB/s。

最佳I/O表現出現在512B資料叢集,I/O數達136.07K IOPS。

接著使用太空戰士XIV:黃金的遺產(FINAL FANTASY XIV: Dawntrail)的測試工具測量遊戲讀取時間。

在關閉遊戲模式時讀取總時間為5.253秒,開啟後縮短至4.986秒,大約可以改善5.08%讀取時間,效果相當顯著。

WD_BLACK SN8100 NVMe SSD固態硬碟效能實測:PCIe Gen 5兼顧低溫與高速

▲在測試過程中僅使用主機板內建散熱片,最高溫度僅為攝氏52度,溫度表現相當出色。

WD_BLACK SN8100 NVMe SSD現已上市,不具散熱片的1、2、4 TB容量版本的建議售價分別為新台幣6,980、9,980、19,980元。

加入T客邦Facebook粉絲團
✇T客邦-Techbang

黃仁勳訪談深入思考(2):AI浪潮是真金白銀嗎?

過去我們曾經看到如NFT、元宇宙等多曇花一現的科技趨勢,AI也會是下個泡沫化的議題嗎?來看看AI目前的應用範例。3d832f284c06945153b188ff8c456448

過去我們曾經看到如NFT、元宇宙等多曇花一現的科技趨勢,AI也會是下個泡沫化的議題嗎?來看看AI目前的應用範例。

AI已經有許多應用案例

過去轟動一時的無聊猿NFT(Non-Fungible Token,同質化代幣),或是連Facebook都投入大量資金開發的元宇宙,都在熱潮過後迅速降溫,且後續發展幾乎沒有東山再起的跡象。

然而AI現在正處於話題性最熱烈的階段,在往後幾年「微微降溫」是必然的過程,但是與NFT或元宇宙不同的是,AI應用已經有許多實際應用案例。簡單地說,筆者認為潮水退了之後,AI仍會穿著褲子。

舉例來說,NVIDIA已經在2021年與多間學術機構共同將開源AI框架MONAI(Medical Open Network for AI),促進加強醫學影像領域的AI技術發展,透過AI進行醫學影像、基因、腫瘤的分析。

在2023年的GTC大會則發表與ASML(艾斯摩爾,曝光機)、TSMC(台積電,晶圓代工)、Synopsys(新思科技,EDA電子設計自動化)等半導體領導企業共同研發能夠加速晶片設計與製造的cuLitho運算式微影(Computational Lithography)技術函數庫,可以透過GPU加速微影成像模擬與校正,強化自動量測和檢測的效果,確保微影製程中電路精準度,提升製程控制能力以及良率。

這些已經投入產業的實際AI應用案例,可以說是貨真價實的技術,在話題性降溫之後,也不容易隨之消失。

NFT與元宇宙等曾經紅極一時的議題在退燒後並沒有支撐起實際產業。圖為Meta執行長展示自家開發元宇宙中精美的巴黎鐵塔。(圖片來源:Facebook)

相反的,AI的應用範圍相對廣泛許多,目前已經有許多投入實際產業的應用範例。例如NVIDIA Clara是款能夠提供即時醫學影像分析的平台。

ASML、TSMC、Synopsys等半導體相關企業與NVIDIA共同研發cuLitho,透過AI提升製程控制能力以及良率。

NVIDIA拉壟中東建設AI工廠

NVIDIA執行長黃仁勳在Computex台北國際電腦展2025的CEO Keynote主題演說中,將先前「The more you buy, the more you save.」(買越多、省越多)的金句,改為「The more you buy, the more you make.」(買越多、賺越多)。

箇中原因就是NVIDIA將自身重新定位為「AI工廠基礎設施公司」,NVIDIA提供AI運算資料中心的整體解決方案。企業在設立資料中心後,透過輸入資料與能源,就能訓練並產出AI模型,後續也能持續微調AI模型,或是進行AI推論運算,等於是採購越多設備,就能產出越多AI模型與對應服務,並賺取更多利潤。

上面講的整體概念與汽車工廠的自動化生產線相近。舉例來說,將鋼鐵以及各種零件送進汽車工廠,並且輸入電力、煤炭等能源,就能生產出汽車,而將對應的醫學影像與資料送進AI工廠也輸入電力,就能產生具有判讀腫瘤圖像的AI模型。

黃仁勳也在演說中提到,由於資料中心的空間以及電力供應是有限的,所以在同樣尺寸與功耗的伺服器中提供更高的運算效能,就等於在不用擴建新資料中心的前提下,提高AI模型的產能。言下之意也在於鼓勵企業在每個產品世代都升級伺服器,以提高AI工廠的生產效率。

另一方面,黃仁勳在Computex前夕前往中東拜訪沙烏地阿拉伯、卡達、阿拉伯聯合大公國等國家,其中一大原因便是看上這些國家具有充沛的能源,很適合發展AI資料中心產業,具有從「能源輸出國」轉型為「AI輸出國」的潛力。

NVIDIA將自身重新定位為「AI工廠基礎設施公司」,從生產GPU轉型為提供AI基礎建設。

單一資料中心的空間以及電力供應是有限的,如果在每個產品世代都升級至效能更高的伺服器,就能在不用擴建新資料中心的前提下,提高AI模型的產能。

所以黃仁勳演說中,將金句調整為「The more you buy, the more you make.」(買越多、賺越多)。

筆者會在下篇文章中進一步說明黃仁勳於Computex 2025提出的NVLink Fusion,讀者可以從下方目錄連結繼續閱讀。

回到系列文章目錄

加入T客邦Facebook粉絲團
✇T客邦-Techbang

黃仁勳訪談深入思考(1):AI不只是會唱歌、畫圖的人類模仿器

各廠商在Computex台北國際電腦展2025無不擁抱AI議題,究竟AI是再次曇花一現的騙局,還是真金白銀的產業趨勢,而AI又是什麼?就讓我們從深入思考這個問題。4f1ee1a7a1c27335e923261e286b7911

各廠商在Computex台北國際電腦展2025無不擁抱AI議題,究竟AI是再次曇花一現的騙局,還是真金白銀的產業趨勢,而AI又是什麼?就讓我們從NVIDIA執行長黃仁勳的主題演說與媒體放訪談切入,深入思考這個問題。

系列文章:
黃仁勳訪談深入思考(1):AI不只是會唱歌、畫圖的人類模仿器(本文)
黃仁勳訪談深入思考(2):AI浪潮是真金白銀嗎?(工作中)
黃仁勳訪談深入思考(3):NVLink Fusion深掘護城河(工作中)
黃仁勳訪談深入思考(4):AI會取代人力,但人力會找到出路(工作中)

AI不是模仿人類

AI(Artificial Itelligence)普遍翻譯為人工智慧,這個名稱很容易讓人將技術與科幻電影出現的機器人聯想在一起,它們能夠自主行動、與人溝通,甚至會企圖消滅人類並征服世界。

好吧,雖然在黃仁勳在Computex 2025的CEO Keynote主題演說上強調通用機器人是下個產值上看兆元的產業,但是他口中的機器人與電影中的機器人卻不盡相同。

在討論AI是什麼之前,筆者先提出簡單的問題,「計算機是否為人工智慧?」。就算是最簡單的計算機也進行加減乘除、開根號的計算,它們也知道1+1=2,這樣是否稱為人工智慧?

或許很多人會以計算機能完成的工作太過簡單為由,而覺得它們不是人工智慧。那筆者又要請問你了,「你是否可以馬上算出6546487開根號是多少?」,看來計算機比你聰明多了。

以筆者的觀點來看,計算機當然不算人工智慧,背後的原因不是它的輸出的結果夠「人性化」,而是它的運作原理。粗略來說無論是計算機或是一般電腦程式,它的運算都是透過簡單邏輯閘或是依循程式碼的指示執行固定的運算工作,而人工智慧或機器學習(Machine Learning,以下簡稱ML)則以不同的方式運作。

黃仁勳在Computex 2025的CEO Keynote主題演說上強調通用機器人是下個產值上看兆元的產業。

你覺得會唱歌、跳舞或是畫圖的機器人就算是AI嗎?(本圖透過Stable Diffusion生成)

應該沒有人會覺得這種計算機是AI的應用範例吧。

那麼AI是什麼

引用先前3度獲得奧斯卡科技成就獎的NVIDIA電腦繪圖資深科學家Jos Stam博士在訪談中提到觀點,他認為AI就像個黑盒子,雖然我們不知道它如何運作,但是它卻實能夠發揮功效,充滿幽默感的答案也襯托出AI的複雜性。讀者可參考《3屆奧斯卡獎得主電腦繪圖資深科學家Jos Stam博士分享,未來電腦繪圖會往哪裡走?》一文。

筆者不會在這系列文章提到太多艱深的技術細節,內容以討論AI的概念為主。為了避免「人工智慧」這4個字造成顧名思義的混淆印象,筆者建議對AI底層技術不太瞭解的讀者將AI在腦中翻譯為「矩陣迭代相乘」,總之AI就是很複雜的數學運算,而不是科幻電影中的機器人。

撇開艱澀的理論,從功能來看,AI能夠進行學習、推論以及採取行動,筆者認為AI與傳統運算最大的差異在於「學習」這個階段。

以「貓、狗照片分類」為例說明,傳統運算仰賴程式中固定的邏輯,開發者需要撰寫分辨貓、狗特徵的程式碼,比方詳細列出貓與狗的面貌、耳朵、體型、毛色等差異,如此一來程式在運作的時候,就可以根據這些原則進行分類。

然而AI運算的開發過程不需手動撰寫分類規則的程式,而是提供大量已經標註貓或狗的圖片,將這些圖片送入系統進行「AI訓練」運算,如此一來系統便會產生能夠分辨貓或狗的「AI模型」。在這之後只要拿任意新的圖片送入系統進行「AI推論」運算,系統就會給出這是貓或狗的答案。

一般大眾比較熟悉的ChatGPT等大型語言模型,或是筆者先前介紹過的ChatRTX聊天機器人StableDiffusion圖像生成等工具軟體也都是AI的應用,只是它們生成的結果可以是一長串文字、針對提問的答案、圖片或影片等一般人更容意理解的具象化結果,所以將其分類為生成式AI。

以結論來說,筆者認為AI應該是以其運算方式進行分類,透過大量資料進行AI訓練得到模型後,再以AI推論的方式生成結果,比較適合被歸類為AI。

NVIDIA電腦繪圖資深科學家Jos Stam博士比喻AI就像個黑盒子,雖然我們不知道它如何運作,但是它卻實能夠發揮功效。

Jos Stam舉例人類的神經匯聚為智慧,而電腦的位元資料匯聚後產生人工智慧。

開發者藉由大量的貓、狗圖片資料進行AI訓練得到模型後,就能以AI推論的方式讓電腦自動分辨新輸入的圖片是貓或是狗。(本圖透過Stable Diffusion生成)

在下篇文章中,筆者會再說明AI產業發展的狀況,如此一來便能回答這波AI浪潮是否「玩真的」。

加入T客邦Facebook粉絲團
✇T客邦-Techbang

Aten優聲學AI語音合成新功能,給它英文影片就能同步口譯台語發音,還可自行輸入台羅文字

Aten於Computex展示優聲學AI語音合成技術,新增台語版本!AI語音合成可即時翻譯影片字幕與語音,更能離線進行AI語音合成,應用更彈性。236f14ec1748df900d95f8d9dbd47b99

你是否曾想過,影片中的聲音能即時翻譯成多國語言?Aten 在 Computex 2025 實現了這個願景。其優聲學 AI 語音合成技術,不僅能將影片語音轉為多國字幕,更能直接合成多國語言語音。更特別的是,Aten 還加入了台羅文支援,讓 AI 也能說一口流利的台語。讓我們一起探索 Aten 如何用聲音,打破語言隔閡。

直播影片同步口譯

Aten AI Voice Vidtext能夠擷取影片中的語音,並於雲端完成語音轉文字辨識、文字翻譯、翻譯後文字轉語音等程序,並將翻譯後的字幕與語音嵌入原始影片,提供有如同步口譯的功能,適合應用於公共廣播和公共交通等場景。

延伸閱讀:【Computex2024】Aten優聲學AI語音合成增加台語版本,還能下雲進行本地端AI推論

AI Voice Edge Generator則是能夠離線運作、於本機完成語音合成的邊緣運算電腦,它提供文字生成語音的功能,並支援輸入中文、台羅文、英文等文字,或是串接API,讓AI Voice Edge Generator合成中文、台語、英文等語音。由於它能夠在不連網的情況下運作,因此更適合公共場所廣播、公車站牌、櫃台叫號等多元場景。

Aten AI Voice Vidtext能夠將影片即時產生翻譯的字幕與語音。

▲此範例為將影片中英文語音即時翻譯為國語字幕與台語語音。(因會場聲音較為吵雜,收音效過欠佳,下同)

使用者能夠透過AI Voice Vidtext機身上的實體按鍵操作翻譯、子母畫面等功能。

AI Voice Edge Generator屬於邊緣運算的應用,運作時不需連網,應用更具彈性。

使用者可以輸入中文、台羅文等文字,或是串接API,讓AI Voice Edge Generator合成包括中文、台語在內的多國語音。

▲透過AI Voice Edge Generator將中文文字生成台語語音的範例。

優聲學提供多種不同的付費方案,其中也包含免費的雲端服務方案,有興趣的讀者可以註冊帳號免費嘗試功能。

加入T客邦Facebook粉絲團
✇T客邦-Techbang

Sunix推出OCuLink轉接套件,桌上型電腦也能玩外接顯示卡

Sunix於Computex台北國際電腦展2025展出OCuLink轉接套件,其中包含PCIe Gen 4x4介面的轉接卡,還可搭配Mini ITX機殼DIY打造外接顯示卡或是DAS儲存裝置。45e4fc5ab91447e40d74bf7f4485670a

Sunix於Computex台北國際電腦展2025展出OCuLink轉接套件,其中包含PCIe Gen 4x4介面的轉接卡以及擴充板,使用者還可搭配Mini ITX機殼DIY打造外接顯示卡或是DAS儲存裝置。

DIY外接顯示卡

Sunix推出的OCuLink轉接套件包含OCYU4221L轉接卡以及OCUD4241擴充母板等零組件,前者為將桌上型電腦的PCIe插槽轉換為外接式的OCuLink介面,後者則是將OCuLink介面還原成PCIe插槽,相互搭配就可以達成PCIe外接化的效果。

延伸閱讀:Minisforum推出OCulink介面eGPU docking station MGA1外接Radeon 7600M XT顯示晶片擴充底座

舉例來說,使用者可以在桌上型電腦中安裝轉接卡,並將將擴充母板、顯示卡、電源供應器等零組件安裝至另1台Mini-ITX機殼中,就可以打造出土砲外接顯示卡,並透過OCulink纜線連接電腦與外接顯示卡。

如果將SATA擴充卡或RAID陣列卡安裝至擴充母板,就可以打造土砲DAS儲存裝置(Direct-Attached Storage),或是搭配OCulink介面的固態硬碟外接盒使用。

OCYU4221L轉接卡採用PCIe Gen 4x4匯流排與半高尺寸,能將桌上型電腦的PCIe插槽轉換為外接式的OCuLink介面。

轉接卡上具有1組OCuLink端子。

將OCYU4221L轉接卡接在電腦的PCIe插槽就能使用OCuLink功能。

OCUD4241則是OCuLink的擴充母板,它採用Mini-ITX尺寸,提供1組PCIe Gen 4x16插槽以及ATX 24 Pin電源端子。

使用者可以將擴充母板、顯示卡、電源供應器等零組件安裝至Mini-ITX機殼中,就可以打造出土砲外接顯示卡。

OCUD4241擴充母板的特色就是採用Mini-ITX尺寸並提供ATX 24 Pin電源端子,能夠搭配大部分的機殼與電源供應器使用,降低DIY手工製作機殼與電源轉接的麻煩。

加入T客邦Facebook粉絲團
✇T客邦-Techbang

《毀滅戰士:黑暗時代》路徑追蹤實裝,光照效果真實感再升級

《毀滅戰士:黑暗時代》在上市當時尚未提供路徑追蹤,現在則透過更新在遊戲中實裝此功能,帶來更逼真的光影呈現效果。6b4e045698b8a20725df1865115fe24f

《毀滅戰士:黑暗時代》在上市當時尚未提供路徑追蹤,現在則透過更新在遊戲中實裝此功能,帶來更逼真的光影呈現效果。

路徑追蹤終於來了

《毀滅戰士:黑暗時代》(Doom: The Dark Ages)使用多種俗稱「全光線追蹤」的路徑追蹤(Path Tracing)技術,它會考慮整個場景中所有可能的光線路徑,並精確模擬場景中的所有光線,達到更逼真的光影效果。

延伸閱讀:《毀滅戰士:黑暗時代》光線追蹤反射、全域照明搶先看,還會透過更新追加路徑追蹤技術

其中路徑追蹤陰影(Path-Traced Shadows)會考慮連續輪廓、接觸陰影硬化、反鋸齒與自體陰影的高解析度細節,讓物件投射出完整且清晰的陰影,

路徑追蹤反射(Path-Traced Reflections)透過模擬光線在表面反射時的物理行為,能夠精確模擬光澤反射、漫反射和鏡面高光等複雜現象,除了提升真實感,也可以呈線畫面外物件的反射,並避免產生視覺偽影。

路徑追蹤光線發射(Path-Traced Emissive Lighting)能夠逐像素呈現鏡面反射效果,大幅提升遊戲光源的動態光源效果。而路徑追蹤動態漫射全域照明(Path-Traced Dynamic Diffuse Global Illumination)則會考慮直接照明和間接照明,能夠描繪光線在多個表面的反射、折射和散射,呈現柔和的陰影、滲色和微妙的陰影變化,尤其在戶外場景更能帶來逼真、身臨其境的視覺效果。

由於路徑追蹤的運作將消耗大量運算資源,所以可以搭配DLSS 4升頻、多重畫格生成,以及DLSS光線重構(Ray Reconstruction)等功能在提升FPS效能的同時強化畫質表現。

《毀滅戰士:黑暗時代》透過更新實裝路徑追蹤功能,並支援DLSS光線重構。

實際遊戲場景範例,圖為開啟路徑追蹤與光線重構,可以看到中央燈箱的在水面的反射相當清晰。

若只開啟路徑追蹤但關閉光線重構,則會看到反射部分的部分變的比較模糊。

若關閉路徑追蹤,則看到反射部分無法真實呈現燈箱。

以1:1方式裁切原始圖像,能夠更清楚看出彼此差異。

路徑追蹤效能實測

測試過程使用GeForce RTX 5090顯示卡,搭配4K解析度、最高畫質的「超狂惡夢」範本,並開、關路徑追蹤功能(僅使用一般光線追蹤),以及搭配DLSS 4測試遊戲FPS表現,開啟DLSS 4時搭配「平衡」超解析度以及「4X」畫格生成。

測試平台:
處理器:AMD Ryzen 7 9800X3D
散熱器:MSI MEG Coreliquid S360
主機板:ASRock X870E Taichi(UEFI版號:3.17.TS03 – AMD AGESA ComboAm5PI 1.2.0.3)
記憶體:G.Skill Trident Z5 Neo RGB 16GBx2(@DDR5-6000)
顯示卡:NVIDIA GeForce RTX 5090 Founders Edition
儲存裝置:Solidigm P44 Pro 1TB(系統碟)、Solidigm P41 Plus 1TB(遊戲碟)
電源供應器:MSI MEG Ai1300P PCIE5
軟體環境:Windows 11專業版24H2(Build 26100.4351),GeForce Game Ready 576.76

筆者使用《毀滅戰士:黑暗時代》遊戲新增的效能測試模式進行測試。

搭配DLSS 4與4X多重畫格生成後,GeForce RTX 5090能在4K解析度、最高畫質、開啟路徑追蹤設定帶來220.73幀的平均FPS。

▲使用顯示卡錄影功能錄製關閉路徑追蹤的效能測試片段。

▲可以比較一下開啟路徑追蹤後的畫質差異。

《毀滅戰士:黑暗時代》的路徑追蹤功能將於2025年6月18日透過更新提供,已經購買遊戲的玩家皆免費更新。

加入T客邦Facebook粉絲團
✇T客邦-Techbang

Wooting展示60HE v2類比鍵盤,現有鍵盤也可搭配旋鈕套件

Wooting於Computex台北國際電腦展2025展出採用Lekker Tikken鍵軸的60HE v2類比鍵盤,同時也推出能DIY改裝的旋鈕套件,讓現有鍵盤也能加入旋鈕功能。C4140224dcf64725a44d47a1e870cb4c

Wooting於Computex台北國際電腦展2025展出採用Lekker Tikken鍵軸的60HE v2類比鍵盤,同時也推出能DIY改裝的旋鈕套件,讓現有鍵盤也能加入旋鈕功能。

4mm行程Lekker Tikken軸

Wooting於2016年推出Wooting One類比鍵盤,也在當年Computex帶來實機展示。到了2021年推出60%尺寸的60HE,而在今年Computex發表了第2代60HE v2類比鍵盤。

延伸閱讀:
【Computex2024】Wooting推出8,000 Hz輪詢率80HE類比鍵盤,超低延遲還有特異功能
Wooting推出全新60HE磁力軸類比鍵盤,60%尺寸方便隨身帶著走
【Computex2016】Wooting One類比鍵盤動手玩

60HE v2同樣採用60%尺寸,機身使用鋁合金製成,提供黑、白、銀等3種配色,導入搭配拆機工具只需秒就可拆下外殼的快拆設計。至於吊環部分則將先前於左側的固定式設計,改為可以在左、右2側自行拆裝的活動式設計,讓左、右撇子都能依需求自由調整。

60HE v2的回報率高達8,000 Hz,採用新Lekker Tikken鍵軸,同樣具有類比控制功能,使用者能夠透過軟體設定觸發點,適合需要更靈敏操作的電競應用。新鍵軸提供長達4 mm的按鍵行程,並改良結構以帶來更「爽快」的敲擊音,使用者也可以拆開鍵盤取下矽膠材質吸音墊,或是更換為其他材質,以創造不同手感與敲擊音。

60HE v2的另一個特色就是提供一體式與分離式空白鍵等2種版本。一體式空白鍵與一般鍵盤相同,空白鍵就是1個長條,而分離式空白鍵則是將空白鍵分為左、右2個小條加上中央1個小按鍵,使用者能夠透過軟體設定3個按鍵的功能。

Wooting 60HE v2是這次發表的新鍵盤,圖為分離式空白鍵版本,可以注意其空白鍵拆分為3個按鍵。

60HE v2採用新款Lekker Tikken鍵軸,按鍵行程長達4 mm,感應器能在0.1 ~ 4 mm的區間作用。

 

60HE v2採用活動式吊環設計,本圖為將吊環裝在右側(前方圖片為裝在左側)。此外其手托也更新設計。

新的手托多了圖中中央的固定零件,能將鍵盤與手托固定在一起,移動時就不會分離。

 

分離式空白鍵版內部具有3個獨立的鍵軸,可以透過軟體設定功能。

圖中右方則為一體式空白鍵版本,內部為3個鍵軸搭配左右2組衛星軸。

拆下Alt鍵帽後透過快拆工具就可以將鍵盤機構從底部框體取下,方便更換或移除底部吸音墊,也可以更換不同顏色的框體。

Wooting也在會場展出60HE v2的拆解姿態。

60HE v2內部透過多層泡棉、矽膠材質軟墊調整手感與敲擊音。

還有可DIY的旋鈕

Wooting也推出大小等2種尺寸不同的Knob旋鈕,使用者可以將現有鍵盤的按鍵替換為旋鈕,並透過軟體設定旋鈕的功能,讓鍵盤發揮更多功能。

圖為80HE鍵盤搭配大尺寸旋鈕。

大尺寸旋鈕占用4個按鍵空間,需替換Ins、Del、Pg Up、Pg Dn等按鍵。

如果是只占用1個按鍵空間的小尺寸旋鈕則可安裝於任意位置,圖中範例替換Esc鍵。

Wooting 60HE v2預定於2025年第4季上市,Knob旋鈕則於2026年第1季上市,有興趣的讀者可以前網官方網站登記預購提醒。

加入T客邦Facebook粉絲團
✇T客邦-Techbang

AMD於Advancing AI 2025發表Instinct MI350系列AI加速器,ROCm 7軟體堆疊改善效能達3.6倍

AMD於Advancing AI 2025大會上發表全新Instinct MI350系列AI加速器,並推出能夠容納128組GPU的機櫃設計,也透過新版ROCm 7軟體堆疊改善效能。A439aa878769d795678b182ba236137f

AMD於Advancing AI 2025大會上發表全新Instinct MI350系列AI加速器,並推出能夠容納128組GPU的機櫃設計,也透過新版ROCm 7軟體堆疊改善效能。

性價優於對手40%

AMD執行長蘇姿丰於Advancing AI 2025大會的演說中發表Instinct MI350系列AI加速器,並分析隨著代理式AI、國家主權AI等應用需求的成長,整個產業對於AI運算加速的需求也隨之增加。

延伸閱讀:AMD提交MLPerf 4.1測試結果,Instinct MI300X追平業界領先者

AMD發表Instinct MI350、MI355X等全新GPU(繪圖處理器),並採用UBB8通用基板(Universal Base Board)設計,方便現有Instinct MI325伺服器使用者直接升級GPU,進一步節省整體持有成本(TCO)。

另一方面AMD也推出水冷與氣冷散熱方案的機櫃設計,分別最多能夠容納128、64組GPU,滿足不同需求、機房環境的企業應用需求。

筆者將發表會重點整理於下方圖文說明。

AMD執行長蘇姿丰於Advancing AI 2025大會展示Instinct MI350 GPU晶片。

AMD於2025年發表Instinct MI350系列AI加速器,並預計於2026年推出Instinct MI400。

Instinct MI350系列採用第4代Instinct架構與TSMC(台積電)3nm節點製程。

它新增支援FP8、FP6資料格式,峰值浮點運算效能可達20PF,搭載容量高達288 GB的HBM3e高頻寬記憶體,並採用UBB8通用基板(Universal Base Board),能夠直接由現有Instinct MI325伺服器進行升級。

Instinct MI350系列具有MI350、MI355X等型號,2者硬體規格相同,但後者具有更高的1400 W TDP,因此效能也更加出色。

Instinct MI350系列與競爭對手NVIDIA的GB200、B200等運算單元相比,規格與理論效能皆較為出色。

Instinct MI355X運算平台由8組GPU組成,總記憶體容量達到2.3 TB,能夠提供高達161PF的FP4浮點運算效能。

Instinct MI350系列運算平台提供一般氣冷散熱方案。

此外也提供水冷散熱方案,能夠滿足不同應用需求。

與自家前代MI300X(FP8)相比,Instinct MI355X在FP4資料格式下,能在Llama 3.4 405B大型語言模型帶來最高35倍的效能表現。

在其它Llama 3.4 405B大型語言模型的應用情境可以帶來2.6 ~ 4.2倍效能表現。

在不同大型語言模型也有3 ~ 3.3倍效能表現。

與GB200、B200相比,Instinct MI355X的表現也能保持領先。

將價格因素也納入考量的話,Instinct MI355X在相同成本下,產生字詞(Token)的效能較B200高出40%,具有更佳性價比。

Instinct MI355X在大語言模型的預訓練、微調等工作負載效能也較MI300X高岀2.6 ~ 3.5倍不等。

Instinct MI355X在相同項目也可以與GB200、B200相互競爭。

AMD也提供容納128或96組GPU的水冷機櫃設計,總記憶體容量達到36 TB,並提供高達2.6EF的FP4浮點運算效能。

氣冷機櫃設計則能容納64組GPU,總記憶體容量為18 TB,FP4浮點運算效能為1.3EF。

AMD預計於2026年推出採用Venice世代處理器搭配Instinct MI400系列AI加速器的Helios伺服器,2027年則預計推出Verano世代處理器搭配Instinct MI500系列AI加速器。

強化軟體環境

AMD也在於Advancing AI 2025大會發表新版ROCm 7軟體堆疊,除了能夠支援最新推出的Instinct MI350系列AI加速器,也透過軟體方式改善現有硬體的運算效能,帶來更高的附加價值。

另一方面,AMD也進一步將ROCm推廣至一般家用、客戶端裝置,讓個人使用者也能享受本地端AI運算的便利,已支援Fedora與OpenSUSE等Linux發行版本,並預計於2025下半支援Red Hat EPEL與Ubuntu。

對於Windows作業系統的使用者而言,目前可以透過WSL(Windows Subsystem for Linux)使用ROCm,近期也會於2025年第3季與7月支援PyTorch與ONNX-EP框架,進一步增加原生執行AI應用程式的便利性。

AMD也特別強調Ryzen AI Max處理器,其內建顯示晶片最高能調用高達96 GB的顯示記憶體,能在筆記型電腦或迷你工作站執行參數量達70B的大語言模型,帶來更大的使用彈性。

AMD致力於提供開放的軟硬體與生態系統,強化AI應用的彈性與創新。

AMD也於Advancing AI 2025大會發表ROCm 7軟體堆疊,支援Instinct MI350系列AI加速器並改善效能。

ROCm 7較前版ROCm 6相比,可以透過軟體更新方式帶來平最高3.8倍效能表現。

ROCm 7搭配Instinct MI355X在DeepSeek R1大語言模型的吞吐量能達到B200的1.3倍。

AMD也將ROCm推廣至一般家用、客戶端裝置。

ROCm新增支援Linux的OpenSUSE發行版本,並預計於2025下半支援Red Hat EPEL與Ubuntu,另外也將於2025年第3季與7月支援Windows作業系統的PyTorch與ONNX-EP框架。

搭載Ryzen AI、Ryzen AI Max等處理器的筆記型電腦具有執行參數量為24B、70B的大語言模型。

另一方面許多歐、美、中東、日本等國加都採用AMD平台建構主權AI的基礎設施。

▲AMD的YouTube官方頻到提供主題演說重播影片。

Advancing AI 2025大會於美國加州聖荷西當地時間2025年6月12日舉辦AMD Advancing AI 2025,有興趣的讀者可以前往YouTube觀看主題演說影片

加入T客邦Facebook粉絲團
✇T客邦-Techbang

Asus ROG Strix ACE XG248QSG選手級顯示器:浪費才能打造最高610 Hz更新率TN螢幕,瞭解背後的開發秘密

Asus展出ROG Strix ACE XG248QSG顯示器,具有高達610 Hz的更新頻率,為電競選手帶來更大競技優勢。A271b1c716cb34b9fb63f63f6b5800f4

Asus展出ROG Strix ACE XG248QSG顯示器,具有高達610 Hz的更新頻率,為電競選手帶來更大競技優勢。

ROG Strix ACE XG248QSG的可視面積尺寸為24.1吋,解析度為1920 x 1080,皆為電競選手最為適應的規格,它雖然採用顯色能力較弱的TN類型面板,但更新頻率高達610 Hz,且輸入延遲只有0.8 ms,能提供更加敏捷的顯示與操作反應,讓選手占據更多競技優勢,它也因此獲得Computex Best Choice獎項

當作專業運動器材來開發

由於選手在電競比賽過程中需要聚精會神盯著螢幕,再加上座位與螢幕的距離有限,所以尺寸太大的螢幕反而不利於將整個畫面放在視角之內,因此許多選手會偏好使用24吋的螢幕以利能夠掌握畫面角落的部分,而不會因為尺寸太大導致需要轉頭才能看到。另一方面,也有選手時習慣降低遊戲的解析度,以提高FPS,達到降低操作延遲的效果。

至於顯示器本身的更新頻率與輸入延遲也都對選手的操作體驗有所關聯,當更新頻率越高,代表著顯示每個畫面的時間間隔越短,而輸入延遲則是選手輸入指令後畫面呈現反應的時間差。當更新頻率越高、輸入延遲越低,能夠縮短選手看到畫面變動並作出反應的時間,有助於取得競技上的優勢。

從概念上來看,ROG Strix ACE XG248QSG有點像是專業運動器材的感覺,協助選手改善賽場上的表現。就像是當年叱吒泳壇的鯊魚裝,讓選手在科技的協助下打破許多記錄。

ROG Strix ACE XG248QSG是針對電競應用設計的610 Hz高更新頻率顯示器。

它獲得Computex大會頒發的Best Choice獎項。

現場以肉眼觀看Test UFO網頁可以看到610 FPS顯示仍相當清晰。(因移畫面中的幽浮移動度太快,相機無法順利拍攝)

ROG Strix ACE XG248QSG採用平面腳架,腳架尺寸也有縮小,擺放更加方便。

超高更新頻率的秘密

ROG Strix ACE XG248QSG也會透過插入黑幀(Black Frame Insertion)的方式降低殘影,但不同於傳統插入黑幀技術有著較明顯顯示亮度下降的副作用,它採用的ELMB 2(ASUS Extreme Low Motion Blur 2)技術,能較同類產品提高65%顯示亮度。

其祕訣在於將原本只設置於顯示器單側的側光式背光模組,改為設置於螢幕的左右兩側,並讓背光區域隨著插入黑幀時畫面由上而下更新的時像同步點亮,達到在在降低殘影的同時兼顧顯示亮度,讓ROG Strix ACE XG248QSG的預設亮度能夠達到370 nits,最高亮度則可達到約400 nits。

Asus提供610 Hz更新頻率的顯示效果示意影片,讀者可以前往官方網站,或是直接下載影片查看。

ROG Strix ACE XG248QSG螢幕的左右兩側都具有側光式背光模組,會隨插入黑幀時的畫面更新時像同步點亮,以提高整體顯示亮度。

如果讀者是具有火眼金睛的高階電競玩家,不妨找個機會親自看看ROG Strix ACE XG248QSG超高更新頻率的顯示效果。

 

加入T客邦Facebook粉絲團
✇T客邦-Techbang

滿血HDMI 2.2來了!HDMI協會宣佈Ultra96功能名稱,完整支援HDMI 2.2全部功能

HDMI協會於Computex台北國際電腦展2025的媒體說明會中,由執行長Rob Tobias說明最新HDMI 2.2規格,並分享HDMI遊戲功能與產業趨勢。F961c4fd56492a8c25f63d35fd6cabe0

HDMI協會於Computex台北國際電腦展2025的媒體說明會中,由執行長Rob Tobias說明最新HDMI 2.2規格,並分享HDMI遊戲功能與產業趨勢。

滿血HDMI 2.2來了!

先前HDMI協會於CES25發表發表HDMI 2.2規格,這次HDMI協會執行長Rob Tobias親自來到Computex台北國際電腦展2025會場與大家說明HDMI 2.2規格。

延伸閱讀:CES 2025:HDMI論壇發表HDMI 2.2規格,全新Ultra96纜線支援12K60p超高解析度

HDMI協會宣布「Ultra96」新功能的名稱,它代表裝置與纜線能夠支援最高96Gbps頻寬。標示為超高速96 HDMI傳輸線(Ultra96 HDMI Cable)及具備96Gbps 頻寬並支援所有HDMI 2.2功能,相較之下目前的超高速HDMI傳輸線(Ultra High Speed HDMI Cable)頻寬僅有48Gbps。

HDMI 2.2能在不使用DSC(Display Stream Compression)影像壓縮的情況下傳輸RGB 4:4:4色採取樣的10K60p或YcbCr 4:2:0色採取樣的12K30p畫面傳輸,如果搭配DSC則可達到RGB 4:4:4色採取樣的12K60p超高解析度,並支援延遲指示通訊協定(Latency Indication Protocol,LIP)能夠改善電視、音響、播放器、遊戲機等多種裝置間影音不同步的問題。更多HDMI 2.2功能可以參考先前之介紹報導

HDMI協會執行長Rob Tobias於會場說明HDMI 2.2的功能特色。

HDMI 2.2也支援更高的解析度與更新頻率、可變更新頻率、低延遲等多項遊戲功能。

即將推出的Nintendo Switch 2也將採用超高速HDMI。

採用「Ultra96」規格的裝置與纜線能夠支援最高96Gbps頻寬,以及所有HDMI 2.2功能。

Ultra96可以標示於連接埠、規格表、產品包裝等指定位置。

超高速96 HDMI傳輸線預定於2025年第3、4季上市。

HDMI協會強調HDMI受到智慧財產保護,如果消費者發現仿冒品也可提出檢舉。

會場展示的超高速96 HDMI傳輸線包裝範例。

HDMI 協會表示已與HDMI採納者、製造商以及海關和警察機關合作,至今台灣警政已執法44件智慧財產權案件、21 起侵權案件達成和解,在台灣媒體刊物刊登了 19 封道歉信聲明,展現杜絕仿冒品的決心。

加入T客邦Facebook粉絲團
✇T客邦-Techbang

Arm發表Zena CSS車用運算平台,簡化AI定義車輛開發並節省20%工程資源

Arm推出標準化、預整合、預認證的Zena CSS運算平台,可為汽車製造商大幅縮短開發週期,並在晶片尚未就緒前即可提早開發軟體,縮短1年上市時程。Ee62144a8c4261d380ca757cf15ddce1

Arm推出標準化、預整合、預認證的Zena CSS運算平台,可為汽車製造商大幅縮短開發週期,並在晶片尚未就緒前即可提早開發軟體,縮短1年上市時程。

加速AI定義車輛開發

Arm表示現在汽車製造商面臨最嚴峻的挑戰之一,在於傳統的晶片開發流程速度太慢,往往導致車款的延遲上市,以至於無法將各項創新快速導入至汽車駕駛體驗,Arm先前已推出SOAFEE軟體架構,為軟體定義車輛提供標準化開發平台,這次則再推出Zena CSS(Compute Subsystems,運算子系統),為AI定義車輛提供便捷的開發環境。

延伸閱讀:Arm推出SOAFEE軟體架構,為軟體定義車輛提供標準化開發平台

汽車產業發展的趨勢為在單一平台同時執行先進輔助駕駛系統(Advanced Driver Assistance Systems,ADAS)、車用資訊娛樂系統(In-Vehicle Infotainment,IVI)、車輛控制系統等多元工作負載,上述應用對的安全等級要求與對即時性反應的限制皆有所不同。

Arm推出的Zena CSS以Armv9車用技術(Automotive Enhanced,AE)為基礎,藉由標準化運算平台可讓汽車製造商與晶片供應商重複使用架構與軟體,加速全球汽車的交貨速度,並簡化系統開發與整合流程,同時精簡功能安全與資安的認證。

Arm應用工程總監徐達勇與車用事業部亞太區資深經理李安泰在發表會說明Zena CSS車用運算平台的特色。

車輛趨勢從過去的過去軟體控制轉變到現在的軟體定義,未來將往AI定義車輛的方向發展,。

AI可以在許多車用領域發揮所長。例如先進輔助駕駛系統(ADAS)能夠強化適應市區、高速公路等不同環境,車用資訊娛樂系統(IVI)則能提供直覺的個人化、聲控體驗,車輛控制系統則能針對路況進行油耗最佳化。

汽車製造商也需要更具彈性的運算平台以導入創新、能快速移植到不同車款,並縮短上市時程(Time to Market)。

Arm提供完整的軟硬體堆疊,從底層的硬體平台(SoC晶片)以及虛擬化驗證平台,還有上層的中介軟體、作業系統、韌體等彈性軟體功能,有利於導入各種應用程式。

擴充彈性創造差異性

Zena CSS提供16組Armv9架構Cortex-A720AE處理器核心,並整合由Cortex-R82AE處理器驅動的安全島(Safety Island,隔壁的運算單元),提供故障管理、安全監控、系統控制與SoC開機等即時ASIL D等級處理能力。

至於GPU(繪圖處理器)、NPU(神經處理器)、ISP(圖像處理器,處理攝影機、光達資訊)等運算單元則可依需求自由選擇,提供較高的彈性。如果開發者需要更高的AI運算效能,還可以連接外部NPU或AI加速器,以帶來更豐富的AI應用程式。

Zena CSS提供預先整合、認證的運算平台,簡化晶片與軟體開發流程,有助於打造下一代AI定義車輛。

Zena CSS提供16組Armv9架構Cortex-A720AE處理器核心,並透過CMN S3AE提供處理器一致性與晶片互連(C2C)功能,並搭載由Cortex-R82AE驅動的安全島,提供故障管理、安全監控、系統控制與SoC開機等即時ASIL D等級處理能力。

Zena CSS提供預先驗證且標準化的開發環境,能夠降低開發成本與複雜度,並節省約20%工程資源,加速1年上市時程。

Zena CSS也為了滿足各車款差異化的ADAS、AI應用需求,能夠選擇搭配Arm Mali-C720AE ISP以及Mali GPU,並可以透過AMBA CHI等多種介面連接第三方AI加速器,簡化搭配合作夥伴專屬運算單元的設計流程。

Zena CSS也提供客製化彈性。舉例來說,當ADAS需要使用更多攝影機時,可以提高NPU與ISP的運算單元規模,而IVI需要更強的3D繪圖、使用者介面的話,則可提高GPU效能。如果要導入更多元AI應用程式,則可連接外部NPU或AI加速器強化AI運算效能。

過去開發者可以在雲端虛擬化驗證平台進行Cortex-A720AE、Cortex-R82AE等處理器驗證,這次則新增整組Zena CSS的驗證功能。

雲端虛擬化驗證平台的優勢在於可以在晶片尚未完成生產時,提前進行開發軟體與驗證,以縮短車輛的上市時程。

Zena CSS由Autosar、COVESA、eSync、Virtio等多項開放標準建構而成,且相容於SOAFEE軟體架構,目前已有General Motors、CARIAD、Continental、Tata Motors等多間業界領導品牌加入此計畫。

加入T客邦Facebook粉絲團
✇T客邦-Techbang

NVIDIA發表最新MLPerf訓練測試成績,GB200 NVL72提交所有測試成績

NVIDIA在媒體說明會最新MLPerf訓練測試成績,GB200 NVL72不但能夠完成所有測試項目,效能表現與成本效益也大大幅超越前代產品。59ea18ec87a4f61ec620bd449e6646ef

NVIDIA在媒體說明會最新MLPerf訓練測試成績,GB200 NVL72不但能夠完成所有測試項目,效能表現與成本效益也大大幅超越前代產品。

MLPerf訓練也全勤

MLPerf是由學術界、研究實驗室和業界人士共同組成組織旨在打造公正且能夠反映實際應用情境的AI運算測試基準。先前NVIDIA已經發表GB200 NVL72在MLPerf推論測試的表現,這次則是發表訓練測試的成績。

延伸閱讀:
NVIDIA發表GB200 NVL72之最新MLPerf推論測試成績,效能領先前代產品30倍
GTC 24:NVIDIA Blackwell AI運算平台架構解析,將72組GB200組成超大型GPU
GTC 24:Blackwell架構詳解!看懂B100、B200、GB200、GB200 NVL72成員的糾結瓜葛

MLPerf自2018年推出基準測試以來,這次已經是第12輪測試,NVIDIA推出的AI運算平台在每項測試皆有出色表現,且提交包含Llama 3.1 405B大型語言模型(Large Language Model,LLM)預訓練在內的所有項目成績,是唯一提交MLPerf Training v5.0基準測試所有項目測試結果的平台。

在全新的Llama 3.1 405B預訓練測試中,Blackwell GPU的效能較前代架構在相同規模下提升了2.2倍。而在Llama 2 70B LoRA微調測試中,搭載8組Blackwell GPU的NVIDIA DGX B200系統效能較前代架構使用相同數量GPU的測試結果提升2.5倍。

NVIDIA在MLPerf Training v5.0訓練測試中創下5項新記錄。

NVIDIA與合作夥伴提交超過50組GB200 NVL72測試成績。NVIDIA與CoreWeave、IBM合作的部分使用提交使用2,496組Blackwell GPU和1,248組 Grace CPU的成績,展現其Scale-Out擴展能力。

在相同數量GPU的條件下,Blackwell架構最高能領先前代Hopper架構達2.6倍。

比較單位成本的訓練效能,Blackwell架構也能達到Hopper架構的1.55倍。也就是說在相同花費下,Blackwell架構具有1.55倍的產出。

NVIDIA的強項在於整合NVLink、InfiniBand等匯流排與網路介面,讓Scale-Out的效率可以達到90%,。

NVIDIA表示這些由代理型AI驅動的應用程式需要仰賴AI工廠產生,而在資料中心電力供應有限的情況下,採用電力效率更高的AI運算單元代表著更高的產出,也將創造更高的產值。

加入T客邦Facebook粉絲團
✇T客邦-Techbang

AMD Radeon RX 9060 XT顯示卡效能實測:越級打怪帶來更佳性價比

AMD於Computex台北國際電腦展2025發表8 GB與16 GB等容量的Radeon RX 9060 XT顯示卡,讓我們來實際測試它的效能表現如何。A5121f64aa9224330396466abe579401

AMD於Computex台北國際電腦展2025發表8 GB與16 GB等容量的Radeon RX 9060 XT顯示卡,讓我們來實際測試它的效能表現如何。

8 GB針對1080p應用

AMD資深副總裁暨計算級圖型業務集團總經理Jack Huynh於Computex台北國際電腦展2025的產品發表會中,介紹採用RDNA 4繪圖架構的Radeon RX 9060 XT顯示卡,並宣佈於2025年6月5日發售。

延伸閱讀:
AMD發表萬元等級Radeon RX 9060 XT顯示卡,後續更新FSR Redstone升頻技術
AMD發表RDNA 4繪圖架構與Radeon RX 9070系列顯示卡,支援全新ML加持FSR 4升頻功能
AMD RDNA 4繪圖架構說明:2倍光柵繪圖、2.5倍光追、4倍AI的效能躍進之旅
RDNA 4繪圖架構之AI運算與FSR 4效能禁藥解析:遊戲FPS效能催上3.7倍
AMD Radeon RX 9070 XT系列顯示卡效能實測:最佳魔物獵人顯卡

Radeon RX 9060 XT具有32組RDNA 4繪圖架構的運算單元(CUs),並具有32組光線追蹤加速器與64組AI加速器,提供8 GB與16 GB等2種顯示記憶體容量選擇,AMD並不會推出公板卡,而是由各合作夥伴推出自製卡,台灣的官方建議售價為新台幣10,490、12,490元。

值得注意的是,Radeon RX 9060 XT採用PCIe Gen 5x16匯流排,並不像前代Radeon RX 7600 XT使用舊世代且通道數砍半的PCIe Gen 4x8。在影音輸出端子部分則支援HDMI 2.1b以及DisplayPort 2.1a UHBR13.5,並支援H.264(AVC)、H.265(HEVC)、AV1等影片格式的硬體加速編、解碼。

AMD遊戲解決方案架構長(Chief Architect of Gaming Solutions)Frank Azor在訪談中說明,8 GB版本的原因是針對1080p解析度遊戲應用規劃,大部分的遊戲能在在不超過記憶體容量限制的情況下流暢執行,讓玩家能在更划算的價格區間享受最高畫質、光線追蹤遊戲體驗。如果玩家想要提升到1440p解析度,則建議選擇16 GB版本,以免遊戲占用的記憶體超過容量限制,造成俗稱「爆VRAM」的效能衝擊。

(若手機版瀏覽器無法顯示表格,請點我看完整表格

Radeon RX 9000系列顯示卡規格簡表
顯示卡型號 運算單元數量 遊戲時脈 Boost時脈 Infinity Cache容量 顯示記憶體容量 記憶體介面 典型顯示卡功耗 發表當時價格
Radeon RX 9070 XT 64 2.4 GHz 3.0 GHz 64 MB 16 GB GDDR6-256bit 304 W $599
Radeon RX 9070 56 2.1 GHz 2.5 GHz 64 MB 16 GB GDDR6-256bit 220 W $549
Radeon RX 9060 XT 16 GB 32 2.53 GHz 3.13 GHz 32 MB 16GB  GDDR6-128bit 160 W $349
Radeon RX 9060 XT 8 GB 32 2.53 GHz 3.13 GHz 32 MB 8GB  GDDR6-128bit 150 W $299

筆者這次收到的16 GB容量板本樣品為GIGABYTE推出的Radeon RX 9060 XT GAMING OC 16G。

它採用GIGABYTE Windforce 3風扇散熱方案。

顯示卡尾端採用穿透式散熱設計,讓冷空氣穿透散熱鰭片帶來更理想的散熱效果。

影音輸出端子部分提供2組DisplayPort與1組HDMI。

8 GB容量板本樣品則為ASRock Radeon RX 9060 XT Challenger 8GB OC。

ASRock的Challenger系列則採用2風扇散熱方案。

其背面一樣搭載強化背板並採用穿透式散熱設計。

影音輸出端子部分提供2組DisplayPort與1組HDMI。

這2張顯示卡都使用1組PCIe 8-Pin電源輸入端子。

測試環境與條件

本次測試過程除了手動開啟EXPO功能,讓記憶體自動超頻至DDR5-6000之外,其餘BIOS / UEFI的設定皆維持預設值,Resizable BAR為開啟狀態。至於對照組部分,筆者選擇8 GB與16 GB的Radeon RX 9060 XT,對上競爭對手的GeForce RTX 5060 Ti,其中GeForce RTX 5060 Ti 16GB使用先前測試專題之成績,其餘3張顯示卡則為這次重新測試。

所有成績除了都是進行2輪測試,在確定沒有極端值後取平均,遊戲效能使用遊戲內建的測試模式,而《絕對武力2》使用CS2 FPS Benchmark工作坊地圖進行測試。

遊戲部分在1080p、2K、4K解析度搭配最高畫質設定,若有設定範本則套用最高範本,若無則將所有畫質相關項目調至最高,關閉VRS或動態解析度等設定,並僅進行開、關光線追蹤功能的調整。

測試平台:
處理器:AMD Ryzen 7 9800X3D
散熱器:MSI MEG Coreliquid S360
主機板:ASRock X870E Taichi(UEFI版號3.17.TS03 – AMD AGESA ComboAm5PI 1.2.0.3a)
記憶體:G.Skill Trident Z5 Neo RGB 16GBx2(@DDR5-6000)
顯示卡:GIGABYTE Radeon RX 9060 XT GAMING OC 16G,ASRock Radeon RX 9060 XT Challenger 8GB OC,MSI GeForce RTX 5060 Ti 16G VENTUS 2X PLUS,GIGABYTE GeForce RTX 5060 Ti WINDFORCE 8G
儲存裝置:Solidigm P44 Pro 1TB(系統碟)、Solidigm P41 Plus 1TB(遊戲碟)
電源供應器:MSI MEG Ai1300P PCIE5
軟體環境:Windows 11專業版24H2(Build 26100.3775),AMD Software Adrenalin Edition 25.10.09.01,GeForce Game Ready 576.40

測試平台之CPU-Z資訊。

8 GB與16 GB Radeon RX 9060 XT之GPU-Z資訊。

(下頁還有更多效能測試)

 

測試軟體分析

在效能測試前半段,我們先來看RX 9060 XT在3DMark與Procyon等測試軟體的表現如何。

需要注意的是這幾測試的顯示卡皆非公板卡,在時脈設定上可能會略高於官方規格,另一方面考量Radeon RX 9070 XT高達美金599元的價格,比Radeon RX 9060 XT的349元高出許多,因此將圖表中的對照組設定為價格分別為的379、429元的GeForce RTX 5060 Ti 8 GB與16 GB版本。

8 GB與16 GB容量的Radeon RX 9060 XT價格分別比GeForce RTX 5060 Ti低了21.11%、18.65%,在對照成績時也可以將價差納入考量,

若讀者想瞭解Radeon RX 9070 XT的效能表現,可以參考先前的效能測試專題

在電腦綜合效能測試的PCMark10中,雖然RX 9060 XT在遊戲的表現落後RTX 5060 Ti,但是在其他項目有所領先,因此總分還是能夠取勝。

3DMark Fire Strike採用Direct X 11繪圖API搭配1080p解析度(1920 x 1080),16 GB的RX 9060 XT在圖像分數落後RTX 5060 Ti約4.52%。

Fire Strike Extreme將解析度提升至2K(2560 x 1440),上述差距拉大到5.31%。

Fire Strike Ultra進一步將解析度提升至4K(3840 x 2160),RX 9060 XT則能夠反超領先1.4%。

3DMark Time Spy採用Direct X 12搭配2K解析度,16 GB的RX 9060 XT在圖像分數領先RTX 5060 Ti約5.07%。

Time Spy Extreme將解析度提升至4K,RX 9060 XT仍能維持3.34%的領先。

3DMark Port Royal採用DirectX Raytracing(DXR)光線追蹤繪圖技術搭配2K解析度,是考驗顯示卡光線追蹤效能的競技場。AMD陣營並沒有落後太多,16 GB的RX 9060 XT僅落後RTX 5060 Ti約4.92%,低於2者價差的18.65%。

Speed Way是採用DirectX 12 Ultimate繪API與DirectX Raytracing tier 1.1光線追蹤技術,具有全域照明與反射等效果,並透過Mesh Shaders進行效能最佳化,可以反映最新AAA大作遊戲的效能表現。16 GB的RX 9060 XT落後RTX 5060 Ti約27.61%,略大於2者價差。

Steel Nomad採用DirectX 12繪圖API搭配14K解析度,雖然不使用光線追蹤技術,但具有目前最高的繪圖運算負載,RX 9060 XT能夠領先RTX 5060 Ti約4.13%。

Solar Bay是跨Windows、Linux以及Android平台並納入光線追蹤的測試項目,使用Vulkan繪圖API,16 GB的RX 9060 XT落後RTX 5060 Ti約13.89%。

在DirectX光線追蹤技術的測試項目中,16 GB的RX 9060 XT落後RTX 5060 Ti約20.17%。

由於RX 9060 XT使用PCIe Gen 5x16匯流排,而RTX 5060 Ti僅使用PCIe Gen 5x8,因此前者的頻寬表現領先許多。

Procyon AI Computer Vision電腦視覺測試中,RX 9060 XT效能大約只有RTX 5060 Ti的一半。

在Procyon的AI Image Generation圖像生成部分,由於AMD陣營不支援INT8資料類型,故無成積。在這邊也能看到顯示記憶體容量對效能的影響頗大。

在占用顯示記憶體容量較小的SD 1.5模型中,8 GB與16 GB版本表現落差不大,但在量體較大的SDXL模型則影響甚巨,可以從圖像生成所花費的時間看出端倪。

Procyon AI Text Generation文字生成部分,由於8 GB的RTX 5060 Ti無法完成Llama 2測試項目故無成績。

8 GB的RX 9060 XT在FTFF(產生第1組字詞)速度表現明現落後許多。

每秒產生的字詞速度仍以NVIDIA陣容表現明顯領先。

遊戲效能測試

接下來我們繼續分析Radeon RX 9060 XT在實際遊戲的效能成績。

讀者可以注意8 GB與16 GB版本顯示卡在不同解析度的表現,在遊戲的顯示記憶體使用量尚未超過顯示卡提供的容量時,基本上2者的效能表現會趨於接近,一旦當超過之後,效能則會出現嚴重衰退。

在競技類的《絕對武力2》中,可以推斷遊戲使用的顯示記憶體較少,無論是RX 9060 XT或RTX 5060 Ti到了4K解析度,8 GB與16 GB版本的效能仍相當接近,整體以RTX 5060 Ti的效能表現較好。

《看門狗:自由軍團》關閉光線追蹤時,以RX 9060 XT的表現較好。16 GB版本在3種解度可以領先RTX 5060 Ti分別達1.36%、3.66%、6.25%。

《看門狗:自由軍團》開啟光線追蹤後,雙方陣營8 GB版本的效能皆受到影響。16 GB版RX 9060 XT落後RTX 5060 Ti分別達30.73%、36.23%、42.86%。

《極地戰嚎6》由於繪圖負擔較低,只有8 GB版RX 9060 XT在4K解析度的表現較低。

《極地戰嚎6》開啟光線追蹤後,雙方8 GB版的效能受到衝擊,但16 GB版RX 9060 XT與RTX 5060 Ti表現相當接近。

《戰慄深隧:流亡》關閉光線追蹤時,16 GB版RX 9060 XT落後RTX 5060 Ti約為4.21%、3.05%、1.74%。。

《戰慄深隧:流亡》開啟光線追蹤後,上述差距拉大到10.42%、10.14%、11.42,但仍低於價差的18.65%。

《刺客任務III》Dubai(杜拜)測試項目包含多種場景與NPC角色,整體負擔較低,16 GB版RX 9060 XT的表現與RTX 5060 Ti接近。

《刺客任務III》Dubai開啟光線追蹤後,16 GB版RX 9060 XT落後幅度也在5.69%之內。可以注意的是8 GB版RX 9060 XT在2K、4K解析度效能明顯滑落。

《刺客任務III》Dartmoor(達特穆爾)測試項目則包含許多槍枝射擊與爆炸效果,充滿物理與粒子模擬,對處理器的要求比較高,16 GB版RX 9060 XT落後RTX 5060 Ti的幅度約為14.9%、10.59%、7.79%。

《刺客任務III》Dartmoor開啟光線追蹤後,落後幅度反而縮小為7.16%、5.52%、1.2。同時也可以看到8 GB版RX 9060 XT在2K、4K解析度表現相當不理想,但1080p解析度還可接受。

《電馭叛客2077》關閉光線追蹤時,16 GB版RX 9060 XT落後RTX 5060 Ti約7.03%、5.04%、6.62%。

《電馭叛客2077》開啟光線追蹤後,16 GB版RX 9060 XT落後RTX 5060 Ti的差距擴大至10.49%、11.53%、13.01%。可以看到雙方8 GB版本都受到比校大的效能衝擊。

《黑神話:悟空》身為新一代效能殺手,16 GB版RX 9060 XT落後RTX 5060 Ti約18.28%、17.14%、15%。

《黑神話:悟空》開啟光線追蹤後,僅有RTX 5060 Ti在1080p解析度勉強接近FPS 30幀的最低門檻。

《魔物獵人:荒野》關閉光線追蹤的情況下,16 GB版RX 9060 XT領先RTX 5060 Ti約10.72%、7.53%、4.98%。因為8 GB RTX 5060 Ti在設定選單中就會當機而無法測試,故無成績。

《魔物獵人:荒野》開啟光線追蹤後,16 GB版RX 9060 XT依然保持7.86%、4.89%、3.2%的領先幅度。

《魔物獵人:荒野》在4K解析度、最高畫質設定、開啟光線追蹤的條件下,搭配FSR 3升頻與畫格生成,2種容量的RX 9060 XT都能讓FPS突破60幀。

萬元出頭新選擇

若以Radeon RX 9060 XT 16 GB美金349元的定價(台灣建議售價為新台幣12,490元)做為基準進行比較,自家的Radeon RX 9070 XT(16 GB)價格為599元,2者個價格與效能大約相差1倍,前者大約能夠滿足1080p與2K解析度的遊戲需求,若玩家有4K遊戲應用的需求,則建議購買後者。

若與競爭對手NVIDIA價格429元的GeForce RTX 5060 Ti 16 GB相比, GeForce RTX 5060 Ti在AI運算應用方式取得全面領先,2者在遊戲應用則互有輸贏,但Radeon RX 9060 XT在落後的項目幅度也沒有劣於雙方價差,因此判定具有相當性價比優勢。

從我們測試的結果來看2種顯示記憶體容量版本的Radeon RX 9060 XT在1080p解析度的效能表現幾乎一樣,但到2K解析度則有部分遊戲因超出記憶體容量上限而影響效能,因此如果讀者搭配1080p解析度的顯示器,且確定短期不會升級的話,也可以選擇價格便宜美金50元的Radeon RX 9060 XT 8 GB(台灣建議售價為新台幣10,490元)。

如果讀者對AI運算的需求比較高,例如會使用Stable Diffusion等AI圖像生成的話,則仍建議選擇NVIDIA陣營,且選擇顯示記憶體高於16 GB的型號,以取得較佳的效能,且避免容量不足而無法載入、執行AI模型。

 

加入T客邦Facebook粉絲團
✇T客邦-Techbang

Western Digital 預測儲存裝置趨勢,資料中心儲存需求增加3倍、傳統硬碟比例持平

Western Digital於Computex台北國際電腦展2025攤位導覽活動中邀請亞太地區高階主管於會場交流,並分析在AI浪潮下的儲存裝置產業發展趨勢。10c7d9cb894e44e0dd8e7a77a05efe51

Western Digital於Computex台北國際電腦展2025攤位導覽活動中邀請亞太地區高階主管於會場交流,並分析在AI浪潮下的儲存裝置產業發展趨勢。

生成式AI讓儲存需求大幅成長

Western Digital於活動邀請亞太地區和日本行銷銷售副總裁Stefan Mandl與產品管理暨消費者體驗資深總監Scott Hamilton分享對儲存裝置發展趨勢的觀察。隨著隨著AI、ML(機器學習)和資料密集型工作負載持續加速發展,企業面臨日益成長的儲存需求,需要建構可擴充、高效率且永續的彈性儲存基礎架構。

延伸閱讀WD發佈世界最大SMR疊瓦式硬碟:11張碟片 32TB

Stefan Mandl與Scott Hamilton在訪談中表示,隨著生成式AI將產生更多圖片與影片檔案,以及AI強化醫療、醫療影像等應用需求成長,預估2028年產生的資料容量將達現在的3倍,進一步推升對儲存裝置的需求。

而固態硬碟的使用成本在整個生命周期下為傳統硬碟的3.6倍,在企業考慮TCO(總體擁有成本)的因素下,在近4 ~ 5年之內企業使用固態硬碟與傳統硬碟的比例不會產生太大的變化。

Western Digital亞太地區和日本行銷銷售副總裁Stefan Mandl在導覽活動中說明產品。

Western Digital產品管理暨消費者體驗資深總監Scott Hamilton也補充說明許多趨勢觀查。

Ultrastar系列是為資料中心應用設計的傳統硬碟,提供1 ~ 26 TB容量選擇。

Ultrastar Data 102混合儲存平台能在4U的機架空間中提供高達3.06 PB的儲存容量。

Western Digital ArcticFlow技術為伺服器規劃3組獨立風道,第1組專為前方區域硬碟散熱。(綠、紅色分別代表冷、熱空氣)

此外還有針對後方區域硬碟以及I/O元件散熱的2組風道,強化整體散熱效率。

IsoVibe技術則是透過獨特設計的電路板吸收硬碟震動,搭配減震風扇,能夠有效降低硬碟故障率。

Western Digital的平台業務部門為客戶提供更高的彈性和選擇,確保客戶能夠獲得其儲存基礎架構的最佳選擇。

加入T客邦Facebook粉絲團
✇T客邦-Techbang

GIGABYTE更新AI TOP產品陣容,Z890主機板與CXL記憶體擴充卡登場

GIGABYTE於Computex台北國際電腦展2025展出多款AI Top新品,其中包括搭載Z890晶組的主機板,以及運算卡與CXL記憶體擴充卡。C02dac54fb61be5746ebe4cb24d62719

GIGABYTE於Computex台北國際電腦展2025展出多款AI Top新品,其中包括搭載Z890晶組的主機板,以及Radeon AI Pro R9700AI TOP 32G運算卡與CXL記憶體擴充卡。

CXL擴充更多記憶體

GIGABYTE於去年Computex台北國際電腦展推出AI TOP解決方案,目標客群為需要處理機敏資料、自行訓練AI模型的中小企業,透過完整的硬體系統與軟體功能,簡化訓練模型的流程。

延伸閱讀:
AMD推出Ryzen Threadripper PRO WX系列處理器與Radeon AI PRO R9700運算卡,滿足工作站應用需求
【Computex2024】GIGABYTE推出AI TOP解決方案,解決中小企業模型訓練痛點
【GTC 24】Phison推出aiDAPTIV+解決方案,解決大型AI模型VRAM不足問題

AI TOP的目標並不是提供最高的AI訓練效能,而是為預算較敏感的使用者提供性價比更出色的解決方案,並與Phison合作透過aiDAPTIV+技術讓系統在進行AI訓練運算的過程除了使用顯示記憶體之外,也能使用系統主記憶體甚至是固態硬碟的儲存空間,讓使用者能透過擴充記憶體的方式在等級較低的顯示卡、運算卡環境容納參數量更龐大的AI模型,雖然對效能有所衝擊,但可以大幅降低系統建置成本。

GIGABYTE這次推出的TOP 100 Z890系統搭載Z890 AORUS XTREME AI TOP主機板,採用Z890晶片組並支援Intel Core Ultra 200系列處理器,最高支援容量達的256 GB記憶體,並提供2組PCIe Gen 5x16插槽,能夠安裝2張顯示卡或運算卡。

而AI TOP 500 TRX50系統則搭載TRX50 AI TOP主機板,採用TRX50晶片與sTR5腳位,能夠支援AMD Ryzen Threadripper PRO 7000 / 9000系列處理器,支援容量達的2 TB記憶體以及4組PCIe Gen 5x16插槽,具有更高的擴充性。

如果使用者需要更大的記憶體容量,則可參考新推出的AI TOP CXL R5X4擴充卡,它最多能安裝容量達384 GB的記憶體,並透過CXL(Compute Express Link)協定將此容量併入池化記憶體空間,雖然效能折損較大,但存取頻寬仍高於固態硬碟,且沒有寫入壽命磨損的問題,也不失為擴充記憶體的替代方案。

AI TOP 100 Z890系統搭載Z890 AORUS XTREME AI TOP主機板,提供4組DDR5 DIMM插槽,最高支援256 GB記憶體總容量。

AI TOP 500 TRX50系統則搭載TRX50 AI TOP主機板,具有8組DDR5 RDIMM插槽,支援總容量達2 TB的ECC Registered記憶體。

AI TOP CXL R5X4擴充卡採用CXL協定,提供4組DDR5 RDIMM插槽,最高能夠擴充384 GB記憶體。

AI TOP CXL R5X4採用PCIe Gen 5x16匯流排與主機板連接,處理器透過CXL協定存取安裝於擴充卡的記憶體。

GIGABYTE也更新AI TOP的軟體功能,其中包含可以直接在軟體介面下載Hugging Face上的AI模型,操作上更加方便。

雙槽R9700運算卡

GIGABYTE也在會場中展示了採用AMD Radeon AI PRO R9700 GPU(繪圖處理器)的運算卡,單卡提供32 GB的顯示記憶體,若在系統中安裝4張運算卡即可讓顯示記憶體總容量達到128 GB,並且可以搭配aiDAPTIV+技術進一步擴充容量。

Radeon AI Pro R9700AI TOP 32G運算卡採用AMD Radeon AI PRO R9700 GPU。

它採用鼓風扇散熱方案,適合安裝在多卡併存的工作站或伺服器。

電源輸入部分採用12V-2x6端子,有利於在狹窄空間理線。

AI TOP系統還有另一個小小的特色,就是將系統總功耗控制在1600W以內,以符號一般家庭、辦公室的供電迴路上限,能夠直接插在一般110V電壓的插座使用,而不像部分功耗更高的伺服器可能需要拉設專線才能滿足供電需求,大幅降低使用門檻。

加入T客邦Facebook粉絲團
✇T客邦-Techbang

Tools for Humanity於台灣推出World真人驗證服務,推動Worldcoin虛擬貨幣生態系統

Tools for Humanity正式於台灣推出World驗證服務,使用者可以到World Space實體據點進行認證並取得World ID,以驗證的帳號持有者的身份為真實人類。196016b3bd46649ef8975a0519e69bdf

Tools for Humanity正式於台灣推出World驗證服務,並舉行說明會解釋運作概念,使用者可以到World Space實體據點進行認證並取得World ID,以驗證的帳號持有者的身份為真實人類。

需到實體據點認證

Tools for Humanity是間總部為於美國舊金山的公司,其成立的宗旨為加速更公正的經濟體系轉型,而它們推出的World則目標在成為全球最大、最具包容性的金融公共事業與人類身分系統,並提供所有人使用。

延伸閱讀:山姆•阿特曼的「Worldcoin」改名為 「World」,並展示新一代虹膜掃描儀 Orb 來聚焦「人類驗證服務」

World由OpenAI執行長Sam Altman與Tools for Humanity執行長Alex Blania共同開發的人類數位身分網路,能夠讓帳號持有者在網路活動的過程中,在不揭露身分的前提下證明自己是真實且獨一無二的人類。

World服務可以細分為World ID、Orb、World App等3個主要項目。其中World ID為注重隱私保障的真人證明機制,可以讓使用者在不分享個人詳細資料的情況下,證明其為真正人類,而非機器人或AI,有助於防止網路詐騙與偽造帳號。

Orb則是能夠掃描使用者虹膜的裝置,以在建立帳號的過程確認使用者是真人,且沒有重複申請帳號,以確保每組World ID都對應到唯一且真實的人類。

World App是能讓使用者管理World ID、安全登入網站與應用程式,使用者也可以透過它來管理、使用Worldcoin虛擬貨幣。

自World 於2023年7月正式推出以來,全球已有超過1,200萬通過Orb驗證的World ID持有者,以及有2,700萬人下載World App並完成3.9億筆交易。

Tools for Humanity資訊安全長(Chief Information Security Officer)Adrian Ludwig透過視訊方式介紹World服務。

World的運作流程為下載World App,並到實體據點以Orb進行認證,接著就可以透過World App使用Worldcoin虛擬貨幣並於網路驗證身份。

Orb透過掃瞄虹膜的方式確認使用者是真人。

經過認證後,就可以確定每組World ID都對應到唯一且真實的人類。

台灣設立3處認證據點

Tools for Humanity台灣區總經理許鈞洋也在會中說明World在台灣的營運狀況,他說明過去1年內台灣各類詐騙造成新台幣2,395億元的財務損失,其中最常見詐騙手法依序為身分盜用為、是購物詐騙、冒充親友或企業。

許鈞洋引述根據Ipsos(益普索市場研究)於台灣進行的全國性調查,結果中有97% 的受訪者支持科技公司開發驗證真實人類身分的創新方法,也有高達90%的受訪者表達對深度偽造技術影響生活的擔憂,展現真人認證技術的市場潛力。目前Razer已將此技術應用於驗證線上遊戲玩家是否為真人,而Match Group也將此技術應用於驗證Tinder交友軟體使用者是否年滿18歲。

目前台灣已經在台北市的大巨蛋、CIT台北創新中心、N24台北方舟區塊鏈創新育成基地等3處設有World ID認證據點,方便使用者進行認證手續。

在向Adrian Ludwig提問的活動環節中,他在回答問題時目前台灣尚無實際應用案例,但已與多個單位商討合作事宜,只是當下時間點尚無法公開更多資訊。

Tools for Humanity台灣區總經理許鈞洋負則說明台灣營運狀況。

《數位時代》創新長James Huang也於現場展示透過Orb進行身份認證。

Orb的造型相當前衛,基本上就是顆銀色金屬光澤的球體。

Orb由多組鏡頭構成,能夠掃瞄使用者眼睛並辨識虹膜的特徵,以判定是否先前已申請World ID。

World以中心化方式打造去中心金融的矛盾

在筆者提問關於Worldcoin虛擬貨幣的發行與管理問題時,Adrian Ludwig僅含糊回答可以參考白皮書,表示Worldcoin的發行數量有上限,且會採用去中心化的方式管理,並未正面回答問題。

根據World白皮書說明,Worldcoin的治理並非單純使用比特幣(Bitcoin)的工作量證明(PoW)機制,或以太坊(Ethereum)的權益證明(PoS),而是結合權益證明與「真人證明」(One Person One Vote)的方式進行,目前暫由World Foundation團隊擔任該管理者,並預計在未來徵集提案並開放社群治理。

至於獲得Worldcoin的方式,為使用真人驗證的使用者可在建立帳號時獲得16枚代幣,並在每個循環周期獲得定量代幣(以2025年4月為例,每月可獲得2.98枚代幣,將隨時間推移而減少)。而使用護照驗證的使用者則可獲得8枚帳號獎勵代幣以及1.49枚循環周期代幣。治理機制可能會在日後進行調整。

在15年的發行時間結束後,代幣的分配狀態為World Foundation團隊與投資者分別持有11.1%、13.6%,並保留0.3%做為儲備金,剩下的75%則分配給社群。

白皮書中並沒有明確指出權益證明與真人證明等機制如何協同運作,而且也沒有明確指出哪些項目、規則將開放給社群治理。另一方面World Foundation團隊與投資人握有近25%的代幣,再加上他們也實際擁有「中心化」的真人驗證管理與營運的權限,因此整個生態系統並非以完全去中心化的方式運作。

另一方面,在查閱World ID的運作流程方塊圖時,筆者也發現在整個運作過程中只有在建立帳號的過程會透過Orb裝置確認申請者是真人且無重複申請,但在將真人認證綁定至World ID之後,就不會再透過類似Orb的裝置確認登入或使用該帳號的人是否為當初認證的同一人,因此還是容易發生World ID被冒用的資安風險。

值得注意的是,官方提供的World App參考圖片中,在正體中文的操作介面中竟混入簡體中文。以中國嚴格控管網路的慣例來看,實在不太可能會開放設立驗證據點,以及讓World App、Worldcoin在「自由、自主、不被竊聽」的狀態下運作。

身兼OpenAI執行長以及Tools for Humanity共同創辦人的Sam Altman應該深刻瞭解這點限制,可以合理推斷他們應該不會考慮進入中國市場。至於為什麼App介面會出現簡體中文,就顯得相當耐人尋味。

James Huang與Adrian Ludwig透過視訊對談,現場也開放向Adrian Ludwig提問。

Worldcoin的發行時程規劃,其發行時間長達15年,並在達到發行上限後停止「鑄造新幣」。

代幣的分配狀態為World Foundation團隊與投資者分別持有11.1%、13.6%,儲備金0.3%,剩下的75%則分配給社群。

World ID的運作流程方塊圖,從圖中可以看到在使用World App或第三方App的時候,系統並不會認證操作者是否為帳號持有者本人。

官方提供之World App運作展示圖片。直得玩味的是左方手機頂部顯示的文字為簡體中文。

更多關於World的資訊可以參考官方網站,以及白皮書

加入T客邦Facebook粉絲團
✇T客邦-Techbang

j5Create推出全新Thunderbolt 5擴充底座搭載獨立顯示晶片,還有iPhone無線蟲洞(Wormhole)等周邊

j5Create在Computex台北國際電腦展2025展出多款會議系統、AI錄音器、直播控制台等產品,筆者針對比較有特色的Thunderbolt、USB周邊產品介紹。E8cc7e2146782363e762a6e1550a5824

j5Create在Computex台北國際電腦展2025展出多款會議系統、AI錄音器、直播控制台等產品,筆者針對比較有特色的Thunderbolt、USB周邊產品介紹。

Thunderbolt 5擴充底座搭載獨立顯示晶片

j5Create的強項之一就是多樣的Thunderbolt、USB周邊裝置,這次出的Thunderbolt 5 Docking Station採用頻寬高達120Gbps的Thunderbolt 5介面,不但提供一般擴充底座常見的功能,還提供MXM介面顯示晶片,以及M.2 2280固態硬碟等擴充功能。

延伸閱讀:
【CES2025】j5create推出AI錄音器,即時同步手機產生逐字稿與摘要
【Computex2024】j5create推出全新4K直播導播機,多功能智慧型手機擴充底座
j5create JCH422分享器:iPhone / iPad 和 Windows 直接傳輸資料、共享螢幕的好工具

Thunderbolt 5 Docking Station提供1組上行與2組下行Thunderbolt端子,此外還有2組USB 3.2 Gen 2端子,以及OCuLink、DisplayPort、HDMI、2.5GbE乙太網路端子各1組,最高支援8K60p或4K144p解析度輸出。

比較特別的是它能夠安裝1組MXM介面顯示晶片(常用於筆記型電腦),以及1組M.2 2280尺寸的固態硬碟,提供擴充顯示、AI效能以及儲存空間的功能。不過基於供電與產品規劃,顯示晶片不會開放使用者自行安裝或更換,目前開發中接段也尚未決定搭配的顯示晶片型號,而固態硬碟則可自由更換。

Omin Side Deck則是能夠相容多種掌上型電腦、遊戲主機的USB Type-C介面擴充底座,它支援4K60p解析度的HDMI影音輸出與100 W Power Delivery充電功能,此外還提供3組USB 3.2 Gen 1端子與1組GbE乙太網路端子。

值得注意的是,Omin Side Deck連接掌上型電腦的端子採可拆卸的活動式纜線設計,除了可以對應Steam Deck、Asus ROG Ally、Nintendo Switch等以及類似裝置,也可以將纜線取出連接筆記型電腦,具有廣汎的連接相容性。

Thunderbolt 5 Docking Station擴充底座採用金屬材料外殼,搭配頻寬高達120Gbps的Thunderbolt 5介面,並搭載MXM介面顯示晶片。

擴充底座正面具有1組上行與2組下行Thunderbolt端子。

背面則有2組USB 3.2 Gen 2端子,以及OCuLink、DisplayPort、HDMI、2.5GbE乙太網路端子各1組。

擴充底座頂部可以自由安裝1組M.2 2280尺寸的固態硬碟。(目前開發樣品尚未實裝M.2插槽)

Omin Side Deck是針對掌上型電腦、遊戲主機設計的USB Type-C介面擴充底座。

它採用可拆卸的活動式纜線設計,可以調整位置、角度或拆下以對應不同裝置、或筆記型電腦,具有廣汎的連接相容性。

機身後方提供HDMI、GbE乙太網路、USB 3.2 Gen 1端子各1組,左方則有2組USB 3.2 Gen 1。

右側則是電力輸入端子。

無線蟲洞連接電腦與iPhone

j5create的Wormhole(蟲洞)系列產品為跨裝置、跨平台的連接解決方案,先前也推出多款產品,讓使用者能在電腦上控制另一台電腦、手機、平板電腦等裝置。

這次展出的Wormhole Switch CrossLink Wireless Dongle外觀有如USB隨身碟,其本體相當嬌小,但搭配太空人造型的保護套,讓人想起多年前流行的造型隨身碟,使用者將電腦與它配對後,就能夠分享鍵盤滑鼠與螢幕,並交換檔案。

舉例來說,使用者能將iPhone變成電腦的延伸螢幕,或是將將iPhone的畫面投影至電腦,並在任一裝置進行雙向操作,大幅提高跨裝置操作方便性。

Wormhole Switch CrossLink Wireless Dongle透過無線方式讓電腦與iPhone與iPad等iOS裝置相連,能夠分享鍵盤滑鼠與螢幕,並交換檔案。

它能讓iPhone變成電腦的延伸螢幕。

也能反過來將iPhone的畫面投影至電腦,並由電腦操作iPhone。

使用者能透過電腦的鍵盤、滑鼠操作iPhone並輸入文字,提高跨裝置操作方便性。

j5create也推出多款外接儲存裝置、擴充集線器、無線充電器等周邊產品,更多資訊可以參考官方網站

加入T客邦Facebook粉絲團
✇T客邦-Techbang

土砲掌上型電腦Interrupt,內裝Raspberry 2 Zero W功能也能DIY

Interrupt是款以Raspberry 2 Zero W開發板為基礎的掌上型電腦,它採用Linux作業系統,使用者也能夠自行開發軟體以擴充更多功能。8f72fcce5246460be321640edb39be3a

Interrupt是款以Raspberry 2 Zero W開發板為基礎的掌上型電腦,它採用Linux作業系統,使用者也能夠自行開發軟體以擴充更多功能。

有如黑莓機的樹莓板

Interrupt是款為科技宅宅設計的多功能裝備,整合多項趣味十足的功能與小工具,提供簡潔、多功能的開發平台,能夠滿足多種物聯網裝置的原型設計、硬體研發、滲透測試(Penetration Test)https://zh.wikipedia.org/zh-tw/%E6%B8%97%E9%80%8F%E6%B5%8B%E8%AF%95的使用需求。

延伸閱讀:
LILYGO T-Deck Pro土砲電子紙傳呼機,透過LoRa網路傳送文字訊息
Pi Tin套件把Raspberry Pi Zero 2 W打造掌上型遊戲機,還可用糖果罐做機殼

Interrupt使用Raspberry 2 Zero W開發板作為硬體核心,機身正面具有1組尺寸與解析度分別為3.5吋、480 x 320的IPS面板電容觸控液晶螢幕,以及QWERTY實體鍵盤,提供GPIO、microSD讀卡機、Wi-Fi 5、藍牙等功能,並內建容量達2000mAh的3.7 V鋰聚合物電池,

Interrupt也整合CC1101無線射頻晶片,能夠接收與發送頻頻介300~928 MHz的數位訊號,此外它也具有RFID / NCF功能,可以拷貝多種門禁卡、會員卡等RFID與NCF裝置。至於家中的電器,則透過紅外線收發器操作,使用者可以讓Interrupt學習電器遙控器的訊號,並當作萬用遙控器使用。

Interrupt是款以Raspberry 2 Zero W開發板為基礎,並搭載實體鍵盤的土砲迷你電腦。

它具有GPIO、無線射頻、RFID、NCF、Wi-Fi 5、藍牙、紅外線等多種通訊功能。

舉例來說,Interrupt可以透過無線射頻當作遙控器打開鐵捲門。

也可以透過RFID / NCF功能拷貝門禁卡。

Interrupt可以學習電器遙控器的訊號,並當作萬用遙控器使用。

Interrupt規格簡表。

Interrupt的預定上市日期為2025年8月,預定售價為美金199元(約合新台幣6,100元)。

加入T客邦Facebook粉絲團
✇T客邦-Techbang

路由器的WPS按鈕功能解析:一鍵連Wi-Fi背後潛在的風險

路由器WPS按鈕提供快速連網的便利,但也存在PIN碼洩露的安全風險。了解WPS功能,保護您的網路安全至關重要。7100c28d5754c24ce998b41702035be2

在許多家用無線路由器(Wi-Fi 分享器)的背後或側面,通常都有一個小小的按鈕,標示著「WPS」。你可能看過它,但從未真正使用過,甚至不知道它的用途。這個按鈕代表著 Wi-Fi Protected Setup(Wi-Fi 安全防護設定),它旨在簡化裝置連接到無線網路的步驟。然而,這個為了方便而生的功能,卻也伴隨著不容忽視的資安風險。

WPS按鈕是什麼?

WPS是由Wi-Fi聯盟(Wi-Fi Alliance)於2006年推出的一項無線網路安全標準,旨在幫助不熟悉網路設置的用戶輕鬆將設備連接到Wi-Fi網路。WPS的主要功能是簡化連線流程,無需輸入複雜的Wi-Fi密碼。透過WPS,用戶只需按下路由器上的WPS按鈕或輸入特定的PIN碼,就能讓設備快速連接到網路。這種設計特別適用於連線智慧電視、印表機、遊戲主機等不方便輸入密碼的設備。

WPS提供兩種主要的連線方式:

  1. 按鈕配置(Push-Button Configuration, PBC):用戶按下路由器上的WPS按鈕,隨後在設備上啟動WPS功能,兩者在短時間內(通常為2分鐘)自動完成配對與連線。

  2. PIN碼方式:路由器或設備上提供一個8位數的PIN碼,用戶在設備或路由器設置頁面輸入此碼以完成連線。

根據Wi-Fi聯盟的數據,WPS的推出顯著提高了家庭Wi-Fi網路的安全性,在其問世之前,超過70%的家庭網路未使用任何加密保護。然而,隨著網路安全威脅的演進,WPS的設計缺陷也逐漸暴露。

WPS的便利性與應用場景

WPS按鈕的最大優勢在於其簡單與快速。對於不熟悉網路設置的用戶來說,手動輸入由字母、數字和符號組成的長密碼可能是一項挑戰。WPS讓這一過程變得輕鬆,特別是在以下場景中:

  • 快速連線新設備:例如,將新購買的智慧電視或無線印表機連接到Wi-Fi網路,只需按下WPS按鈕即可完成設置。

  • 訪客網路存取:當朋友或訪客需要使用Wi-Fi時,WPS提供了一個便捷的方式,讓他們無需知道主網路密碼。

  • 多設備管理:在需要同時連線多個設備時,WPS可以大幅縮短設置時間。

根據2022年Vanson Bourne的一項調查,平均每個家庭有超過10個設備連接到Wi-Fi網路,WPS的快速配對功能在這樣的環境中顯得尤為實用。

隱藏的風險:WPS的安全漏洞

儘管WPS提供了便利,但其安全問題也引起了廣泛關注。早在2011年,安全研究人員Stefan Viehböck和Craig Heffner獨立發現了WPS的重大漏洞,這些漏洞使得WPS成為駭客攻擊的潛在目標。以下是WPS的主要安全風險:

  1. PIN碼的暴力破解風險: WPS的PIN碼方式使用8位數字,表面上看似有100,000,000(10^8)種組合,但實際上PIN碼被分成兩個4位數部分進行驗證,第一部分有10,000種可能,第二部分有1,000種可能,總共僅需11,000次嘗試即可破解。駭客使用如「Reaver」等工具,能在數小時內透過暴力破解取得WPS PIN碼,進而獲取網路的WPA/WPA2密碼。

  2. 按鈕模式的物理存取風險: 雖然按鈕模式(PBC)相對安全,因為它要求實體存取路由器並在短時間內完成連線,但這也意味著任何能接觸到路由器的人(如訪客或未經授權的人員)都可以輕鬆連接到網路。對於家庭或小型辦公室來說,這可能導致未授權設備存取網路。

  3. 路由器實作的缺陷: 許多路由器製造商在WPS的實作上存在問題。例如,某些路由器即使在設置中顯示已停用WPS,實際上仍可能保持啟用狀態。此外,部分路由器在多次PIN碼輸入錯誤後不會自動鎖定,給予駭客無限次嘗試的機會。

  4. 不支援現代設備: 由於安全問題,部分現代設備和作業系統已放棄WPS支援。例如,Google自Android 9起移除WPS功能,Apple的macOS和iOS設備也從未支援WPS,認為其安全性不足。

根據2022年Ekran System對滲透測試人員的調查,47%的測試者在12小時內成功破解了WPS安全設置,顯示其脆弱性不容忽視。

如何安全使用WPS?

為了平衡WPS的便利性與安全性,用戶可以採取以下措施:

  • 在不使用時停用WPS:完成設備連線後,立即透過路由器管理介面(通常在192.168.1.1或192.168.0.1)關閉WPS功能。步驟通常為:登入路由器管理頁面,前往「無線設置」或「WPS」選項,選擇「關閉」或「停用」。

  • 優先使用按鈕模式:按鈕模式比PIN碼方式更安全,因為它要求實體存取路由器,且連線窗口僅持續2分鐘。

  • 更新路由器韌體:定期檢查並更新路由器韌體,以修補已知的WPS漏洞。許多製造商已透過韌體更新新增錯誤嘗試鎖定功能,限制暴力破解的可能性。

  • 限制路由器實體存取:將路由器放置在安全的物理位置,防止未授權人員觸碰WPS按鈕。

  • 考慮禁用WPS的路由器:如果安全性是首要考量,可選擇不支援WPS的路由器,或使用Wi-Fi Easy Connect等更安全的替代方案(如掃描QR碼進行連線)。

結論

WPS按鈕是一個便利的工具,旨在簡化Wi-Fi網路的連線過程,尤其對技術門檻較高的用戶來說是一大福音。然而,其設計上的安全漏洞和潛在的攻擊風險使得用戶必須謹慎使用。透過停用WPS、更新韌體和限制物理存取等措施,用戶可以在享受便利的同時最大程度降低安全風險。

隨著網路安全威脅的不斷演進,Wi-Fi聯盟和設備製造商正在推廣更安全的連線方式,例如Wi-Fi Easy Connect。對於現代用戶來說,了解WPS的優缺點,並根據自身需求選擇是否使用這項功能,是保護家庭網路安全的重要一步。在這個數位時代,便利與安全之間的平衡,永遠是我們需要深思的課題。

加入T客邦Facebook粉絲團
✇T客邦-Techbang

《毀滅戰士:黑暗時代》光線追蹤反射、全域照明搶先看,還會透過更新追加路徑追蹤技術

由id Software開發的《毀滅戰士:黑暗時代》是經典第一人稱射擊遊戲的最新作,它採用最新id Tech 8遊戲引擎,支援多項先進光線追蹤技術。Ce9152994caaa79d66480b5a9bfe01b8

由id Software開發的《毀滅戰士:黑暗時代》是經典第一人稱射擊遊戲的最新作,它採用最新id Tech 8遊戲引擎,支援多項先進光線追蹤技術。

(本文使用之《毀滅戰士:黑暗時代》遊戲序號由NVIDIA贊助提供)

全新遊戲引擎帶來逼真光照

id Software於1992年利用id Tech 0遊戲引擎製作《德軍總部3D》(Wolfenstein 3D),而1993年推出的id Tech1引擎則應用於初代《毀滅戰士》(Doom)。過了32個年頭後,id Tech 8引擎將隨著《毀滅戰士:黑暗時代》(Doom: The Dark Ages)於2025年5月15日推出。

延伸閱讀:《毀滅戰士:永恆》超狂1,000FPS設定選項,化身毀滅戰士虐殺惡魔

毀滅戰士系列起源於1993年,最初以DOS作業系統為平台,並以2.5D點陣圖方式描繪立體的遊戲畫面。在2016年「重開機」之後,推出《毀滅戰士》(Doom)及《毀滅戰士:永恆》等作品,而《毀滅戰士:黑暗時代》為上述2款遊戲的前傳,玩家將化身眾神及諸王的人間兵器,從惡魔橫行的戰場中殺出一條血路。

在id Tech 8引擎的加持下,《毀滅戰士:黑暗時代》支援多項先進光線追蹤技術。其中光線追蹤反射(Ray-Traced Reflections)會將「光線」從遊戲引擎的攝影機投射出去,經過多次反射和折射後達到畫面上每個像素,並計算光線在不同物質表面的反射狀況,能夠精確模擬光澤反射、漫反射和鏡面強光(Specular Highlight)等複雜現象。

光線追蹤全域照明(Ray-Traced Global Illumination)會將場景中直接照射以及透過反射、折射和散射產生的間接光射納入考慮,透過追蹤光線路徑來模擬真實的光照,能夠產生柔和陰影(Soft Shadow)、滲色(Color Bleeding)以及細膩的陰影變化,尤其能夠達成與真實世界的光照效果高度相似的戶外場景。

路徑追蹤(Path Tracing)即為俗稱的「全光線追蹤」,會考慮整個場景中所有可能的光線路徑,並精確模擬場景中的所有光線,達到更逼真的光影效果。不過因為這項技術的運算量非常龐大,因此NVIDIA表示需要透過GeForce RTX系列的RT Core(AI核心)進行運算,搭配DLSS 4升頻技術,才能達成在遊戲中即時運算的需求。

不過需要注意的是,《毀滅戰士:黑暗時代》在上市時並不會實裝路徑追蹤功能,將會在日後的遊戲更新中提供。

▲參考方宣傳影片,《毀滅戰士:黑暗時代》遊戲畫面的光影效果相當逼真。

從實際遊戲畫面中可以看出環境光在盔甲上的照明效果。

觀察主角手上的槍械,離光源較遠的時候槍管的反光較不明顯。

走近一點就可以看到光源照射所產生的金屬質感。

當環境光源比較複雜時,光線追蹤繪圖技術能繪製更逼真的環境光照效果。

《毀滅戰士:黑暗時代》效能實測

由於《毀滅戰士:黑暗時代》遊戲並沒有內建效能測試工具,因此筆者在特定場景手動操作,進行完整戰鬥後讀取存檔重覆進行2次,並使用NVIDIA FrameView測量FPS數據,確定沒有極端值後取平均作為成績。

測試過程使用GeForce RTX 5090顯示卡,搭配4K解析度、最高畫質的「超狂惡夢」範本,並開、關DLSS 4測試遊戲FPS表現,開啟DLSS 4時搭配「平衡」超解析度以及「4X」畫格生成。

從測試結果可以看到,在關閉DLSS 4的情況下,平均FPS只有48.887幀,在開啟DLSS 4搭配4X畫格生成後,平均FPS達到307.771幀,而1% Low FPS也達到263.178幀,且肉眼目視與操作感受階相當流暢,也感受不到操作延遲,能夠確保舒適的遊玩體驗。

測試平台:
處理器:AMD Ryzen 7 9800X3D
散熱器:MSI MEG Coreliquid S360
主機板:ASRock X870E Taichi(UEFI版號:3.17.TS03 – AMD AGESA ComboAm5PI 1.2.0.3)
記憶體:G.Skill Trident Z5 Neo RGB 16GBx2(@DDR5-6000)
顯示卡:NVIDIA GeForce RTX 5090 Founders Edition
儲存裝置:Solidigm P44 Pro 1TB(系統碟)、Solidigm P41 Plus 1TB(遊戲碟)
電源供應器:MSI MEG Ai1300P PCIE5
軟體環境:Windows 11專業版24H2(Build 26100.3775),GeForce Game Ready 576.40

測試過程使用5090,搭配576.40預覽版驅動程式。

《毀滅戰士:黑暗時代》遊戲畫質設定為最高的「超狂惡夢」範本。

測試過程分別選擇TAA(即關閉DLSS),以及選擇DLSS 4搭配「平衡」超解析度以及「4X」畫格生成。

▲測試過程在固定場景手動操作,記錄戰鬥全程的FPS數據。

在開啟DLSS 4的情況下,4K解析度、最高畫質的平均FPS超過300幀,DLSS提升效能的效果相當顯著。

《毀滅戰士:黑暗時代》將於2025年5月15日上市,在上市時並不會實裝路徑追蹤,也尚未宣佈更新日期,期待更新後能夠帶來更逼真的光照效果。

加入T客邦Facebook粉絲團
✇T客邦-Techbang

GIGABYTE推出BIRX GB-BRU7-255H迷你電腦,0.46公升小尺寸搭載Core Ultra 7 255H

GIGABYTE BIRX GB-BRU7-255H迷你電腦體積僅有0.46公升,最高搭載Intel Core Ultra 7 255H處理器,並可安裝2組固態硬碟。2f5aa878336fa4061f655ee47cfec551

GIGABYTE BIRX GB-BRU7-255H迷你電腦體積僅有0.46公升,最高搭載Intel Core Ultra 7 255H處理器,並可安裝2組固態硬碟。

雙RAM加雙SSD

GIGABYTE推出GB-BRU7-255H與GB-BRU5-225H等BIRX迷你電腦,尺寸為11.26 x 3.44 x 11.94 cm,體積約為0.46公升。2個型號分別搭載Intel Core Ultra 7 255H與Core Ultra 5 225H等處理器,前者為6P+8E+2LPE核心配置,共16條執行緒,後者則少了2組P-Core核心,共有14條執行緒,2者TPD皆為28W。

延伸閱讀:CWWK推出X86-P6 Pocket NAS迷你電腦,搭載Intel Core 3 N355處理器與4組M.2插槽

在內部擴充性部分,這2款電腦具有2組SO-DIMM插槽(支援CSO-DIMM模組),最高支援雙通道96GB DDR5-6400記憶體,並具有2組M.2 2280 M Key插槽,第1組支援PCIe Gen 5x4,第2組則支援PCIe Gen 4x4或SATA,此外還有用於安裝無線通訊模組的M.2 2230 E Key插槽(已預先安裝Realtek RTL8922AE)。

I/O端子部分,機身前方具有2組USB 3.2 Gen2,以及USB 3.2 Gen2 Type-C、耳機麥克風複合端子各1組,後方則有2組HDMI 2.1,以及USB 3.2 Gen2、USB 3.2 Gen2 Type-C(支援Alternate Mode)、USB 2.0、2.5 GbE RJ-45、USB Type-C電力輸入(100W Power Delivery)等端子各1組。

GIGABYTE GB-BRU7-255H與GB-BRU5-225H是BIRX系列迷你電腦,體積約為0.46公升。

最高搭載6P+8E+2LPE核心、共16條執行緒的Intel Core Ultra 7 255H處理器,並搭配具有8組Xe-core的Arc 140T內建顯示晶片。

機身內部可以安裝SO-DIMM記憶體、M.2 2280固態硬碟各2組,並可安裝M.2 2230無線通訊模組。

機身前方具有2組USB 3.2 Gen2,以及USB 3.2 Gen2 Type-C、耳機麥克風複合端子各1組。

機身後方則有2組HDMI 2.1,以及USB 3.2 Gen2、USB 3.2 Gen2 Type-C、USB 2.0、2.5 GbE RJ-45、USB Type-C電力輸入(100W Power Delivery)等端子各1組。需要注意的是,官方圖片中USB 3.2 Gen2 Type-C應誤植為Thunderbolt 4端子。

其USB 3.2 Gen2 Type-C支援Alternate Mode顯示模式,搭配2組HDMI端子可達成4螢幕輸出功能。

GIGABYTE目前尚未公布這2款型號的上市日期與價格,有興趣的讀者可以關注官方產品網頁

加入T客邦Facebook粉絲團
✇T客邦-Techbang

AOKZOE A1X掌上型電腦搭載Ryzen AI 9 HX 370處理器,遊戲續航力最長可達8小時

AOKZOE推出的A1X掌上型電腦搭載解析度為1920 x 1200的8吋觸控螢幕,以及AMD Ryzen AI 9 HX 370處理器,提供相對強悍的遊戲效能。Ede034461b2bd32939ccbf61b6bca15d

AOKZOE推出的A1X掌上型電腦搭載解析度為1920 x 1200的8吋觸控螢幕,以及AMD Ryzen AI 9 HX 370處理器,提供相對強悍的遊戲效能。

搭載120Hz高速更新螢幕

AOKZOE A1X搭載Ryzen AI 9 HX 370處理器,可調整式TDP(cTDP)範圍為4~30W,具有4組Zen 5與8組Zen 5c處理器核心,總共為12核24緒配置,2種核心的最高Turbo時脈分別為5.1 GHz、3.3 GHz,並搭配RDNA 3.5架構的Radeon 890M內建顯示晶片,具有16組運算單元(CUs),最高時脈可達2900 MHz。內建顯示規格僅次於具有40組CUs的Ryzen AI Max + 395理器。

延伸閱讀:
AMD Tech Day 2024(二):Ryzen AI 300系列行動版處理器架構解析,Zen 5、RDNA 3.5、XDNA 2完全體登場
CES2025:AMD Ryzen AI Max + 395、Ryzen Z2筆電、迷你電腦、掌上型電腦全線出擊

AOKZOE A1X搭載32 GB或64 GB雙通道LPDDR5x-7500記憶體,並具有1組PCIe Gen 4x4 M.2 2280固態硬碟插槽,提供1 TB或2 TB容量選擇,內建螢幕尺寸與解析度分別為8吋、1920 x 1200,並支援120Hz更新頻率以及VRR(Variable Refresh Rate,可變更新頻率)功能,提供更加流暢且無撕裂的視覺體驗)。

AOKZOE A1X是款搭載8吋螢幕的掌上型電腦。

AOKZOE A1X採用12核24緒的AMD Ryzen AI 9 HX 370處理器,具有Radeon 890M內建顯示晶片。

AOKZOE A1X搭載8吋、1920 x 1200支螢幕,並支援120Hz更新頻率以及VRR功能。

消費者可選擇32 GB或64 GB記憶體,以及1 TB或2 TB固態硬碟容量。

參考官方提供的數據,在1920 x 1200或1920 x 1080解析度能將《電馭叛客2077》、《黑神話:悟空》。

遊戲續航力最長可達8小時

在I/O端子部分,AOKZOE A1X據有2組全功能USB4,以及USB 3.2 Gen2、Oculink、microSD讀卡機、3.5mm音訊端子各1組,並在機身背面具有可以調整自由角度的腳架。

值得注意的是,Oculink(頻寬為64Gbps)與USB4(頻寬為40Gbps)都具有PCIe通道功能,能夠搭配外接式顯示卡或擴充底座,提升AOKZOE A1X的遊戲效能以及擴充連接、儲存功能。

在電池方面,AOKZOE A1X搭載容量高達72.7Wh(18880mAh)的電池,高於許多同類型掌上型電腦,官方數據顯示在影片播放與辦公室應用的續航力分別達10小時、8小時。至於遊戲方面,在4W的cTDP模式執行《黑帝斯II 》,能夠提供最長達8.3小時的遊戲續航力,而以18W cTDP模式執行《魔物獵人:荒野》,續航力也可達2.4小時。

此外也可以透過USB4或Oculink等端子連接外接顯示卡擴充遊戲效能。

機身背面具有可以調整自由角度的腳架,方便觀看影片或搭配鍵盤使用。

AOKZOE A1X的電池容量高達72.7Wh,比競爭對手40~55Wh的規格高出許多。

在以4W的cTDP模式執行《黑帝斯II 》續航力可達8.3小時,若以18W cTDP模式執行《魔物獵人:荒野》續航力則為2.4小時。

AOKZOE A1X規格一覽。

AOKZOE A1X的預定上市日期為2025年6月,預定售價為港幣6510元起(約合新台幣26,190元)。

加入T客邦Facebook粉絲團
✇T客邦-Techbang

LILYGO T-Deck Pro土砲電子紙傳呼機,透過LoRa網路傳送文字訊息

LILYGO T-Deck Pro是款搭載3.1吋電子紙顯示器的傳呼機套件,除了支援常見的Wi-Fi、藍牙、4G行動通訊,還支援LoRa低功耗廣域網路功能。5634247ad1dacc5535c502ab42db33d9

LILYGO T-Deck Pro是款搭載3.1吋電子紙顯示器的傳呼機套件,除了支援常見的Wi-Fi、藍牙、4G行動通訊,還支援LoRa低功耗廣域網路功能。

LoRa互連多台機子

LILYGO T-Deck Pro以ESP32-S3微控制器為核心,搭載3.1吋電子紙顯示器,並具有QWERTY鍵盤、喇叭、麥克風、3.5mm音訊端子、microSD讀卡機、GPS等功能,並且支援Wi-Fi 4、藍牙5.0、LoRa等通訊功能,或選擇4G通訊模組版本以使用行動上網功能。

延伸閱讀:低功耗廣域網路串起物聯網裝置(2):LoRa

LILYGO T-Deck Pro的特別之處在於支援LoRa低功耗廣域網路,當使用者架設好閘道或對應的網路環境後,就能讓LILYGO T-Deck Pro互相通訊,通訊範圍能夠超過10公里,遠超越一般Wi-Fi、藍牙的通訊距離。

使用者也可透過PlatformIO、Arduino IDE等工具開發程式,並傳輸至LILYGO T-Deck Pro執行,自行擴充軟體功能,靈活運用LoRa長距離通訊的優勢。

LILYGO T-Deck Pro是款採用ESP32-S3微控制器並支援支援LoRa低功耗廣域網路的傳呼機。

LILYGO T-Deck Pro的外型與Blackberry有些類似,搭載3.1吋電子紙顯示器與實體QWERTY鍵盤。

機身外殼為透明材質,鍵盤則有黑、灰配色可供選擇。

機身側面具有USB Type-C端子與microSD讀卡機(4G模組版本可安裝SIM卡)。

LILYGO T-Deck Pro提供2種版本,4G版本以具有Simcom A7682E通訊模組,一般版則在相同位置搭載TI PCM5102A音訊CODEC。

LILYGO T-Deck Pro現已發售,價格為美金82.99元(約合新台幣2,730元)。

加入T客邦Facebook粉絲團
✇T客邦-Techbang

Paper 7平板閱讀器採免背光反射式RLCD面板,兼顧護眼、彩色與高速反應

由香港廠商Harbor Innovations推出的Paper 7是款搭載Android作業系統的平板閱讀器,其最大的特色是採用反射式RLCD面板。7f57e44320f768618ceb17dcd942bdb4

由香港廠商Harbor Innovations推出的Paper 7是款搭載Android作業系統的平板閱讀器,其最大的特色是採用反射式RLCD面板。

彩色畫面高速反應

一般LCD面板的顯示原理需要搭配背光模組,長期觀看時容易因為較強的光線造成眼睛疲勞。而RLCD面板則是取消背光模組,透過外部光源照到面板後的反射顯示畫面,雖然色彩鮮豔度會明顯下降,但能在維持1677萬色顯色能力與60 Hz畫面更新頻率的優勢下,帶來接近電子紙的舒適閱讀感受。

延伸閱讀:
電子書閱讀器顯示技術又一選擇:「膽固醇液晶」產品即將推出,目前的技術限制有哪些?
也有「反射式」和「雙穩態」!1677萬色的電子紙膽固醇液晶來了

Paper 7搭載Android 14作業系統,方便使用者自行安裝各種App與電子書閱讀軟體,它採用MediaTek Helio P75 SoC,具有2組時脈為2.0 GHz的Arm Cortex-A75,與6組時脈為1.7 GHz的Cortex-A55處理器核心,搭配Arm Mail-G52 MC2繪圖處理器,最高可選8GB記憶體與256GB eMMC儲存媒體,並支援Wi-Fi無線網路、藍牙、USB Type-C端子等I/O功能。

Paper 7搭載解析度為768 x 1024的7.8吋螢幕,支援10點觸控,並可搭配4096段感壓手寫筆書寫或繪畫。

Paper 7是款採用反射式RLCD面板的平板閱讀器,並搭載Android作業系統提供高度使用彈性。

Paper 7的功能與規格一般平板電腦接近,搭載容量為3100mAh之充電電池。

Paper 7的RLCD面板與Hannspree(瀚宇彩晶之子公司)共同開發,能夠提供接近電子紙的舒適閱讀體驗。

RLCD面板具有1677萬色的顯色能力,遠高於彩色電子紙。

▲其畫面更新頻率高達60 Hz,流暢播放影片也沒問題。

Paper 7的預定上市日期為2025年5月,預定售價為美金299元起(約合新台幣9,890元)。

加入T客邦Facebook粉絲團
✇T客邦-Techbang

NVIDIA GeForce RTX 5060 Ti 16GB效能實測:RTX 5060四兄弟之首率先登場

NVIDIA於日前發表4款GeForce RTX 5060系列產品,而今日搶先發售的是16GB與8GB版本的GeForce RTX 5060 Ti桌上型顯示卡,就讓我們來看看它的效能表現。D048cab0a65d0b37993e8ee0f01d079d

NVIDIA於日前發表4款GeForce RTX 5060系列產品,而今日搶先發售的是16GB與8GB版本的GeForce RTX 5060 Ti桌上型顯示卡,就讓我們來看看它的效能表現。

比GTX 1060 Ti快50倍!

在先前的產品發表會中,NVIDAI透過圖表展示GeForce RTX 5060 Ti的原生效能大約接近GeForce GTX 1060 Ti的10倍,在DLSS 4的加持之下則可衝到超過50倍的FPS效能表現。

延伸閱讀:
CES 2025:NVIDIA編輯日(上):RTX 50系列顯示卡與Blackwell架構特色解說
CES 2025 - NVIDIA編輯日(下):RTX 50系列顯示卡獨有DLSS 4多重畫格生成超級效能禁藥與Reflex低延遲技術
NVIDIA GeForce RTX 5070效能實測:真的能下剋上打敗RTX 4090?

雖然GeForce RTX 5060 Ti具有16GB與8GB等2種版本,但是筆者這次只有收到MSI GeForce RTX 5060 Ti 16G VENTUS 2X PLUS,因此在測試時以這個版本為主。

值得注意的是,由於TDP較低的關係,所以MSI GeForce RTX 5060 Ti 16G VENTUS 2X PLUS在電源輸入部分採用單8Pin PCIe電源端子,讓使用者能夠延用不具12V-2x6端子的電源供應器,降低升級門檻與總體花費。

(若下方表格無法完整顯示,請點我看圖片版

GeForce RTX 50系列顯示卡規格簡表         
顯示卡型號 CUDA核心數量 基礎時脈 Boost時脈 Tensor核心 光線追蹤核心  記憶體容量 記憶體類別 顯示卡功耗 發售當時定價(美金)
GeForce RTX 5090 21760 2010MHz 2410MHz 3352 AI TOPS(第5代) 318 TFLOPS(第4代) 32GB 512bit GDDR7 575W $1999
GeForce RTX 5080 10752 2300MHz 2620MHz 1801 AI TOPS(第5代) 171 TFLOPS(第4代) 16GB 256bit GDDR7 360W $999
GeForce RTX 5070 Ti 8960 2300MHz 2450MHz 1406 AI TOPS(第5代) 133 TFLOPS(第4代) 16GB 256bit GDDR7 300W $749
GeForce RTX 5070 6144 2160MHz 2510MHz 988 AI TOPS(第5代) 94 TFLOPS(第4代) 12GB 192bit GDDR7 250W $549
GeForce RTX 5060 Ti 16GB 4608 2400MHz 2570MHz  759 AI TOPS(第5代) 72 TFLOPS(第4代)  16GB 128bit GDDR7 180W $429
GeForce RTX 5060 Ti 8GB 4608 2400MHz 2570MHz  759 AI TOPS(第5代) 72 TFLOPS(第4代)  8GB 128bit GDDR7 180W $379

 

MSI GeForce RTX 5060 Ti 16G VENTUS 2X PLUS採用雙風扇設計,厚度為雙槽。

顯示卡背面一樣採用穿透式散熱設計,強化散熱效果。

電源輸入採用單8Pin PCIe電源端子,讓使用者能夠延用不具12V-2x6端子的電源供應器。

顯示輸出方面同樣提供3組DisplayPort 2.1b與1組HDMI 2.1b。

測試環境與條件

本次測試過程除了手動開啟EXPO功能,讓記憶體自動超頻至DDR5-6000之外,其餘BIOS / UEFI的設定皆維持預設值,Resizable BAR為開啟狀態,對照組使用先前測試專題之成績。

所有成績除了都是進行2輪測試,在確定沒有極端值後取平均,遊戲效能使用遊戲內建的測試模式,而《絕對武力2》使用CS2 FPS Benchmark工作坊地圖進行測試。

遊戲部分在1080p、2K、4K解析度搭配最高畫質設定,若有設定範本則套用最高範本,若無則將所有畫質相關項目調至最高,關閉VRS或動態解析度等設定,並僅進行開、關光線追蹤功能的調整。

測試平台:
處理器:AMD Ryzen 7 9800X3D
散熱器:MSI MEG Coreliquid S360
主機板:ASRock X870E Taichi(UEFI版號:3.17.TS03 – AMD AGESA ComboAm5PI 1.2.0.3)
記憶體:G.Skill Trident Z5 Neo RGB 16GBx2(@DDR5-6000)
顯示卡:MSI GeForce RTX 5060 Ti 16G VENTUS 2X PLUS
儲存裝置:Solidigm P44 Pro 1TB(系統碟)、Solidigm P41 Plus 1TB(遊戲碟)
電源供應器:MSI MEG Ai1300P PCIE5
軟體環境:Windows 11專業版23H2(Build 22361.5189),GeForce Game Ready 575.94

測試平台之CPU-Z資訊。

GeForce RTX 5060 Ti之GPU-Z資訊。

《魔物獵人:荒野》效能測試

筆者除了透過《魔物獵人:荒野》的效能測試工具《Monster Hunter Wilds Benchmark》之外,也使用正式版遊戲實際感受遊玩體驗。測試過程皆設定為最高畫質並搭配高解析度材質包DLC,在不同項目中僅調整解析度、開關光線追蹤以及DLSS 3升頻(平衡模式)。

《Monster Hunter Wilds Benchmark》效能測試工具展示,影片使用NVIDIA App進行螢幕錄影,將會稍微影響效能,因此實際效能表現請以下方圖表為準。

至於遊戲的實際操作部分,透過NVIDIA FrameView測量狩獵過程的FPS表現,GeForce RTX 5060 Ti 16GB的平均與1% Low(99百分位)FPS分別為49.796、29.996幀,即便透過DLSS的協助也無法超過60幀門檻,可以搭配G-Sync顯示器提高視覺流暢感並避免畫面撕裂,雖然偶有明顯卡頓感,整體落在還可接受的範圍。

從《魔物獵人:荒野》的設定選項中可以看到,在使用最高畫質設定範本搭配高解析度材質包DLC的情況下,占用的顯示記憶體為7.68GB,尚未超過8GB(右上角之圖表)。

▲《Monster Hunter Wilds Benchmark》效能測試工具展示,測試條件為4K解析度、最高畫質(高解析度材質包DLC)、光線追蹤、DLSS 3(平衡模式)。影片使用NVIDIA App進行螢幕錄影,將會稍微影響效能,因此實際效能表現請以下方圖表為準。

▲在正式版遊戲中,以上段影片相同的條件測試。GeForce RTX 5060 Ti 16GB狩獵過程的平均FPS大約落在49.796幀,1% Low則為29.996幀。

在《魔物獵人:荒野》關閉光線追蹤的情況下,GeForce RTX 5060 Ti 16GB能在1080P解析度的平均FPS達70.1幀,超越60幀的門檻。

《魔物獵人:荒野》開啟光線追蹤後,GeForce RTX 5060 Ti 16GB能在1080P解析度仍有64.47幀的平均FPS。

開啟DLSS 3升頻後,GeForce RTX 5060 Ti 16GB能在4K解析度、最高畫質、光線追蹤的條件下將的平均FPS扛至64.19幀。

(下頁還有更多效能測試)

 

測試軟體分析

在效能測試前半段,照慣例先看看GeForce RTX 5060 Ti在3DMark與Procyon等測試軟體的表現如何,測試對照組則以RTX 50系列以及AMD最新的Radeon RX 9070為主。

若要將各顯示卡的價格因素列入考量的話,GeForce RTX 5070與GeForce RTX 5060 Ti 16GB的官方定價分別為美金549、429元,後者的價格低了21.86%。而Radeon RX 9070官方定價也是美金549元,所以差距同樣為21.86%。

3DMark Fire Strike採用Direct X 11繪圖API搭配1080p解析度(1920 x 1080),RTX 5060 Ti圖像分數與RTX 5070 Ti落差約為28.13%,而與RX 9070則相差34.95%,高於價格差距。代表著只考慮顯示卡本體價格,RTX 5060 Ti的單位成本效益較差。

Fire Strike Extreme將解析度提升至2K(2560 x 1440),RTX 5060 Ti的圖像分數與RTX 5070、RX 9070的落差擴大至31.49%、37.68%。

Fire Strike Ultra進一步將解析度提升至4K(3840 x 2160),落差進一步擴大至34.69%、41.97%。

3DMark Time Spy採用Direct X 12搭配2K解析度,RTX 5060 Ti圖像分數與RTX 5070 落差約為29.69%,而與RX 9070則相差42.23%。

Time Spy Extreme將解析度提升至4K,差距擴大為31.63%、44.25%。

Speed Way是採用DirectX 12 Ultimate繪API與DirectX Raytracing tier 1.1光線追蹤技術,具有全域照明與反射等效果,並透過Mesh Shaders進行效能最佳化,可以反映最新AAA大作遊戲的效能表現。RTX 5060 Ti與2者效能相差30.47%、30.52%,仍高於價格落差。

Steel Nomad採用DirectX 12繪圖API搭配14K解析度,雖然不使用光線追蹤技術,但具有目前最高的繪圖運算負載。RTX 5060 Ti與RTX 5070 落差縮小至26.60%,但與RX 9070的差距擴大為41.98%。

3DMark Port Royal採用DirectX Raytracing(DXR)光線追蹤繪圖技術搭配2K解析度,是考驗顯示卡光線追蹤效能的競技場。RTX 5060 Ti與2者的差距為28.56%、37.75%。

在DLSS測試部分,RTX 5060 Ti開啟DLSS 4搭配4X多重畫格生成能讓FPS效能達到原本的636.55%,表現相當出色。

Procyon AI Text Generation文字生成部分,RTX 5060 Ti成績與RTX 5070的平均差距約為15.5%,而大幅領先RX 9070約36.43%。

RTX 5070 Ti的FTFF(產生第1組字詞)速度表現,在NVIDIA陣營部分與顯示卡等級成強烈正相關,而AMD陣營則明顯落後。

每秒產生的字詞部分,RTX 5060 Ti落後RTX 5070平均18.37%,落後RX 90700平均20.19%。

遊戲效能測試

接下來我們繼續分析GeForce RTX 5060 Ti在實際遊戲的效能表現。

在競技類的《絕對武力2》中,RTX 5060 Ti在1080p解析度能將平均FPS與1% Low(99百分位)FPS都能超過144幀,而2K解析度則是有191.95幀的平均FPS與99.4幀的1% Low FPS,4K部分則分別為101.2幀與52.2幀,能滿足基本的競技需求。

《看門狗:自由軍團》關閉光線追蹤時,RTX 5060 Ti在2K解析度平均FPS有82幀的表現。

《看門狗:自由軍團》開啟光線追蹤後,2K解析度平均FPS仍有69幀,高於60幀門檻。

《戰慄深隧:流亡》關閉光線追蹤時,2K解析度平均FPS約為87.77幀。

《戰慄深隧:流亡》開啟光線追蹤後,2K解析度平均FPS仍可高於60幀。

《極地戰嚎6》由於繪圖負擔較低,對處理器的效能較為敏感,RTX 5060 Ti在關閉光線追蹤時能將4K解析度的平均FPS帶到69幀。

《極地戰嚎6》開啟光線追蹤後,4K解析度平均FPS仍有61幀的表現。

《刺客任務III》Dubai(杜拜)測試項目包含多種場景與NPC角色,整體負擔較低,關閉光線追蹤時RTX 5060 Ti在4K解析度有81.19幀平均FPS的好成績。

Dubai開啟光線追蹤後繪圖負擔大增,RTX 5060 Ti還是能滿足將1080p解析度的平均FPS扛過60幀。

《刺客任務III》Dartmoor(達特穆爾)測試項目則包含許多槍枝射擊與爆炸效果,充滿物理與粒子模擬,對處理器的要求比較高。關閉光線追蹤時RTX 5060 Ti在4K解析度的平均FPS高達79.21幀。

Dartmoor開啟光線追蹤後,RTX 5060 Ti剛好讓1080p解析度的平均FPS壓在60幀。

《電馭叛客2077》關閉光線追蹤時,RTX 5060 Ti能滿足2K解析度的流暢門檻。

《電馭叛客2077》開啟光線追蹤後,RTX 5060 Ti在1080p解析度的平均FPS略低於60幀門檻,可以透過DLSS彌補。

《黑神話:悟空》身為新一代效能殺手,在關閉光線追蹤時RTX 5060 Ti在1080p解析度的平均FPS為47幀。

《黑神話:悟空》開啟光線追蹤後, 1080p解析度的平均FPS下降至26幀。

2種版本各有所長

GeForce RTX 5060 Ti具有16GB與8GB等2種顯示記憶體容量的版本可供選擇,價差為美金50元,使用者可以依照需求採購。

8GB版本的優點當然就是價格比較便宜。在一般遊戲占用記憶體未超過上限的情況下,不同容量基本上不影響效能表現,舉例來說《魔物獵人:荒野》在4K解析度「全部開到最滿」的情況下,也僅占用7.68GB顯示記憶體,因此2種版本的效能表現會相當接近。

而16GB版本則可在遊戲使用超過8GB顯示記憶體時提供較佳的效能,但考慮到GeForce RTX 5060 Ti本身的產品定位本來就不是為4K解析度遊戲應用設計,因此以遊戲為主的讀者可以選擇8GB版本。

16GB版本的最大優勢在於在本機執行Stable Diffusion圖像生成、大型語言模型等AI應用程式時,可以使用參數量更大的模型,或是生成解析度更大的圖像。如果讀者有這方面需求,則可選擇16GB版本。

加入T客邦Facebook粉絲團
✇T客邦-Techbang

技嘉發表 RTX 5060 Ti / RTX 5060 全系列顯示卡:散熱更強、效能升級,還有Low Profile款

這一波新品全數採用 NVIDIA Blackwell 架構,儘管定位不如 RTX 5090 與 5080 的旗艦高階,但主要針對 2K / 1080p 遊戲玩家、創作者與輕度 AI 應用族群設計。D1bb0419625efd100349d086a32eb185

技嘉科技今日正式發表新一代 GeForce RTX 5060 Ti / RTX 5060 系列顯示卡,首波涵蓋多達七大系列設計,從高階玩家導向的 AORUS ELITE、經典熱銷 GAMING,到輕巧迷你的 Low Profile 半高版本一應俱全,並將分別自 4月16日與5月起陸續開賣。

這一波新品全數採用 NVIDIA Blackwell 架構,儘管定位不如 RTX 5090 與 5080 的旗艦高階,但主要針對 2K / 1080p 遊戲玩家、創作者與輕度 AI 應用族群設計,在效能與能耗間取得平衡。 

AORUS 系列 – AORUS ELITE 

AORUS ELITE系列是技嘉高級風冷散熱方案的顯示卡,專為追求極致效能和先進散熱技術的玩家所設計。其搭載創新的 WINDFORCE 散熱系統,整合了多項先進技術,包含全新設計的Hawk風扇、大面積銅板、多根複合式熱導管,以及Screen Cooling散熱技術等,即使在最嚴苛的負載條件下,也能提供優異的散熱表現。

技嘉發表 RTX 5060 Ti / RTX 5060 全系列顯示卡:散熱更強、效能升級,還有Low Profile款

獨家搭載技嘉經典RGB Halo燈光效果,透過視覺暫留技術,在風扇旋轉時展現三圈光環效果,這種燈光效果宛如殘影般流暢變換,能夠營造出絢麗的視覺層次,廣受市場高度肯定。

此外,為提升顯示卡的耐用性與結構強度,我們導入強化結構設計,採用金屬背板,並透過彎折邊緣設計穩固鎖定在 I/O 支架上,大幅提升整體結構強度,確保長期使用的穩定性。AORUS ELITE 顯示卡還具備多項使用者友善設計,包括航太級PCB防護塗層、支援靜音模式的 Dual BIOS 設計,以及 Ultra Durable 認證用料,全方位優化效能與耐用度,皆為玩家帶來極致遊戲體驗。

GIGABYTE 系列 – GAMINGAEROEAGLEEAGLE ICE WINDFORCE系列

GAMING系列顯示卡是技嘉最經典且受歡迎的系列,以卓越的效能與穩定性廣受肯定。新一代GAMING外觀設計彷如多層裝甲結構,每處細節皆突顯硬派形象與機械美學。特別是創新的滑動式側板設計,使用者可滑動側板來呈現出不同形式的RGB 燈光區域,增添獨特的互動體驗,進一步強化機甲設計,使 GAMING系列從裡到外展現出更具動態的電競美學。

技嘉發表 RTX 5060 Ti / RTX 5060 全系列顯示卡:散熱更強、效能升級,還有Low Profile款

AERO系列以其優雅的白銀配色和簡約的線條設計,深受設計師及偏好極簡美學的使用者青睞,完美融入淺色系機殼和極簡風格的PC系統。側邊Logo採用特殊工藝設計,結合精緻RGB燈效,營造出獨特且細膩的視覺層次,為整體外觀增添一絲優雅與時尚感。

EAGLE 系列的設計靈感源自太空戰艦與科幻元素的融合,成為科幻愛好者與年輕族群的首選。我們提供EAGLE ICE白色款與 EAGLE灰黑色兩種款式,讓使用者可依據喜愛的PC風格選擇最搭配的色調安裝,也讓顯卡不單只是零組件,更猶如停放於機殼內的戰艦,增強整體的視覺效果與張力。

技嘉發表 RTX 5060 Ti / RTX 5060 全系列顯示卡:散熱更強、效能升級,還有Low Profile款

WINDFORCE 系列為入門級顯示卡,採用低調沉穩的黑色為主調,風格簡約,是追求穩定、耐用且同時具備 RTX 5060 Ti 與RTX 5060所帶來卓越效能的使用者最理想的選擇。

此外,技嘉在結構設計上力求穩固可靠的品質,我們採用強化背板與I/O擋板緊密結合,大幅提升結構強度和完整性。再搭配技嘉 Ultra Durable 認證元件,大幅提升運行穩定性並延長使用壽命,致力為玩家打造更優質的遊戲體驗以及更可靠的用料品質。

GIGABYTE系列 – Low Profile半高顯示卡

技嘉於GeForce RTX 5060繪圖晶片推出 Low Profile 規格的顯示卡,非常適合偏好機殼空間較為緊湊及小型系統的使用者安裝,僅182mm顯卡長度同時仍提供強勁效能,滿足各類遊戲需求,讓小型機殼瞬間升級為強悍的遊戲戰鬥站。顯示卡採用銅底板直接接觸GPU與複合式銅熱導管散熱,可大幅提升熱傳導效率,確保散熱器能迅速導出核心熱能,使顯示卡在較低溫度下穩定運行並發揮更高效能。此外,高品質電路設計與技嘉Ultra Durable認證用料能進一步提升顯示卡的使用壽命與運作穩定性。

技嘉發表 RTX 5060 Ti / RTX 5060 全系列顯示卡:散熱更強、效能升級,還有Low Profile款

同時,顯示卡提供三個DisplayPort及一個 HDMI輸出,可支援最多四個顯示器同步輸出,特別適合多螢幕應用的使用者。產品還內附額外的 Low Profile短擋板讓使用者可因應機殼種類安裝,靈活適配不同機殼尺寸,確保安裝兼容性,滿足各類組裝需求。

技嘉科技 GeForce RTX 5060Ti 和 RTX 5060 系列顯示卡將分別於4月16日與五月起正式發售。

加入T客邦Facebook粉絲團
✇T客邦-Techbang

傳英特爾18A製程效能超越2奈米同級台積電N2與三星SF2,預計2025年底量產

英特爾 18A 獲得 2.53 分,高於台積電 N2 的 2.27 分與三星 SF2 的 2.19 分。這代表在同級的 2 奈米製程節點中,英特爾目前暫時領先。30da23cdbc6cfc46a6afa3b3b1b6c43f

根據TechInsights 的最新分析指出,英特爾(Intel)即將推出的 18A 製程節點在2奈米等級競爭中,表現優於台積電 N2 與三星 SF2,成為目前效能領先的製程技術之一。

在 TechInsights 以自訂評分標準進行的效能評比中,英特爾 18A 獲得 2.53 分,明顯高於台積電 N2 的 2.27 分與三星 SF2 的 2.19 分。這代表在同級的 2 奈米製程節點中,英特爾目前暫時領先。

背面供電技術帶來重大突破

18A 是英特爾首個採用「背面供電網路」(BSPDN, Backside Power Delivery Network)的製程節點,將在 2025 年底應用於新一代 Panther Lake CPU 中進行測試,並預計於 2026 年初正式出貨。

這項創新的電源架構有助於:

  • 提升 5~10% 的佈局效率與元件利用率

  • 降低互連電阻

  • 提高最高 4% 的等效電源效能(ISO Power Performance)

這些成果主要來自於相較傳統前端電源線路的內建電阻大幅降低。

每瓦效能提升15%,晶體管密度增加30%以上

與先前的 Intel 3 製程相比,18A 的每瓦效能提升達 15%,在相同晶片面積下可容納多出超過 30% 的晶體管。該製程採用了 RibbonFET 技術,目前已進入風險試產階段。

英特爾表示:「我們正進行最後階段的壓力測試,預期將在 2025 年下半年進入大規模量產。」

SRAM 密度創新突破 擊破縮放極限迷思

在 SRAM(靜態隨機存取記憶體)設計上,英特爾也展現進步。高效能 SRAM 單元從 Intel 3 的 0.03 µm² 縮小到 18A 的 0.023 µm²,而高密度版本更縮小至 0.021 µm²,代表縮放係數分別為 0.77 與 0.88,突破了過往 SRAM 難以再縮的假設。

此外,英特爾提出「環繞陣列」PowerVia 架構,將供電線路改為從晶片背面進入 I/O、控制與解碼器電路,有效解決電壓降與訊號干擾問題,提升了整體晶片整合與效能表現。

目前,18A 製程可達到 38.1 Mbit/mm² 的巨集位元密度,與台積電 N2 不相上下,成為極具競爭力的新世代節點。

隨著新架構與製程陸續定案,外界對英特爾能否藉 18A 重返晶片製程競爭第一線充滿期待。

 

 

加入T客邦Facebook粉絲團
✇T客邦-Techbang

NVIDIA發表GeForce RTX 5060系列顯示卡,Ti、行動版共4款GPU一併登場

NVIDIA發表GeForce RTX 5060 Ti 16GB / 8GB顯示卡,以及GeForce RTX 5060顯示卡與筆記型電腦用的顯示晶片,並於4月16日正式上市。38bd3a03213ce2fe4fbe083bf52411de

NVIDIA發表GeForce RTX 5060 Ti 16GB / 8GB顯示卡,以及GeForce RTX 5060顯示卡與筆記型電腦用的顯示晶片,並於4月16日正式上市。

桌上型顯示卡共3款

NVIDIA創辦人暨執行長黃仁勳於CES 25主題演講中發表8款Blackwell架構GeForce RTX 50系列顯示卡、行動版顯示晶片,並介紹DLSS 4升頻與多項RTX技術,而這次輪到主流價位帶的GeForce RTX 5060系列產品登場,陣容包含16GB、8GB等2種版本的GeForce RTX 5060 Ti,以及GeForce RTX 5060。

延伸閱讀:
CES 2025:NVIDIA編輯日(上):RTX 50系列顯示卡與Blackwell架構特色解說
CES 2025 - NVIDIA編輯日(下):RTX 50系列顯示卡獨有DLSS 4多重畫格生成超級效能禁藥與Reflex低延遲技術

GeForce RTX 5060 Ti的2種版本除了顯示記憶體容量差異之外,其餘規格接相同,它們都具有4608組CUDA核心,基礎、Boost時脈分別為2.4 / 2.57 GHz,能帶來24 TFLOPS的渲染器(Shader)理論效能,而其第5代Tensor核心與第4代光線追蹤核心分別具有759 TOPS AI運算效能與72 TFLOPS光線追蹤運算效能,記憶體通道控制器寬度則為128-bit,2種版本分別搭載16GB或8GB GDDR7顯示記憶體。

GeForce RTX 5060則僅提供8GB GDDR7顯示記憶體版本,渲染器理論效能為19 TFLOPS,而Tensor核心與光線追蹤核心的運算效能則分別為614 TOPS與58 TFLOPS,大約為GeForce RTX 5060 Ti的80%左右。

在價格方面,16GB與8GB的GeForce RTX 5060 Ti分別為美金429、379元,GeForce RTX 5060則為美金299元,價格也大約落在78.89%,刀法相當精準。

GeForce RTX 50系列支援神經渲染、路徑追蹤、ACE虛擬人物、DLSS 4升頻、Reflex 2低延遲、RTX遊戲重製等最新RTX技術。

GeForce RTX 5060系列桌上型產品將有發表GeForce RTX 5060 Ti 16GB / 8GB以及GeForce RTX 5060等3張顯示卡。

DLSS 4能在增進FPS效能的同時改善操作延遲,並強化遊戲畫質表現。

比較例代「60」位階顯示卡,GeForce RTX 5060 Ti在DLSS 4的加持下可以帶來50倍於GeForce GTX 1060的相對效能。

GeForce RTX 5060 Ti與前代產品的效能對照,原生效能成長與DLSS 4可以帶來顯著FPS增益。

GeForce RTX 5060可在多款熱門遊戲在1080p解析度將FPS效能推上100幀。

GeForce RTX 5060與前代產品的效能對照。

GeForce RTX 5060 Ti / RTX 5060效能簡表。

行動版RTX 5060

NVIDIA同時也發表了行動版GeForce RTX 5060顯示晶片,目標為提供1080p解析度、144p更新頻率,同樣提供最新RTX功能,並具有第9代NVENC編碼器與第6代NVDEC解碼器,能夠帶來流暢的8K解析度、YUV 4:2:2色彩取樣的影片剪輯功能,兼顧遊戲與多媒體創作需求。

搭載GeForce RTX 5060顯示晶片的筆記型電腦價格由美金1,099元起。

行動版GeForce RTX 5060顯示晶片也能將多款熱門遊戲在1080p解析度的FPS效能推上100幀。

多位合作夥伴將會推出多款搭載GeForce RTX 5060顯示晶片的筆記型電腦。

GeForce RTX 5060 Ti顯示卡預計於2025年4月16日上市,GeForce RTX 5060則為2025年5月,筆者也將在第一時間帶來效能測試報導,請讀者保持關注。

加入T客邦Facebook粉絲團
✇T客邦-Techbang

家中有很久沒用的Wii Remote手把嗎?透過OpenMote套件改裝成萬能遙控器:可用聲控、手勢操控智慧家庭

OpenMote是款整合多項功能的改裝套件,在替換Wii Remote控制器手把的電路板之後,可以用來操作多種不同裝置。1f757b9b3103dbdb4a2d9dbb512dc9a6

OpenMote是款整合多項功能的改裝套件,在替換Wii Remote控制器手把的電路板之後,可以用來操作多種不同裝置。

手把外掛萬能遙控器

於2006年推出的Nintendo Wii遊戲主機的特色之一,就是造型如電視遙控器的Wii Remote控制器,如今搭配OpenMote改裝套件後,還真的可以把它當作電視遙控器。

延伸閱讀:ANAVI Handle轉接板把Wii雙截棍變成USB滑鼠與手把

OpenMote採用ESP32-S3微控制器做為硬體核心,整合6軸動態感應器、紅外線接收與發射、Wi-Fi無線網路與藍牙通訊等功能,維持原始Wii Remote控制器的12組按鍵都可使用,以及震動馬達、單聲道喇叭、4組LED燈等功能。此外它也整合充電電池,並將底部的連接端子改為USB Type-C,使用者也可以透過Arduino IDE開發環境自行撰寫程式並擴充功能。

拆解Wii Remote控制器並將內部電路板更換為OpenMote之後,就可以把Wii Remote控制器改裝成多功能控制器,並使用按鍵或動態感應(類似手勢操作)等方式輸入指令,除了可以當作最基本的藍牙遊戲手把,也可透過紅外線控制一般家電,或是搭配智慧居家Hub控制家中各種裝置。

OpenMote是款能把Wii Remote控制器改裝成萬能遙控器的套件。

它也將原本使用的3號電池改為充電電池,並可透過USB Type-C端子充電。

OpenMote保留Wii Remote控制器正面11組按鍵以及背面B鍵等實體按鍵功能。

將Wii Remote控制器改裝為OpenMote之後,並不會對外觀造成影響。

OpenMote可以當作藍牙遊戲手把,也可透過按鍵、手勢控制家中各種家電與裝置。

OpenMote專案目前還在研發階段,雖有商品化的計劃,但是時程與價格皆尚未公布。

加入T客邦Facebook粉絲團
✇T客邦-Techbang

Intel 執行長陳立武擘畫未來藍圖:次世代 CPU 時程底定,唯獨顯卡隻字未提

Intel 執行長陳立武擘畫未來藍圖:次世代 CPU 時程底定,唯獨顯卡隻字未提76372ab10d057fe099a88aef92826fc0

Intel 新任執行長陳立武 (Lip-Bu Tan) 近期正式上任,並在發給股東的年度報告中附上一封公開信,闡述了他對公司的近期規劃,同時也重申了先前已公布的多項承諾。陳立武在信中強調了幾項重點方向:首要之務是 Intel 必須以客戶需求為核心,積極傾聽市場回饋;其次,將持續推動節省 100 億美元開支、裁員 15% 的目標;第三,簡化業務模式,減少不必要的複雜流程,並將資源持續投入關鍵產品的研發。

在備受關注的產品藍圖方面,陳立武再次確認,代號為 Panther Lake 的下一代處理器預計將在 2025 年下半年正式發表。這款處理器將首度採用 Intel 最新的 18A 製程技術,市場推測其可能命名為酷睿 Ultra 300 系列。而再下一代的產品,代號為 Nova Lake,也將按照原定計畫於 2026 年如期推出,外界推測其可能將會是酷睿 Ultra 400 系列。

值得一提的是,在日前酷睿 Ultra 200HX 系列遊戲筆電的發布會上,Panther Lake 也被排定在 2025 年的產品規劃中。

根據 Tech Edition 的報導,Panther Lake 將會是 Intel 下一代的行動處理器產品線,預計將廣泛應用於筆記型電腦及其他可攜式裝置。這些晶片將隸屬於 Core Ultra 300 系列,其設計目標在於提升能源效率與整體效能。

至於 Nova Lake,則是 Intel 即將推出的桌上型與筆記型電腦處理器系列。若先前的爆料消息準確,Nova Lake 在架構上可能會帶來顯著的變革,據傳其旗艦晶片的核心數量可能高達 52 個,相較於目前的產品有著巨大的提升。不過,在 Intel 正式公布最終規格前,這些早期消息仍需謹慎看待。

然而,令人感到意外的是,陳立武在這次的公開信中,對於 Intel 近年來積極發展的 Arc 銳炫系列顯示卡卻隻字未提。目前第二代 Arc B500 系列顯示卡已經上市,其目標競爭對手鎖定在 NVIDIA 的 RTX 5060 和 AMD 的 RX 9060 等級產品。市場普遍期待更高階的 Arc B700 系列能夠盡快推出,但至今仍未有明確的消息。

從 Intel 的整體策略來看,Arc 顯示卡不僅僅是面向遊戲市場,更是 Intel AI 戰略中重要的一環,因此外界推測 Intel 不太可能輕易放棄這條產品線。或許在未來的其他場合或活動中,Intel 將會釋出更多關於 Arc 顯示卡的資訊。

綜合來看,Intel 新任執行長陳立武已為公司擘畫了清晰的發展藍圖,次世代 CPU 的發布時程也已大致底定。然而,在 AI 應用日益重要的趨勢下,Intel 在顯示卡領域的下一步佈局,以及 Arc 產品線的未來發展,仍有待進一步觀察。市場將持續關注 Intel 是否會在後續的計畫中,為其 GPU 產品線帶來更多令人期待的消息。

加入T客邦Facebook粉絲團
✇T客邦-Techbang

NVIDIA雙系統架構GR00T N1機器人基礎開源模型:與Disney、Google合作開發Newton物理引擎

NVIDIA於GTC2025春季場發表開源、可完全自訂的GR00T N1機器人基礎模型,並著手開發Newton物理引擎,提供通用人形機器人便捷的開發環境。4563baaf4395bf7cdc61015075c3f6b7

NVIDIA於GTC2025春季場發表開源、可完全自訂的GR00T N1機器人基礎模型,並著手開發Newton物理引擎,提供通用人形機器人便捷的開發環境。

雙系統主管反射、思考

NVIDIA執行長黃仁勳於GTC(GPU技術大會)2025春季場開幕演說中講解多項機器人相關的技術成果與研發趨勢,提供強大的開發環境。除了延續先前GR00T機器人開發計劃,也以開源型式推出GR00T N1機器人基礎模型,讓開發者能夠直接使用或根據需求進行微調,大幅降低從零開始訓練模型的門檻。

延伸閱讀:【GTC 2025】黃仁勳演說深入分析:提出「終極摩爾定律」,追求相同耗電更高效能

與訓練自駕車的概念相同,NVIDIA也使用Omniverse數位攣生與Cosmos生成式世界基礎模建立的合成資料訓練機器人模型,詳細說明請參考《自駕車模型訓練與蒸餾技術分析》一文。

然而與自駕車使用的模型蒸餾技術不同的是,GR00T N1模型採用雙系統架構,其靈感來自於人類的認知原理。「系統1」是快速思考的動作模型,可以類比為人類的反射或直覺動作,而「系統2」則是緩慢思考的模型,用於深思熟慮,進行有條理的決策。

搭載GR00T N1模型的機器人可以透過攝影機與多種感應器收集環境資訊,並在視覺語言模型的支援下,先以「系統2」分析接收到的指令,並進行推論運算以規劃行動,接著以「系統1」將規劃轉換為精確的機器人連續動作。

其中「系統1」的訓練除了以實際人類示範的資料做為素材之外,也大量使用由Omniverse平台產生的合成資料,提高AI模型的精確度以完成各種複雜的動作,開發者也可針對特定的人形機器人或任務,使用真實或合成資料對GR00T N1模型進行維調與後期訓練(Post-Training)。

舉例來說,GR00T N1模型能夠完用1或2隻手臂抓取、移動物品,或是將物品從一隻手臂傳到另一隻手臂,或是執行需要參考長上下文提示詞並結合多種動作的多步驟任務,進而勝任搬運材料、包裝和檢查等工作。

NVIDIA提供Omniverse與Cosmos進行模擬、GR00T N1基礎模型、Jetson Thor邊緣運算電腦等軟、硬體組合,滿足機器人開發與應用所需。

一般來說機器人的訓練資料花費相當多人力準備,例如透過動態補捉裝置將真人的動作轉換為操作指令,並做為AI模型的訓練資料。

Omniverse與Cosmos可以生成許多以真實世界為基礎的合成AI模型訓練資料,能夠大幅降低介入的人力。

開發者可以利用Omniverse建立訓練環境的數位攣生,並透過Cosmos修改部分條件,產生無數的合成資料。

GR00T N1模型可以接受感應器的數據以及使用者的文字、語音指令,先以「系統2」分析接收到的指令,並進行推論運算以規劃行動,接著以「系統1」將規劃轉換為精確的機器人連續動作。

舉例來說,GR00T N1模型能夠讓2組機器人傳遞物品,然後將拿到的物品分類擺放。

3強聯手打造開源物理引擎

NVIDIA宣布與Google DeepMind及Disney Research(迪士尼研究中心)合作開發的開源物理引擎Newton,它採用NVIDIA Warp框架開發,並且相容於Isaac Lab與Google DeepMind的MuJoCo等模擬框架,並預計導入Disney Research研發的物理引擎,支援模仿人類學習以及反覆試驗學習等多種方式,提供靈活多元的機器人訓練方式,協助開發者根據需求更新機器人技能,並以更高精準度處理複雜任務。

黃仁勳在演說尾聲帶上舞台的BDX droid機器人「Blue」就是由Disney Research立用Newton開發的成果。

對於訓練機器人使用的AI模型而言,提供大量、多樣化、高品質的資料十分重要,然而產製這類資料的成本卻不低,例如真人示範資料受限於工作者的時間,就算不眠不休每天最多也只有24小時能夠錄製示範資料。

而NVIDIA提供的Isaac GR00T Blueprint藍圖以Omniverse與Cosmos產生的合成資料為基礎(詳見自駕車訓練說明),讓開發者能已少量真人示範資料為基礎生成大量合成動作資料,有助於解決上述難題。

舉例來說使用這個藍圖,能在短短11小時生成78萬組合成軌跡,相當於6500小時(等同9個月)的真人示範資料。NVIDIA表示結合真實與合成資料,能夠較單純使用真實資料提高40% GR00T N1效能。

在使用預先訓練的GR00T N1機器人基礎模型後,可以搭配Omniverse與Cosmos產生的合成資料進行後期訓練,提高機器人動作準確度。

舉例來說,Omniverse與Cosmos可以產生多種不同方向盤與籃子的影片,讓機器人AI模型學習因應不同環境的工作需求。

NVIDIA與Google DeepMind及Disney Research共同研發的Newton物理引擎能夠應用於MoJoCo Playground,將物理效果導入訓練環境,以生成更逼真的合成資料。

黃仁勳在GTC 2025春季場開幕演說的最後將BDX droid機器人「Blue」帶上舞台。

GR00T N1訓練資料和任務評估情境現在可從Hugging FaceGitHub下載,使用者也可以在GitHub下載Isaac GR00T Blueprint,是直接在build.nvidia.com網站查看互動展示。

回到【GTC 2025】系列報導目錄

加入T客邦Facebook粉絲團
✇T客邦-Techbang

NVIDIA如何用AI創造AI?自駕車模型訓練與蒸餾技術分析

NVIDIA在GTC(GPU技術大會)2025春季場分享透過Omniverse數位攣生與Cosmos生成式世界基礎模建立的合成資料訓練自駕車模型,並利用蒸餾技術訓練更小巧的自動駕駛決策模型。1fb6635fe46c425f23c0a37e7928b53d

NVIDIA在GTC(GPU技術大會)2025春季場分享透過Omniverse數位攣生與Cosmos生成式世界基礎模建立的合成資料訓練自駕車模型,並利用蒸餾技術訓練更小巧的自動駕駛決策模型。

使用AI訓練AI

NVIDIA在GTC 2025春季場發表Halos自動駕駛安全系統堆疊,整合車輛架構、AI模型、晶片、軟體、工具、服務等多個面向,提供從雲端到車輛的整合式安全開發環境。另一方面也發表與GM(General Motors,通用汽車)共同利用AI、模擬和加速運算技術,合作開發下一代車輛、工廠和機器人。

延伸閱讀:【GTC 2025】黃仁勳演說深入分析:提出「終極摩爾定律」,追求相同耗電更高效能

GM將使用Omniverse平台建立生產線的數位孿生,在虛擬環境中驗證車輛生產與測試等流程並進行改善,以減少生產線的停機時間,提高製造安全性和效率,也將在車輛搭載Blackwell架構的DRIVE AGX電腦與DriveOS作業系統,以高達1000 TOPS的AI運算效能提供安全自動駕駛功能。

將焦點放在自動駕駛功能的AI模型訓練部分,NVIDIA推出的Omniverse數位攣生平台整合多種API與SDK,並支援OpenUSD格式3D物件模型檔案以及RTX渲染技術,能夠用於在電腦中建立虛擬工廠、機器人等數位攣生,適用於工業和機器人的工作流程模擬。Cosmos則是符合物理現象且開源的生成式世界基礎模型,能夠用於輸入文字或影片以生成虛擬世界。

結合這2項技術,開發者得以在電腦中建立逼真的3D場景,或是透過輸入提示詞的方式生成影片,並利用這些資料補充實際在道路駕駛過程拍攝的影片或各種感應器量測的數據,進行自駕車的模型訓練。

GM將與NVIDIA共同利用AI、模擬和加速運算技術,合作開發下一代車輛、工廠和機器人。

NVIDIA也發表Halos自動駕駛安全系統堆疊,提供從雲端到車輛的整合式安全開發環境。

NVIDIA提供整合Omniverse與Cosmos等2項技術的閉迴圈(Closed Loop)訓練系統,透過真實世界的資料建立道路環境的數位攣生,並透過數位攣生訓練自駕系統。

Omniverse與Cosmos能夠快速生成極大量的合成資料、影片,並作為自駕系統的AI訓練素材。

舉例來說,開發者可以使用Omniverse建立道路環境的數位攣生,並在其中訓練自駕系統。

由於數位攣生是透過3D開發環境建立,因此可以取得100%準確的車道、行道樹、建築物等物件標記,對於AI訓練有很大的幫助。

Cosmos可以透過輸入提示詞生成各種行駛狀況的影片,補充AI模型的訓練素材。

Omniverse搭配Cosmos也能生成各種不同天氣、時間、交通流量狀態的影片,能以更多不同的情況進行AI訓練,提高模型的在不同條件下的可靠度。

蒸餾模型降低駕駛時運算需求

NVIDIA也透過模型蒸餾技術降低自駕系統運作時的運算資源需求,將Cosmos較為復雜、聰明但消耗更多資源的原則模型(Policy Model)作為「老師」,教導佈署於自駕車上的「學生」模型。

「老師」會展示各種不同情況下的最佳行駛路徑,並讓「學生」不斷重復學習,過程中會透過Cosmos的Driver Evaluator評估系統對不同AI推論進行評分,並改善「學生」的路徑規劃,直到表現與「老師」接近。

然而道路駕駛還有很多不同挑戰,仍需透過前文提到的方式微調「學生」模型,以提高自駕系統的可靠度,最終讓「學生」能以參數量較小的模型達到理想的自動駕駛能力,降低自駕系統AI推論工作的運算需求。

模型蒸餾技術的概念為讓Cosmos的原則模型作為「老師」展示最佳行駛路徑,訓練「學生」模型(圖中藍色車輛)不斷重復學習。

系統透過Driver Evaluator評估系統對不同AI推論進行評分,並改善「學生」的路徑規劃,直到表現與「老師」接近。

Omniverse與Cosmos以及上述蒸餾模型最大的優勢在於可以進行自動化訓練,在幾乎不需介入的情況下不斷自動訓練與微調自駕系統的AI模型,等於是不需投入額外人力的前提下,只需花費伺服器運作所需的電力,就可以讓系統持續提升模型品質,帶來更可靠的自駕系統。

這個特點也呼應NVIDIA執行長黃仁勳於GTC 2025春季場開幕演說中提到的AI工廠概念,「輸入電力即可產出人工智慧」。

(回到【GTC 2025】系列報導目錄)

加入T客邦Facebook粉絲團
✇T客邦-Techbang

【GTC 2025】黃仁勳演說深入分析:提出「終極摩爾定律」,追求相同耗電更高效能

NVIDIA執行長黃仁勳於GTC 2025春季場開幕演說中說明AI發展的多個階段與多種提升準確度的法則,並提出「終極摩爾定律」的發展趨勢觀查。B09695f5ebbf89da613514d9d3a31730

NVIDIA執行長黃仁勳於GTC 2025春季場開幕演說中說明AI發展的多個階段與多種提升準確度的法則,並提出「終極摩爾定律」的發展趨勢觀查。

GTC 2025春季場系列文章目錄:
黃仁勳演說深入分析:提出「終極摩爾定律」,追求相同耗電更高效能(本文)
NVIDIA發表Blackwell Ultra GPU、GB300 NVL72伺服器,Photonic矽光子交換器節能又可靠
NVIDIA如何用AI創造AI?自駕車模型訓練與蒸餾技術分析(工作中)
NVIDIA發表雙系統架構GR00T N1機器人基礎模型,與Disney、Google合作開發Newton物理引擎(工作中)

AI除了要更快,還要更省電

黃仁勳在GTC(GPU技術大會)2025春季場開幕演說中提到多款專為CUDA(Compute Unified Devices Architectured)架構所設計的加速運算函數庫,其中包含下列眾多成果

  • cuNumeric: Python程式數值運算加速函數庫
  • cuLitho:運算式微影加速函數庫(電腦王報導),針對運算式微影(Computational Lithography)技術開發的函數庫
  • Aerial、Sionna:5G與6G電信訊號處理(電腦王報導
  • cuOPT:路線規劃最佳化
  • Parabricks:加速基因序列分析
  • Monai:開源醫學影像領域AI框架(電腦王報導
  • Earth-2:地球的數位孿生(電腦王報導
  • cuQuantum、CUDA-Q:加速量子運算模擬(電腦王報導
  • cuEquivariance、cuTensor:分子結構與線性代數加速函數庫
  • TRT-LLM、Megatron、NCLL、cuDNN、Cutlass、cuBlas:深度學習加速函數庫
  • cuDSS、cuSparse、cuFFT、AMGX:能夠應用於CAE(電腦輔助工程)的:直接稀疏求解器(Direct Sparse Solver)、用於稀疏矩陣的線性代數、快速傅立葉變換、GPU加速求解器等函數庫
  • cuDF、cuML:資料科學與資料處理加速函數庫
  • WARP:物理模擬加速函數庫

讓使用者能可以更便捷地導入各種加速運算。

黃仁勳也在演說中提到AI技術發展的多個階段,從2012年的AlexNet卷積神經網路開始,經歷了能夠應用於語音辨識、醫療影像辨識的感知式AI(Perception AI),以及能夠產生多種文字、影像、影片的生成式AI(Generative AI),到近期相當熱門,能夠自動整合多種AI工具並自主進行決策的代理式AI(Agentic AI),以及可以應用於自駕車、機器人的物理式AI(Physical AI),每個階段都提供了截然不同的功能,但也需要消耗更多運算能力。

黃仁勳接著說明提高AI準確度的3種擴充法則(Scaling Laws),第1種是準備大量資料並從無到有訓練基礎模型的預訓練(Pre-Training),第2種則是在基礎模型之上透過特定專業領域資料進行微調的後訓練(Post-Training)。

最後則是推理式AI(Reasoning AI)採用的測試時訓練(Test-Time Training),這種概念會將問題拆分為多個次要部分並按部就班進行「多方思考」與「反覆思考」,並且參考過渡期的答案反問是否合理。簡單來說,在推論運算過程中,AI系統會分析源頭問題,然後自行生成很多次要問題,然後在一一回答次要問題的過程自我修正,最後輸出準確度更高的答案。這個方式的挑戰在於生成次要問題時,但是需要生成更多字詞(Token),而造成總體運算量大幅提升的副作用。

黃仁勳以安排婚禮座位為例說明,利用Llama 3.3 70B大型語言模型(Large Language Model,以下簡稱LLM)進行一般推論運算,過程只需生成439個字詞就可得到答案,但是安排卻不恰當。如果使用DeepSeek R1 671B LLM(透過MoE啟用其中37B參數)進行推理式AI運算,雖然會讓需要生成的字詞數量提升近20倍達到8559個,並讓整體運算量飆升至150倍,但是得到的結果具有實用價值,能夠合適安排的座位,並安排1位牧師作為和事佬。

有趣的是,雖然一般LLM看似節省運算資源,但是得到的結果不堪使用,等於白白浪費439個字詞的運算資源,而推理式AI高漲運算需求,則可靠針對推理式AI最佳化的Dynamo AI推論軟體以及更強大的運算單元舒緩。

Dynamo說明可參考先前《GTC會前簡報》一文。黃仁勳則在演說中補充,Blackwell架構在Dynamo的協助下,可以帶來25倍於前代Hooper的效能輸出,意為著能夠提高AI資料中心25倍產能。

另一方面,今日電力已經成為資料中心營運的核心條件,更高的電力效率代表對周圍供電網路的壓力較輕,以及較低的整體持有成本(TCO)。黃仁勳也表示這種在相同電力下的效能成長幅度,將成為下一個衡量半導體技術發展的「終極摩爾定律」(Ultimate Moore's law),而以同樣消耗100 MW電力的AI資料中心為例,使用GB200 NVL72建構的運算叢集能帶來40倍於H100 NVL8的字詞收益(Token Revenue),因此黃仁勳又提到「The more you buy, the more you save」。

NVIDIA為CUDA統一運算架構開發了cuNumeric、cuLitho、Aerial、Sionna、cuOPT、Parabricks、Monai、Earth-2、cuQuantum、CUDA-Q、cuEquivariance、cuTensor、TRT-LLM、Megatron、NCLL、cuDNN、Cutlass、cuBlas、cuDSS、cuSparse、cuFFT、AMGX、cuDF、cuML、WARP等大量加速運算含數庫,為各行各業提供強大的運算效能。

NVIDIA透過CUDA為企業IT、雲端服務、雲端GPU、邊緣運算、6G網路、自動化製造、機器人、自駕車等多種領域提供完整AI軟體堆疊,並具有領先技術與豐富的開發者生態系統,滿足各行各業對AI的需求。

黃仁勳在GTC 2025春季場演說中提到AI技術發展包含感知式、生成式、代理式、物理式等多個階段。

在3種提高AI準確度的擴充法則中,包含預訓練、後訓練,以及推理式AI採用的測試時訓練,後者可能會提高100倍運算能力的需求。

若在測試時訓練導入可驗證獎勵強化學習(Reinforcement Learning with Verifiable Reward,RLVR)甚至會讓運算過程產生的字詞數達到100T的數量級。

以安排婚禮座位為例,一般推論運算只生成439個字詞就可得到答案,但是安排卻不恰當,等於白白浪費運算能力。推理式AI運算雖然會讓字詞數量提升近20倍,並讓整體運算量飆升至150倍,但得到的答案具有實用價值。

Dynamo能夠拆分推論工作,並動態調節、重新分配運算叢集中的GPU資源,以提高整體運算效能並降低成本。

Blackwell架構在Dynamo的協助下,可以帶來25倍於前代Hoope架構r的效能輸出。

在同樣消耗100 MW電力前提下,Blackwell架構能帶來40倍於Hooper架構的字詞收益。

明年推出全新CPU、GPU架構

NVIDIA採用類似Intel Tick-Tock的時程規劃產品開發節奏,在第1年推出新的GPU架構,並在第2年改進架構、推出加強版產品,對照本世代產品便是2024年發表的Blackwell GPU架構,以及預計2025年下半推出的Blackwell Ultra架構。

Blackwell Ultra之GPU晶片中封裝了2組裸晶,總共具有15 PFLOS之FP4資料類型運算效能,並搭載容量高達288GB之HBM3e記憶體。而GB300 NVL72伺服器採用機架規模設計,整合36組Arm Neoverse架構Grace CPU與72組Blackwell Ultra GPU,總計有20TB HBM高頻寬記憶體以及40TB DDR記憶體,FP4資料類型AI運算效能高達1.1 EFLOPS。

到了2026年下半,NVIDIA將同時推出全新的Vera CPU架構以及Rubin GPU架構,前者採用88核176緒配置的客製化處理器核心,而後者則在單一GPU晶片中封裝2組裸晶,將運算效能提升至50 PFLOS,並搭載288GB HBM4高頻寬記憶體。此代架構也同時導入頻寬達3600 GB/s的第6代VNLink互連技術,並升級至Spectrum 6與ConnectX 9 InfiniBand網路介面卡。

至於2027年下半則輪到Rubin Ultra架構,它最大的改變在於將會在單一GPU晶片封裝內整合4組裸晶,將運算效能提升至100 PFLOPS,並搭載1TB HMB4e高頻寬記憶體。

值得注意的是,黃仁勳也在演說中承認Blackwell的命名明方式有可改進之處。Blackwell GPU的我們「肉眼可見」的單一晶片封裝(Chip Package)具有2組裸晶(Die),而每組GB200 Superchip具有2組Blackwell晶片封裝、共4組裸晶,因此由36組GB200 Superchip組成的GB200 NVL72伺服器,具有72組Blackwell晶片封裝、共144組裸晶。

而在Vera Rubin世代的伺服器將改以裸晶數量進行命名,因此將晶片配置數量與GB200 NVL72伺服器接近的產品並非命名為「Vera Rubin NVL72」,而是「Vera Rubin NVL144」,並非增加1倍晶片數量。

而在這之後,預計於2028年下半推出的產品將沿用Vera CPU架構,並升級至全新Feynman GPU架構,搭配第8代VNLink互連技術以及Spectrum 7、ConnectX 10 InfiniBand網路介面卡。

NVIDAI的AI運算路線圖,2026與2027年為Rubin GPU世代,2028年開始進入Feynman世代。

提到Vera Rubin NVL144命名規則,需先回顧GB200 Superchip。看到實體圖片上方為2組Blackwell GPU,中央則為Grace CPU與LPDDR5x記憶體。

仔細看Blackwell GPU晶片封裝中的細線,可以看到中央上下併排的2組Blackwell GPU裸晶。

GB200 NVL72伺服器具有18組GB200 Superchip運算節點,總共包含36組Grace CPU,以及72組Blackwell GPU晶片封裝(共144組Blackwell GPU裸晶)。而Vera Rubin NVL144則直接取144組裸晶之文意進行命名。

2025年下半將推出強化版的Blackwell Ultra GPU與對應的Blackwell Ultra NVL72伺服器。

2026年下半則為全新架構之Vera CPU與Rubin GPU,對應的Vera Rubin NVL144伺服器。

2027年下半將推出強化版、在單一GPU晶片封裝內整合4組裸晶的Rubin Ultra,並推出Rubin Ultra NVL576伺服器。

若以圖像表示運算單元的尺寸,Grace Blackwell NVL72為圖片中央的銀色晶片。

相較之下Vera Rubin NVL576的尺寸巨大許多。

比較各世代之運算效能,Blackwell與Rubin分別為Hopper的68、900倍。整體持有成本與效能相除的成本指數則為13%、3%,升級至新世代具有極佳經濟效益。

(下頁還有矽光子、工作站、自駕車、機器人介紹)

矽光子節能並提升資料中心運算密度

黃仁勳提到過去伺服器與資料中心常用銅線建置網路(筆者註:指一般金屬導線之網路線),這類線材很適合應用於1至2米範圍或是距離較短的設立,但是隨著資料中心的規模越來越大、伺服器的數量越來越多,彼此的距離也隨之增加,因此需要使用更長的網路線,並使用光纖取代銅線以解決訊號衰退的問題。

但是傳統的傳統光纖網路交換器需要額外安裝光纖模組,每個端子的資料處理器(DSP)與雷射模組共計消耗30 W電力,為了要連接數量龐大的伺服器,整體電力的開銷也是相當可觀。

為了降低光纖網路系統的耗電量,NVIDIA發表與TSMC(台積電)以及多位生太系統合作夥伴共同研發的共同封裝光學技術(Co-Packaged Optics,CPO),這系列矽光子網路交換器採用TSMC微型環狀調變器(Micro-Ring Modulator,MRM),光學引擎與雷射光源僅消耗9 W電力,且低訊號衰退更低,提供更可靠、省電、高品質的資料交換與通訊。

資料中心轉移至矽光子網路交換器在於能夠省下通訊使用的電力,並在總體電力限制不變的前提下,將電力轉移給更多CPU與GPU使用以提升更多運算能力,進而提高資料中心的收益。對整體資料中心而言,這個發展趨勢也符合前面提到的「終極摩爾定律」。

矽光子網路交換器的詳細介紹與圖文特色說明可參考《GTC會前簡報》一文。

NVIDIA預計於2025年下半推出搭載共同封裝光學技術的Spectrum-X Photonics矽光子Ethernet網路交換器,Quantum-X Photonics矽光子InfiniBand網路交換器則需等到2026年下半。

黃仁勳於演說中拿出光纖模組說明傳統光纖網路交換器較為耗電的原因。

矽光子網路交換器將光通訊元件整合於在晶片封裝,能夠將原本30 W的功耗降低至9 W。

位於晶片封裝上的光學引擎能夠節省3.5倍電力,當伺服器數量一多,節省的總電力也相當可觀,有助於在總體電力限制下擠出更多運算能力。

具有144組800Gb/s InfiniBand連接埠的Quantum-X Photonics 3450-LD交換器採用液冷設計。Spectrum-X Photonics交換器則提供128組800Gb/s連接埠的SN6810與512組200Gb/s連接埠的SN6800等型號。。

想要買一台DGX Station放家裡嗎?

黃仁勳在演說中特別拿出DGX Station的主機板,說明它是它桌上型電腦尺寸的AI工作站,搭載GB300 Superchip,具有容量高達784 GB的統一記憶體,能夠提供20 PFLOPS的FP4資料類型AI運算效能,並搭載網路頻寬達800 gigabits的ConnectX-8 SuperNIC,能夠高速連接多個DGX Station以處理更大規模的工作負載。

另一方面,黃仁勳也特別強調DGX Station具有3組PCIe Gen 5x16擴充插槽,能夠加裝RTX PRO 6000 Blackwell等多款運算卡來提升整體運算效能,為進階使用者與小型工作室提供大規模AI訓練與推理運算的充沛效能。

如果覺得DGX Station超出預算,也可以考慮先前在CES 25亮相、後來正式定名為DGX Spark的迷你超級電腦,它的尺寸更小、價格更低,並具有1000 TOPS的峰值AI運算效能。

黃仁勳在介紹DGX Station特別強調它具有PCIe。擴充插槽能夠加裝運算卡提升整體運算效能。

DGX Station搭載GB300 Superchip運算單元以及ConnectX-8 SuperNIC網路卡,並具有784 GB記憶體。

除了DGX Station之外,對運算能力需求較低的使用者也可考慮圖片左方的DGX Spark迷你超級電腦,或使用RTX Pro運算卡建置工作站。

自駕車模型蒸餾與GR00T N1開源機器人模型

NVIDIA也於發表Halos自動駕駛安全系統堆疊,它整合車輛架構、AI模型、晶片、軟體、工具、服務等多個面向,提供從雲端到車輛的安全開發環境。

另一個重大消息為NVIDIA將以開源型式釋出GR00T N1機器人基礎模型,提供通用人形機器人推理能力和多種技能。

黃仁勳也在演說中提到在自駕車領域透過Cosmos的生成式世界基礎模型搭配模型蒸餾技術,一方面加速模型開發,另一方面降低行駛時AI推論運算的資源需求。在GR00T N1部分,除了全球首款開源、可完全自訂的機器人基礎模型之外,也採用分別負責快速思考反射動作、緩慢思考做出有條理決策的雙系統架構。

筆者將針對這2個部分撰文詳述,請有興趣的讀者查閱文章頂部之列文章目錄。

Halos是至整合車輛架構、AI模型、晶片、軟體、工具、服務等多個面向的自動駕駛安全系統堆疊。

在自駕車的模型訓練方面,透過Cosmos的生成式世界基礎模型產生的資料進行訓練,再搭配蒸餾技術節省行駛時的運算需求。

黃仁勳分析機器人產業需要環境模擬、模型訓練、部署執行等多種開發階段,將衍生上兆美金的工業產值。

延續上述3個階段,NVIDIA提供Omniverse與Cosmos進行模擬、GR00T N1基礎模型、Jetson Thor邊緣運算電腦等軟、硬體組合,滿足機器人開發與應用所需。

GR00T N1採用創新的雙系統架構,「系統1」是快速思考的動作模型,反映人類的反射或直覺,「系統2」是緩慢思考的模型,用於深思熟慮做出有條理的決策。

NVIDIA發表與Disney、Google共同研發、應用於機器人模擬的開源物理引擎。

黃仁勳也在演說最後介面基於上述技術打造的BLUE機器人,模樣相當可愛並可回應人類的語音。

GTC 2025春季場於2025年3月17日至21日在美國加州聖荷西舉行,筆者撰文時活動已經結束,錯過活動的讀者仍可於YouTube觀看開幕演說重播

加入T客邦Facebook粉絲團
✇T客邦-Techbang

SMI SM2508固態硬碟控制器效能實測:速度飆破14 GB/s、溫度壓制58度

SMI的SM2508固態硬碟控制器採用TSMC 6nm節點製程,支援PCIe Gen 5x4匯流排與NVMe 2.0通訊協定,實測傳輸速度超過14 GB/s。2fbbabf8b840610a36fa39cd52838935

SMI的SM2508固態硬碟控制器採用TSMC 6nm節點製程,支援PCIe Gen 5x4匯流排與NVMe 2.0通訊協定,實測傳輸速度超過14 GB/s。

高速低溫,更適合筆電

SMI於Computex 2024台北國際電腦展展出SM2508控制器,它最大的特色就是採用TSMC(台積電)6nm節點製程,能夠有效降低控制器的功耗。

延伸閱讀:SMI展出Gen 5固態硬碟控制器,免散熱片速度飆上14 GB/s

SM2508採用PCIe Gen 5x4匯流排與NVMe 2.0通訊協定,採用8通道(Channel)、32 CE(Chip Enable)設計,並支援TLC與QLC快閃記憶體顆粒,以及DDR4、LPDDR4緩衝記憶體,並透過第8代NANDXtend ECC錯誤校正碼技術延常使用壽命。

受益於製程精進的優勢,SM2508的運作過程最高功耗為3.5 W,在Power State 4電力狀態下的休眠狀態功耗僅為0.002 W,有助於進一步節省消耗的電力以及降低運作時的溫度,這些特性對於應用於筆記型電腦、掌上型電腦等內部空間狹小且無法安裝散熱片的使用情境來說格外重要。

筆者這次收到的測試樣品為Biwin Black Opal X570 PRO SSD 2TB,採用TLC類型快閃記憶體顆粒搭配4 GB緩衝記憶體,並預先貼上石墨烯導熱墊。

官方規格標準最高連續讀取、寫入的頻寬為14000 MB/s、13000 MB/s,I/O量最高可達2000K IOPS、1600K IOPS,並支援ECC錯誤校正碼、4K LDPC錯誤校正碼、磨損均衡(Wear Leveling)、主動垃圾收集和TRIM等技術,提供高達3000 TBW的寫入耐用度。

SM2508是SMI的第1款消費端PCIe Gen 5固態硬碟控制器,支援TLC與QLC快閃記憶體顆粒與緩衝記憶體。

SM2508具有高效能、低功耗、低溫等特色,並搭載第8代NANDXtend ECC錯誤校正碼技術。

根據SMI提供的數據,SM2508的效能表現可提升達前代產品之2倍。

這次我們使用的測試樣品為Biwin Black Opal X570 PRO SSD 2TB。

Black Opal X570 PRO SSD 2TB採用單面設計,並預先貼上石墨烯導熱墊。

拆開導熱墊後可以看到SM2508(最左側)控制器本體、DRAM緩衝記憶體,以及2顆快閃記憶體顆粒。

快閃記憶體顆粒之打印為BWT 2BN888-001T 24416414A。

使用工具查詢為Micron 232層TLC顆粒。

Black Opal X570 PRO SSD 2TB於CrystalDiskInfo之資訊。

效能實測與環境

這次測試使用ASRock X870E Taichi主機板,將系統碟安裝於主機板的第2組M.2插槽(PCIe Gen 4x4),並將Black Opal X570 PRO SSD 2TB安裝於第1組M.2插槽(PCIe Gen 5x4)。

所有成績都是進行2輪測試,在確定沒有極端值後取較佳者,測試結果如下列圖表。

測試平台:
處理器:AMD Ryzen 9 9950X3D
散熱器:MSI MEG Coreliquid S360
主機板:ASRock X870E Taichi(UEFI版號:3.17.TS03 – AMD AGESA ComboAm5PI 1.2.0.3)
記憶體:G.Skill Trident Z5 Neo RGB 16GBx2(@DDR5-6000)
顯示卡:NVIDIA GeForce RTX 4090 Founders Edition
儲存裝置:Samsung 990 Pro 1TB(系統碟),Biwin Black Opal X570 PRO SSD 2TB(資料碟)
電源供應器:MSI MEG Ai1300P PCIE5
軟體環境:Windows 11專業版23H2(Build 26100.3194),GeForce Game Ready 572.60

在CrystalDiskMark的預設模式中,使用1 MB資料叢集搭配Q8T1(8佇列,1指令)模式進行測試之連續讀取速度為14334.35 MB/s,連續寫入則為13288.79 MB/s。

將CrystalDiskMark切換至「SSD」與「真實世界 + Mix」模式,4 KB資料叢集搭配Q1T1之隨機讀寫速度分別為87.23 MB/s、265.86 MB/s,I/O數最高可達64907.47 IOPS。

在ATTO Disk Behchmark的讀寫頻寬表現則達到13.9 GB/s、12.34 GB/s。

最佳I/O表現出現在512B資料叢集,I/O數達136.82K IOPS。

在PCMark 10的全系統儲存測試中,Black Opal X570 PRO SSD 2TB的成績為4016分,頻寬表現為630.77MB/s,平均搜尋時間為41 us。

3DMark的系統儲存測試成績為3550分,明顯高於資料庫中2234分的平均成績。

在3DMark新加入的DirectStorage測試中,開啟DirectStorage功能可提高266.8%的遊戲讀取頻寬表現。

筆者也使用太空戰士XIV:黃金的遺產(FINAL FANTASY XIV: Dawntrail)進行測試,在4K解析度、Maximum畫質設定之總成績為20067分。

遊戲的讀取效能部份則為5.899秒。

在整體測試過程中使用CrystalDiskMark監控溫度變化,在搭配主機板內建之散熱片時,最高溫僅為攝氏58度,表現相當出色。

若拆下散熱片只靠固態硬碟上的石墨烯導熱墊,最高溫會達到攝氏65度,也算不錯的表現。

低溫是最大亮點

從測試結果可以看到,搭載SM2508控制器的Black Opal X570 PRO SSD 2TB固態硬碟在效能表現方面能夠發揮PCIe Gen 5的優勢,達到超過14000 MB/s的傳輸速度,而就算不使用主機板內建的散熱片,運作過程的最高溫度也僅為攝氏64度,表現相當冷靜。

低溫的優勢在於不會因為碰觸到保護溫度而被強制降速,或是被強制斷電保護,對於無法加裝散熱片的筆記型電腦、掌上型電腦或是迷你電腦等裝置來說,更能確保運作的穩定性,並同時享有PCIe Gen 5的高速傳輸效能。

加入T客邦Facebook粉絲團
✇T客邦-Techbang

Intel與工研院展示雙相浸沒式水冷等多種伺服器散熱方案,目標2500 W解熱能力

2025超流體先進散熱論壇於3月12日於台北南港展覽館舉行,工研院、Intel與眾多生態系合作夥伴帶來多種針對伺服器以及資料中心設計的散熱方案。4b291d205c3ff1b15ec050ae08bd5b88

2025超流體先進散熱論壇於3月12日於台北南港展覽館舉行,工研院、Intel與眾多生態系合作夥伴帶來多種針對伺服器以及資料中心設計的散熱方案。

散熱協助AI應用與永續發展

近年隨著AI應用蓬勃發展,各式能強化AI運算效能的GPU(圖型處理器)以及AI加速器也朝更大規模的方向發展,導致晶片功耗急遽提高,進而推升解熱能力的需求。另一方面隨著環保與永續發展等相關法規的更新,讓伺服器與資料中心的能源效率也成為發展目標,而改善整體散熱效率也是重中之重。

延伸閱讀:Intel於永續日活動展示多樣策略,電源管理、液冷、智慧節能多管齊下

為了要強化解熱能力與散熱系統的能源效率,許多伺服器、機櫃甚至是資料中心已經採用冷板式液體冷卻或浸沒式液體冷卻取代傳統的氣體冷卻散熱方案,其中冷板式液體冷卻為透過管線將冷卻液送至零組件的冷板(Cold Plate)進行散熱,而浸沒式液體冷卻則是將伺服器浸泡在不導電的冷卻液中,讓散熱液直接帶走零組件產生廢熱。

浸沒式液冷可以再行進行細分,單相浸沒式液冷是指冷卻液在工作過程始終保持為液態,透過冷卻液分配裝置(Coolant Distribution Unit,以下簡稱CDU)將伺服器的水高溫液體送到外部熱交換器,待降溫後再重回循環。

二相浸沒式液冷則是冷卻液在接觸熱源後會蒸發為氣態,在吸收潛熱的過程中帶走更多廢熱以提升解熱能力,並在通過冷凝管等熱交換裝置凝結為液態後再重回循環。最簡單的分辨方式為二相浸沒式液冷運作時,會在熱源周圍產生許多氣泡。

浸沒式液冷技術的優點為不需考慮傳統氣冷的對流因素,有助於縮小伺服器尺寸,省去風扇的維護與噪音,並可提高電力使用效率(PUE,等於1代表最佳效率,電力完全應用於運算設備),對節約總體持有成本(TCO)也有幫助。

工研院電光系統所副組長戴明吉於超流體先進散熱技術論壇說明千瓦級晶片散熱技術。

晶片的功耗及急遽上升,代表著散熱的需求也越來越高,單一晶片的功耗估計於2028年提高至2000 W。

千瓦級晶片散熱可透過冷板式與浸沒式液體冷卻等方式達成。

無論是冷板式與浸沒式液體冷卻,都可依冷卻液是否會在運作時蒸發再細分為單相或二相(雙相)模式。

根據電光系統所的分析,影響晶片散熱最大的因素為處理器的「鐵蓋」(Lid),其次為散熱器,因此導入均溫板上蓋(VC Lid)以及液冷是當務之急。

均溫板上蓋除了能應用於氣冷與冷板式液冷,也能在浸沒液冷大顯身手。

電光系統所開發的均溫板上蓋採用創新結構,透過內部錐台提高散熱接觸表面積,並透過冷凝水收集片強化對錐台散熱。

內部金屬採特殊電鍍加工,以絨毛狀結構強化含水量與毛細現象之推力。

二相浸沒式液冷之冷凝器也透過特殊的液膜截斷設計提高效能。

均溫板蒸發器(VC Boiler)之結構可以加速冷卻液蒸發,並快速脫離表面以帶走廢熱。

參考造船經驗降低阻力

Intel表示超流體技術的概念來自三菱重工應用於大型船舶的空氣潤滑系統,透過在流體注入適量氣泡的方式降低流體的黏性(Viscosity),進而降低冷卻液循環時的阻力,達到提高解熱能力的效果。

另一方面,雖然純水具有較高的比熱,但是卻容易因為含有雜質而導電(可能導致泡在散熱液中的伺服器損壞),在選擇純水做為散熱液時需要投入相當成本去除雜質。選擇油類做為散熱液則可提高絕緣性,具有不易導電的特性,雖然油類的比熱較小且黏性較大,但透過超流體技術就可改善黏性,並以較高的冷卻液流量克服比熱較低的缺點。

Intel首席工程師陳羿函在論壇中分享Intel超流體技術的發展路線圖。

Intel於2021至2022年間推出TDP(熱設計功耗)達500W的浸沒式液冷參考方案,並預計於未來透過新型冷卻液以及二相冷板等技術,將TDP推高至2500W。

Intel技術經理吳佳鴻也介紹了許多超流體技術的特色。

▲三菱重工在大型船舶底部導入空氣潤滑系統,可以降低10~20%船底阻力,超流體技術也是採用相近概念,在流體注入適量氣泡的方式降低流體的黏性。

超流體技術能夠應用於冷板式或浸沒式液冷方案,主要需要修改的部分為在CDU加上超流體產生器。

在現有設備中導入超流體技術的修改成本相對很低,卻能改善8.8~%11.4%的熱阻值(Thermal Resistance)。

就地取材注入空氣

Perstorp(柏斯托)在論檀展示區展示「Synmerse DC」高效冷卻液,具有出色熱傳導性,並具有高閃點、高燃點、介電性等安全特性,不含PFAS(全氟/多氟烷基物質)等有害物質,且相容Intel之超流體技術,為企業發展的永續性進一份力。

Mandala(曼德拉全球)展示的超流體產生器為例,它可以安裝到現有的CDU系統上,並將氣泡混入冷卻液中,為冷卻液添加超流體性質。由於氣泡的「原料」取自於環境中的空氣,因此不需額外耗材,維護部分只需約每5年更換空氣濾網即可。由於超流體中的氣泡可以存在一段時間,因此超流體產生器不需一直維持在啟動狀態,大約每小時運作5至10分鐘即可,相當節省電力。

在Perstorp「Synmerse DC」高效冷卻液展示中可以看到二相浸沒式液冷方案運作的狀況。

整個伺服器泡在冷卻液中,除了透過冷卻液流動帶走廢熱之外,冷卻液蒸發過程也能帶走更多廢熱。

▲二相浸沒式液冷的展示影片,可以看到冷卻液蒸發成氣泡的樣子。

Mandala則是展出超流體產生器,它的外型有如泵浦,能在冷卻液混入適量氣泡,讓它成為超流體。

Mandala超流體產生器,能相容於多種冷卻液、PG25、合成油、氟化液等,為其添加空氣潤滑效果。

2025超流體先進散熱技術論壇集合超過10家生態系合作夥伴,參與人數共計逾500人,期望發揮帶動冷卻生態系發展之任務。

加入T客邦Facebook粉絲團
✇T客邦-Techbang

AMD Ryzen 9 9950X3D效能實測:第2代3D V-Cache技術解放功耗上限與效能表現

AMD發表採用Zen 5運算架構搭配3D V-Cache技術的Ryzen 9 9950X3D / 9900X3D等處理器,筆者將介紹它們的特色,並針對前者進行效能實測。2b271498cc4109494e9397cfce18cf54

AMD發表採用Zen 5運算架構搭配3D V-Cache技術的Ryzen 9 9950X3D / 9900X3D等處理器,筆者將介紹它們的特色,並針對前者進行效能實測。

散熱、功耗上限皆優於前代

AMD先前於Zen 3世代的Ryzen 7 5800X3D導入3D V-Cache技術,透過先進封裝的方式在原有的處理器上額外擴充L3快取記憶體容量,改善遊戲與特定應用程式的效能表現。此後AMD也推出Zen 4世代的Ryzen 7000X3D系列,以及Zen 5世代的Ryzen 7 9800X3D,這次則是推出Ryzen 9 9950X3D / 9900X3D等2款新型號,並於3月12日正式上市。

延伸閱讀:
Ryzen 7000系列處理器也有3D V-Cache了!AMD Ryzen 9 7950X3D效能實測
Zen 5效能實測(二):Ryzen 9 9950X、Ryzen 9 9900X上市,正16大核怪獸降臨
AMD Ryzen 7 9800X3D處理器效能實測:搭載第2代3D V-Cache,遊戲效能再度爆錶!

第2代3D V-Cache與前代並同樣透過直接銅對銅連接(Direct Copper-to-Copper Bonding)與矽穿孔(Through Silicon Via,TSV)等技術連接,最大的改變之處為將擴充的L3快取記憶體改為堆疊至CCD(Core Chiplet Die,核心裸晶)下方,且不像前代需要透過結構性矽晶(Structural Silicon)填充空隙。

這樣最大的好處在於處理器核心為於整顆晶片的最上層,有助於改善散熱,這讓Ryzen 9 9950X3D / 9900X3D的TDP分別達到170W、120 W,維持與非X3D版本相同,能夠帶來更高的效能表現,並爭取更高的超頻潛力,對於玩家來說是一大福利。

不同於8核心的Ryzen 7 9800X3D僅由1組CCD構成,這次則是推出Ryzen 9 9950X3D / 9900X3D分別為16、12核心,並具有2組CCD。由於只有其中1組CCD具有3D V-Cache,因此對作業系統而言屬實異質運算核心,需要額外的軟體最佳化以確保完全發揮效能。

AMD也對此改善了主機板晶片組的驅動程式,透過AMD Provisioning Package Service偵測使用者是否更換處理器,並於開機時自動切換Windows作業系統的佈建套件(更換處理器後不需重灌作業系統),並且可手動將未被辨識的遊戲加入最佳化清單。驅動程式同時也更新AMD 3D V-Cache Performance Optimizer以修正Windows 10作業系統中VBS虛擬化安全性資料庫的效能問題。

(若手機版瀏覽器無法顯示表格,請點我看完整表格

Ryzen 9000系列處理器規格簡表
處理器型號 核心/執行緒 基礎時脈 最大Boost時脈 L2快取記憶體 L3快取記憶體 可用PCIe通道數 內建顯示運算單元、時脈 TDP 發表當時定價(美金)
Ryzen 9 9950X3D 16 / 32 4.3 GHz 5.7 GHz 16 MB 128MB 24x PCIe Gen 5 2CUs、2200MHz 170 W $699
Ryzen 9 9950X 16 / 32 4.3 GHz 5.7 GHz 16 MB 64 MB 24x PCIe Gen 5 2CUs、2200MHz 170 W $649
Ryzen 9 9900X3D 12 / 24 4.4 GHz 5.5 GHz 12MB 128MB 24x PCIe Gen 5 2CUs、2200MHz 120 W $599
Ryzen 9 9900X 12 / 24 4.4 GHz 5.6 GHz 12 MB 64 MB 24x PCIe Gen 5 2CUs、2200MHz 120 W $499
Ryzen 7 9800X3D 8 / 16 4.7 GHz 5.2 GHz 8 MB 96 MB 24x PCIe Gen 5 2CUs、2200MHz 120 W $479
Ryzen 7 9700X 8 / 16 3.8 GHz 5.5 GHz 8 MB 32 MB 24x PCIe Gen 5 2CUs、2200MHz 65 W $359
Ryzen 5 9600X 6 / 12 3.9 GHz 5.4 GHz 6 MB 32 MB 24x PCIe Gen 5 2CUs、2200MHz 65 W $279

Ryzen 9 9950X3D與Ryzen 9 9950X相比,基礎、最大Boost時脈同為4.3 GHz、5.7 GHz,L3快取記憶體由64MB擴充為128MB。

Ryzen 9 9900X3D與Ryzen 9 9900X相比,基礎時脈同為4.4GHz,但最大Boost時脈由5.6 GHz下修為5.5 GHz,L3快取記憶體由64MB擴充為128MB。

AMD AM5腳位處理器規格一覽表。

Ryzen 9000X3D系列採用的第2代3D V-Cache將擴充的L3快取記憶體堆疊至CCD下方,有助於改善散熱。

Ryzen 9 9950X3D的處理器渲染圖,由於3D V-Cache位於其中1組CCD下方,所以2組CCD的外觀並無不同。

晶片組驅動程式的AMD Provisioning Package Service能夠自動偵測處理器並於切換Windows作業系統的佈建套件,並且可手動將未被辨識的遊戲加入最佳化清單。。

驅動程式的AMD 3D V-Cache Performance Optimizer修正Windows 10作業系統中VBS虛擬化安全性的效能問題。

AMD Application Compatibility Database則包含多款遊戲最佳化資訊,能提升遊戲效能表現。

根據AMD提供的數據,Ryzen 9 9950X3D在40款遊戲的效能平均領先競爭對手Intel Core Ultra 9 285K達20%。

Ryzen 9 9900X3D與Core Ultra 9 285K之效能對照,表現也相當亮眼。

AMD也提供了Ryzen 9 9950X3D與Ryzen 7 9800X3D在不同遊戲的效能對照圖表。雙方各有輸贏,但平均差距只有1%,而最大的落差在10%之內。

測試環境與條件

這次測試使用AMD提供的「平台套餐」,內容包含Ryzen 9 9950X3D處理器、ASRock X870E Taichi主機板、G.Skill DDR5-6000記憶體、Samsung 990 Pro 1TB固態硬碟,比較可惜的是沒有Ryzen 9 9900X3D。其於對照組的成績則取自先前專題報導。

這次測試過程除了手動開啟EXPO功能,讓記憶體自動超頻至DDR5-6000之外,其餘BIOS / UEFI的設定皆維持預設值。

所有成績除了Handbreak影片轉檔僅執行1輪之外,其餘項目都是進行2輪測試,在確定沒有極端值後取平均,遊戲效能使用遊戲內建的測試模式,而《絕對武力2》為手動操作進行與電腦BOT於Dust 2地圖之對戰,搭配NVIDIA FrameView記錄FPS成績。

遊戲部分在1080p、2K、4K解析度搭配最高畫質設定,若有設定範本則套用最高範本,若無則將所有畫質相關項目調至最高,關閉VRS或動態解析度等設定,並僅進行開、關光線追蹤功能的調整。

測試平台:
處理器:AMD Ryzen 9 9950X3D、Ryzen 7 9700X
散熱器:MSI MEG Coreliquid S360
主機板:ASRock X870E Taichi(UEFI版號:3.17.TS03 – AMD AGESA ComboAm5PI 1.2.0.3)
記憶體:G.Skill Trident Z5 Neo RGB 16GBx2(@DDR5-6000)
顯示卡:NVIDIA GeForce RTX 4090 Founders Edition
儲存裝置:Samsung 990 Pro 1TB
電源供應器:MSI MEG Ai1300P PCIE5
軟體環境:Windows 11專業版23H2(Build 26100.3194),GeForce Game Ready 572.60

Ryzen 9 9950X3D處理器本體與包裝盒,盒上可見3D V-Cache標示。

Ryzen 9 9950X3D裝上主機板的模樣。

本次測試用的主機板為ASRock X870E Taichi,它採用EATX尺寸,在4條DIMM記憶體插槽右方還有1組快拆PCIe Gen 4x4 M.2 2280插槽。

PCIe Gen 5x16插槽能夠用於連接顯示卡,上方的快拆M.2 2280插槽支援PCIe Gen 5x4匯流排,下方2組M.2 2280插槽支援PCIe Gen 4x4匯流排,但需使用螺絲起子拆裝。

I/O背板提供12組各式USB端子,其中2組為USB4端子。

Ryzen 9 9950X3D與主機板之CPU-Z資訊。

測試平台記憶體之CPU-Z資訊。

 (下頁還有測試數據分析)

 

Ryzen 9 9950X3D處理器運算效能分析

效能測試的前半部聚焦在處理器的運算效能,需要注意的是先前測試平台的記憶體有部分差異,而Ryzen 7 9700X使用105 W之cTDP設定。

圖表縮寫與處理器重點規格:
Core Ultra 9 285K:搭配Z890晶片組、DDR5-8000(CL=40)
Ryzen 9 7950X3D:搭配X670E晶片組、DDR5-6000(CL=30)
Ryzen 7 9700X(105W):搭配X870E晶片組、DDR5-6000(CL=28)、cTDP=105W
Ryzen 7 9800X3D:搭配X870E晶片組、DDR5-6000(CL=28)
Ryzen 9 9950X:搭配X670E晶片組、DDR5-6000(CL=30)
Ryzen 9 9950X3D:搭配X870E晶片組、DDR5-6000(CL=30)

各處理器在在綜合效能測試項目PCMark10 Extendend的表現都不錯,總分由Ryzen 9 9950X3D拿下冠軍,遊戲項目亦有佳績。

同為綜合效能測試的CrossMark中,Core Ultra 9 285K的表現最為出色,Ryzen 9 9950X3D則為AMD陣營最佳成績。

在Cinebench R20處理器渲染測試中,單、多核心皆由Core Ultra 9 285K奪標。Ryzen 9 9950X3D與前代Ryzen 9 7950X3D相比,單、多核心成績進步18.97%、19.81%,而與Ryzen 9 9950X相比也領先1.95%、5.86%。

Cinebench R23處理器渲染測試呈現接近的趨勢,Ryzen 9 9950X3D領先Ryzen 9 7950X3D約16.67%、18.69%,領先Ryzen 9 9950X約2.23%、5.31%。

最新版本的Cinebench 2024處理器渲染測試負載比較重,Ryzen 9 9950X3D領先Ryzen 9 7950X3D約22.81%、18.44%,領先Ryzen 9 9950X約1.45%、8.49%。

POV-Ray光線追蹤渲染測試的部分與前面的測試接近,Ryzen 9 9950X3D領先Ryzen 9 7950X3D約15.29%、18.37%,領先Ryzen 9 9950X約2.06%、5.19%。

Ryzen 9 9950X3D在V-Ray光線追蹤渲染測試超車Core Ultra 9 285K,領先幅度約為7.78%。

x264與x265 Benchmark軟體編碼影片轉檔測試的情況,其中X264有著對2組CCD的AMD處理器資源利用不佳的BUG,導致Ryzen 9 9950X與Ryzen 9 9950X3D表現較差。而X265部分則無此問題,由Ryzen 9 9950X3D拔得頭籌。

在Handbreak轉檔軟體進行4K影片純軟體轉檔測試(無使用硬體加速)中,16核32緒的Ryzen 9 9950X3D在H.264、H.265編碼都能微幅領先8P16E、24緒的Core Ultra 9 285K。

3DMark CPU Profile處理器多工測試能夠看出同處理器在不同負載的效能表現,Ryzen 9 9950X3D的表現甚至優於Ryzen 9 9950X。

分析3DMark CPU Profile處理器多工測試的多核心增益,可以看到Ryzen 9 9950X3D的曲線與Ryzen 9 9950X相當接近,並沒有因為追加3D V-Cache就讓多功效能打折扣。

L1快取記憶體頻寬的表現,Ryzen 9 9950X3D與Ryzen 9 9950X的表現差不多。

L2快取記憶體頻寬的表現部分也很接近。

L3快取記憶體頻寬在複製項目部分Ryzen 9 9950X3D表現較差。

在記憶體頻寬部分,Ryzen 9 9950X3D的表現略低於Ryzen 9 9950,Core Ultra 9 285K則因使用DDR5-8000記憶體而大幅領先。

各處理器的記憶體延遲表現,Ryzen 9 9950X3D在L1、L2快取記憶體部分表現與Ryzen 9 9950X接近,L3快取記憶體則延遲較高。

AIDA64燒機測試的功耗表現,預設TDP為170 W的Ryzen 9 9950X3D在運作時大約可以吃到約185~195W。

在燒機溫度表現部分,Ryzen 9 9950X3D的溫度在離95度的Tjmax保護溫度還有段距離。

遊戲效能測試

接下來我們繼續分析Ryzen 9 9950X3D在實際遊戲的效能表現。

首先看到競技類的《絕對武力2》,Ryzen 9 9950X3D在4K解析度的表現與Ryzen 7 9800X3D相同,符合預期,但是在1080p與2K解析度則異常低落。反複測試後狀況依舊,推斷應是Bug。

《極地戰嚎6》由於繪圖負擔較低,對處理器的效能較為敏感,在關閉光線追蹤的情況下,Ryzen 9 9950X3D都具有最佳表現,微幅領先於Ryzen 7 9800X3D。

《極地戰嚎6》開啟光線追蹤後,Ryzen 9 9950X3D還是表現很好,與不相上下Ryzen 7 9800X3D。

《電馭叛客2077》關閉光線追蹤時,Ryzen 7 9800X3D在1080p解析度表現最為突出,到了4K則因顯示卡效能瓶頸之故,呈現眾生平等的狀態。

《電馭叛客2077》開啟光線追蹤後,Ryzen 9 9950X3D與Ryzen 7 9800X3D在1080p解析度有所領先,到了4K解析度彼此落差不大。

兼顧生產力與遊戲效能

Ryzen 9 9950X3D最大的優勢就是借助第2代3D V-Cache的結構特色,讓它的TDP能維持與「非X3D」版Ryzen 9 9950X相同的170W,避免像前代Ryzen 9 7950X3D、Ryzen 9 7950X之TDP分別為120W、170W,而限制了處理器的效能發揮。另一方面,AMD也持續改進雙CCD處理器的效能最佳化,讓作業系統排程器能根據負載不同來調用適當的CCD,進一步降低異質CCD的效能虛耗,並盡可能將遊戲效能推至最高。

如果讀者的需求以遊戲為主,而沒有太多需要更多核心的使用情境的話,可以選擇價格較低的Ryzen 7 9800X3D。但是如果除了遊戲之外,還需要執行多組虛擬機器、程式編譯、多媒體創作、科學模擬、CAD等,對處理器核心數量需求較高的話,則更適合選擇Ryzen 9 9950X3D。

加入T客邦Facebook粉絲團
✇T客邦-Techbang

Framework推出Desktop桌上型電腦,採AMD Ryzen AI Max + 395處理器還可選貓扇

以模組化筆記型電腦聞名的Framework先前在Computex 24台北國際電腦展就預告他們會推出筆記型電腦以外的產品,如今揭曉答案為模組化桌上型電腦。4b881b62c90af94bea678ba82db08802

以模組化筆記型電腦聞名的Framework先前在Computex 24台北國際電腦展就預告會推出筆記型電腦以外的產品,如今揭曉答案為模組化桌上型電腦。

採用最強內顯處理器

Framework Desktop是款延續模組化設計概念的桌上型電腦,它的體積僅有4.5公升,採用代號為Strix Halo的AMD Ryzen AI Max 300系列處理器,可選擇Ryzen AI Max + 395或Ryzen AI Max 385。

延伸閱讀:
Framework模組化筆電跟上Intel Core Ultra AIPC風潮,終於推出SD讀卡機模組
Framework跳出x86!模組化筆電新增RISC-V架構主機板選擇
改造空間大的DIY筆電!Framework模組化筆電開放預購,最低價格22,500元起

其中Ryzen AI Max + 395的處理器部分採用Zen 5運算架構,具有16組實體核心並支援32條執行緒,L2、L3快取記憶體容量分別為16 MB、 64 MB,最高Boost時脈可達5.1 GHz。它搭配具有40組RDNA 3.5繪圖架構的Radeon 8060S內建顯示晶片,具有40組運算單元(CU),最高時脈可達2900 MHz。

在AI運算功能方面,Ryzen AI Max + 395支援AMD Ryzen AI 平台,並搭載AI運算效能達50 TOPS的NPU(神經處理器),全機AI運算效能高達126 TOPS。

Ryzen AI Max + 395之型號可搭配64 GB或128 GB的LPDDR5x-8000記憶體(On-Board設計,不可更換),Ryzen AI Max 385則僅有32GB容量選項。儲存裝置部分則提供2組PCIe Gen 4x4的M.2 2280插槽,消費者可選購500 GB到8 TB等容量的固態硬諜,或是不選購(自行準備)。

消費者也可在訂購時選擇Windows 11 Home / Pro等作業系統,或自行安裝Windows或Linux等作業系統。

Framework Desktop是款尺寸為20.55 x 9.68 x 22.61公分的迷你模組化桌上型電腦,體積僅有4.5公升。

它具有高度改裝的彈性,使用者可以輕鬆改裝面板、側板、內裝,並透過擴充模組調整前置I/O功能。

Framework Desktop的尺寸相當小巧,放在桌上也不會佔用太多空間。

放到背包也能輕鬆攜帶外出。

自由更換各種模組

Framework Desktop除了繼承Framework多元的擴充模組設計,能夠自由更換USB、USB Type-C、SD讀卡機、microSD讀卡機、固態硬碟、乙太網路、3.5mm音訊等模組。

此外Framework Desktop也提供了前面板裝飾模組以及透明側板等選購品,消費者可以購買各種顏色或是Framework、AMD、Tux(Linux小企鵝)、Arch Linux、Linux Mint等裝飾模組,自行改造視覺風格。

Framework Desktop的前面板也採模組化設計,能夠像積木一般自由更換面板模組。

使用者能在訂購時選擇多種前面板裝飾模組,打造喜歡的外觀風格。

在機身背面的I/O背板部分,提供USB 3.2 Gen 1、USB4、DisplayPort 2.1各2組,以及5GbE乙太網路、HDMI 2.1、3.5mm音訊端子各1組。

機身前方下側則提供2組Framework獨有的擴充模組空間,可以自由更換USB、USB Type-C、SD讀卡機、microSD讀卡機、固態硬碟、乙太網路、3.5mm音訊等模組。

在處理器散熱器方面,Framework Desktop也提供Cooler Master以及俗稱貓頭鷹的Noctua等多款風扇的搭配選擇。

使用者也可自行選擇要非透明或透明的機殼側板。

Framework Desktop預計於2025年第3季上市,目前已可預購(將按預購批次順序出貨),Ryzen AI Max + 395處理器搭配64 GB記憶體之價格為新台幣54,500元起,並依不同客製化選項而異。

加入T客邦Facebook粉絲團
✇T客邦-Techbang

RDNA 4繪圖架構之AI運算與FSR 4效能禁藥解析:遊戲FPS效能催上3.7倍

AMD在RDNA 4繪圖架構改善AI運算加速器,並新增支援更多資料類型,以及透過軟體最佳化提升運算效能,也帶來以機器學習為基礎的FSR 4升頻技術。0b32f2f6ab67b5b402bfad61460b81fc

AMD在RDNA 4繪圖架構改善AI運算加速器,並新增支援更多資料類型,以及透過軟體最佳化提升運算效能,也帶來以機器學習為基礎的FSR 4升頻技術。

回到系列文章目錄:AMD發表RDNA 4繪圖架構與Radeon RX 9070系列顯示卡,支援全新ML加持FSR 4升頻功能

AI效能最高翻8倍

筆者在先前《AMD RDNA 4繪圖架構說明》一文中提到RDNA 4架構的硬體設計改進,其中的第3代AI加速器(矩陣運算加速器)同樣支援Wave Matrix Multiply Accumulate指令集,並新增FP8與BF8(E4M3、E5M2)等資料類型,以及新增支援結構稀疏性(Structured Sparsity,可提升1倍峰值效能)。

與前代RDNA 3相比,RDNA 4的每組運算單元(CU)在FP64、FP32資料類型的基本運算效能相同,但在FP16有2倍效能表現,INT8、INT4則達到4倍,若再搭配結構稀疏性則可分別提高到4倍、8倍,提升相當顯著。

另一方面AMD也持續改善AI運算環境的框架,透過對模型的最佳化來提高整體運算效能,並簡化部署模型的工作流程。

RDNA 4除了延續支援FP64、FP32、FP16、BF16、INT8、INT4等資料類型的AI運算之外,還新增FP8與BF8等資料類型,以及新增支援結構稀疏性,提升各種運算條件下的峰值效能。

RDNA 3 / 4之每組CU能夠提供的基本運算量(Ops per CU)對照表。

從圖表可以清楚看出,RDNA 4的AI運算在不同資料類型搭配結構稀疏性最高可以達到RDNA 3峰值效能之8倍。

RDNA 4繪圖架構之AI運算與FSR 4效能禁藥解析:遊戲FPS效能催上3.7倍

▲在進行Stable Diffusion XL、Stable Diffusion 3、Flash Stable Diffusion 3、FLUX.1等模型的AI圖像生成運算時,RDNA 4架構能透過Microsoft Olive框架與最佳化的ONNX框架加速運算效能。

改善FSR 4與AFMF 2.1效能禁藥畫質

AMD也在FSR 4(FidelityFX Super Resolution 4)升頻功能導入機器學習(Machine Learning,AI運算的一個分枝)類型的模型,能夠在提升遊戲FPS效能的同時,改善升頻後的畫質表現。不過AMD資深副總裁暨GPU技術與工程研發王啟尚在Radeon RX 9000系列顯示卡發表會說明,FSR 4的模型採用FP8資料類型,然而RDNA 3 / 3.5以及先前的顯示架構並不支援FP8,代表只有採用RDNA 4架構的有Radeon 9000系列顯示卡才能使用這項功能。

值得注意的是AMD在FSR 3.1導入可升級式API,能夠降低已支援FSR 3.1的遊戲可以升級至FSR 4的開發門檻,讀者可以參考AMD提供的FSR 4遊戲相容清單,並在AMD Software Adrenalin Edition驅動程式中開啟FSR 4升頻功能。

另一方面,AMD也推出強化畫質的AFMF 2.1畫格生成(AMD Fluid Motion Frames)功能,它以先前推出的AFMF 2為基礎,能在所有使用DirectX 11、DirectX 12、OpenGL、Vulkan等繪圖API的遊戲強制開啟畫格生成,提升遊戲的FPS效能表現。

另一方面,AMD也在AMD Software中透過HYPR-RX整合多種改善遊戲效能與延遲的技術,讓玩家只需開啟HYPR-RX,就能自動套用多種技術為遊戲效能最佳化,簡化設定的操作流程。

FSR 4升頻技術以機器學習為基礎,能夠進一步改善升頻後的畫質。值得注意的是它能透過FSR 3.1的可升級式API直接套用於現有遊戲。

AMD利用搭載自家Instinct加速器的伺服器訓練FSR 4的機器學習模型,並將模型部署到玩家的電腦,透過RDNA 4架構的顯示卡進行推論運算,但需注意的是FSR 4的模型採用FP8資料類型,代表只有Radeon 9000系列顯示卡才能使用。

AMD特別說明FSR 4架構的「一條龍」生產流程,透過Zen與XDNA架構的處理器、神經處理器(NPU)開發程式,然後透過EPYC伺服器級處理器與Instinct加速器訓練模型,最後在RDNA 4架構的顯示卡進行推論運算。

根據AMDW提供的數據,FSR 4搭配畫格生成功能最高可以帶來3.7倍於原生FPS的效能表現。

受益於更強大的機器學習模型,FSR 4能夠提供更細緻的圖像品質,請注意建築物的尖塔部分。

歷代FSR與顯示卡的相容性列表。其中FSR 3的升頻功能需要Radeon RX 590以上之顯示卡,而畫格生成需要Radeon RX 5000系列以上。FSR 4的升頻與畫格生成皆需要Radeon RX 9000系列以上。

AMD透過HYPR-RX簡化玩家設定流程,可以「一鍵開啟」FSR、Anti-Lag、Boost、RSR、AFMA等多種升頻、最佳化功能。

Anti-Lag能夠降低遊戲操作延遲,透過更敏捷的反應速度提高玩家在遊戲中的競技優勢。

AFMA 2.1可以對幾乎所有遊戲強制開啟畫格生成功能,並相容於Radeon RX 6000系列之後的顯示卡,以及Ryzen AI 300系列處理器之內建顯示晶片。

AFMF 2.1較先前AFMF 2改善了圖像品質,能夠改善鬼影、精細材質、混疊等細節。

其中改善鬼影的效果最為明顯,可以看到AFMF 2(上)的車輪相當模糊,AFMF 2.1(下)則較為清晰。

透過HYPR-RX與AFMA 2.1能為遊戲帶來最多3倍於原生狀態的FPS效能。

AMD的FSR 4與競爭對手NVIDIA的DLSS 4相比,缺少了最多能讓FPS效能提升4倍的多重畫格生成功能,但卻能以同時開啟FSR與AFMF等2種畫格生成的方式達到接近的成效,有興趣的讀者可以參考筆者先前所寫的《AMD AFMF 2畫格生成效能禁藥再升級,疊加FSR 3猛上加猛效能實測!》一文,看看疊加2種效能禁藥的效果如何。

加入T客邦Facebook粉絲團
✇T客邦-Techbang

AMD Radeon RX 9070 XT系列顯示卡效能實測:最佳魔物獵人顯卡

AMD推出Radeon RX 9070 XT與Radeon RX 9070等2張RDNA 4架構顯示卡,不但大幅提高光柵化效能,也擺脫光線追蹤貧弱的印象,讓我們一起看看它的表現。C57c14651043de166aff3255b880d7a7

AMD推出Radeon RX 9070 XT與Radeon RX 9070等2張RDNA 4架構顯示卡,不但大幅提高光柵化效能,也擺脫光線追蹤貧弱的印象,讓我們一起看看它的表現。

回到系列文章目錄:AMD發表RDNA 4繪圖架構與Radeon RX 9070系列顯示卡,支援全新ML加持FSR 4升頻功能

首波RDNA 4顯示卡登場

AMD在2025年1月初的CES消費性電子展發表了採用RDNA 4架構的Radeon RX 9070系列顯示卡,並於2月28日舉辦顯示卡的上市發表會,產品將於3月6日正式發售。

RDNA 4架構的特色包括針對高階遊戲應用最佳化,不但強化了光柵化繪圖(Rasterization,即傳統繪圖)與光線追蹤繪圖的效能,也透過高效能機器學習(Machine Learning,屬於AI應用的範圍),與先前的RDNA 2架構相比,光柵化繪圖、光線追蹤繪圖、AI運算的效能表現大約可提升至2、2.5、4倍。

不過由於AMD這次並未推出Radeon RX 9070 XT以及Radeon RX 9070等2款型號的公板卡,因此我們使用合作夥伴的自製卡進行效能實測。

(若手機版瀏覽器無法顯示表格,請點我看完整表格

Radeon RX 9000系列顯示卡規格簡表
顯示卡型號 運算單元數量 遊戲時脈 Boost時脈 Infinity Cache容量 顯示記憶體容量 記憶體介面 典型顯示卡功耗 發表當時價格
Radeon RX 9070 XT 64 2.4 GHz 3.0 GHz 64 MB 16 GB GDDR6-256bit 304 W $599
Radeon RX 9070 56 2.1 GHz 2.5 GHz 64 MB 16 GB GDDR6-256bit 220 W $549

 

筆者收到的測試樣品為Sapphire Pure Radeon RX9070系列顯示卡,2者的外型完全相同。

Sapphire Pure Radeon RX9070系列顯示卡採用3風扇散熱方案。

顯示卡背面採用穿透式設計,並搭載鋁質金屬背板,可以避免顯示卡彎曲以及卡塵堆積。

比較特別的是在背面開口處有ARGB燈效訊號「Out」端子,但根據官方網站説明,將端子連接到主機板後可以讓主機板控制顯示卡燈光。

Sapphire Pure Radeon RX9070系列顯示卡採用雙槽設計,厚度為6.16公分,長度則為32公分。

電源輸入部分採用2組8-Pin PCIe電源端子。

影音輸出為HDMI 2.1b與DisplayPort 2.1a各2組。

測試環境與條件

本次測試過程除了手動開啟EXPO功能,讓記憶體自動超頻至DDR5-6000之外,其餘BIOS / UEFI的設定皆維持預設值,Resizable BAR為開啟狀態。至於對照組部分,則使用先前測試專題之成績,部分新加入項目則會於圖說中說明。

所有成績除了都是進行2輪測試,在確定沒有極端值後取平均,遊戲效能使用遊戲內建的測試模式,而《絕對武力2》使用CS2 FPS Benchmark工作坊地圖進行測試。

遊戲部分在1080p、2K、4K解析度搭配最高畫質設定,若有設定範本則套用最高範本,若無則將所有畫質相關項目調至最高,關閉VRS或動態解析度等設定,並僅進行開、關光線追蹤功能的調整。

測試平台:
處理器:AMD Ryzen 7 9800X3D
散熱器:MSI MEG Coreliquid S360
主機板:GIGABYTE X870E AORUS MASTER(UEFI版號N5 – AMD AGESA ComboAm5PI 1.2.0.2a)
記憶體:G.Skill Trident Z5 Neo RGB 16GBx2(@DDR5-6000)
顯示卡:Sapphire Pure Radeon RX9070 XT、Sapphire Pure Radeon RX9070
儲存裝置:Solidigm P44 Pro 1TB(系統碟)、Solidigm P41 Plus 1TB(遊戲碟)
電源供應器:MSI MEG Ai1300P PCIE5
軟體環境:Windows 11專業版23H2(Build 26100.3194),AMD Software Adrenalin Edition 24.30.31.03

測試平台之CPU-Z資訊。

Radeon RX9070系列顯示卡之GPU-Z資訊。

《魔物獵人:荒野》4K搭升頻剛剛好

筆者在這邊同樣使用《魔物獵人:荒野》的效能測試工具《Monster Hunter Wilds Benchmark》測試效能,並以正式版遊戲實際感受遊玩體驗。

在效能測試工具方面,Radeon RX9070 XT與Radeon RX9070在2K解析度、最高畫質並開啟光線追蹤(使用高解析度材質包DLC)時平均FPS分別有84.21與91.28幀的表現,高於60幀門檻,將解析度提升至4K之後則落至49.68與55.02幀,略低於門檻,可以搭配FreeSync顯示器降低視覺不流暢的感覺,算是可接受的範圍。而開啟FSR升頻(平衡模式)後,2者皆可衝到130幀左右,表現相當出色。

在實際進行遊戲部分,同樣使用上述4K最高畫質、光線追蹤、FSR升頻,並利用NVIDIA FrameView測量狩獵過程的FPS表現,Radeon RX9070 XT平均與99百分位(1% Low)FPS分別為103.552、65.117幀,Radeon RX9070則為91.977、65.329幀,在肉眼觀查之下,遊戲的畫面與操作皆相當流暢,沒有卡頓或延遲等問題,判定2者皆能滿足《魔物獵人:荒野》的遊戲需求。

▲Radeon RX9070 XT執行《Monster Hunter Wilds Benchmark》效能測試工具展示,影片使用Radron Software進行螢幕錄影,將會稍微影響效能,因此實際效能表現請以下方圖表為準。

▲Radeon RX9070 XT執行《魔物獵人:荒野》正式版遊戲,感覺相當流暢。

▲Radeon RX9070執行《Monster Hunter Wilds Benchmark》效能測試工具。

▲Radeon RX9070執行《魔物獵人:荒野》正式版遊戲,過程FPS大多能保持在100幀以上。

在《魔物獵人:荒野》關閉光線追蹤的情況下,Radeon RX9070 XT在4K解析度的平均FPS突破60幀。

《魔物獵人:荒野》開啟光線追蹤後,Radeon RX9070在4K解析度的表現微幅落後GeForce RTX 5070 Ti約2.85%,但2者價格可是差了美金200元!

《魔物獵人:荒野》開啟光線追蹤搭配升頻,Radeon RX9070系列2款顯示卡之平均FPS都具有超過130幀的表現。

(下頁還有更多效能測試)

 

測試軟體分析

在效能測試前半段,我們先來看RX 9070 XT與RX 9070在3DMark與Procyon等測試軟體的表現如何。

3DMark Fire Strike採用Direct X 11繪圖API搭配1080p解析度(1920 x 1080),RX 9070 XT的圖像分數領先RX 9070約8.27%,而RX 9070領先同價格的RTX 5070約10.49%。

Fire Strike Extreme將解析度提升至2K(2560 x 1440),RX 9070 XT與RX 9070的差距約為9.69%。

Fire Strike Ultra進一步將解析度提升至4K(3840 x 2160),RX 9070 XT與的RTX 5070的差距微幅擴大至9.92%。

3DMark Time Spy採用Direct X 12搭配2K解析度,RX 9070 XT與的RTX 5070的差距拉開至12.55%。

Time Spy Extreme將解析度提升至4K,上述2組對照差距變動為10.4%、22.64%。

Speed Way是採用DirectX 12 Ultimate繪API與DirectX Raytracing tier 1.1光線追蹤技術,具有全域照明與反射等效果,並透過Mesh Shaders進行效能最佳化,可以反映最新AAA大作遊戲的效能表現。RX 9070 XT領先RX 9070約7.61%而AMD陣營的光線追蹤較弱的狀況也在此浮現,RX 9070與RTX 5070僅開出領先0.06%的平盤。

Steel Nomad採用DirectX 12繪圖API搭配14K解析度,雖然不使用光線追蹤技術,但具有目前最高的繪圖運算負載。上述2個組合差距為14.91%、26.51%,RX 9070再次與RTX 5070拉開差距。

3DMark Port Royal採用DirectX Raytracing(DXR)光線追蹤繪圖技術搭配2K解析度,是考驗顯示卡光線追蹤效能的競技場。2個組合的差距約為13.13%、14.76%,RX 9070的表現不錯。

在UL Procyon測試軟體的AI Computer Vision電腦視覺項目中,RX 9070 XT領先RX 9070約5.32%,而2者可以把前代RX 7800 XT甩開。

在Procyon的AI Image Generation圖像生成部分,RX 9070 XT在SD 1.5與SDXL等模型分別領先RX 9070約12.77%、10.64%。

在圖像生成時間部分,RX 9070 XT與RX 9070大約只需前代RX 7800 XT的一半。

Procyon AI Text Generation文字生成部分,RX 9070 XT領先RX 9070的幅度約在4.85%~9.1%之間,然後RX 9070落後同價格的RTX 5070約24.52%~43.57%。

各種模型FTFF(產生第1組字詞)速度表現,NVIDIA陣營的表現明顯較佳。

每秒產生的字詞部分,RX 9070 XT的速度微幅領先RX 9070。

遊戲效能測試

接下來我們繼續分析RX 9070 XT與RX 9070在實際遊戲的效能表現。

在競技類的《絕對武力2》中,RX 9070 XT與RX 9070在1080p與2K解析度的平均FPS與99% FPS(1% Low)皆超過144幀,至於4K解析度平均FPS近120幀,99% FPS皆高於60幀,能夠滿足多數玩家的競技需求。

《看門狗:自由軍團》關閉光線追蹤時,RX 9070在3種解析度大幅領先競爭對手RTX 5070約26.44%、27.35%、27.41%。

《看門狗:自由軍團》開啟光線追蹤後,RX 9070仍以13.89%、13.49%、11.43%的幅度超越RTX 5070。

《戰慄深隧:流亡》關閉光線追蹤時,RX 9070領先RTX 5070約6.57%、8.64%、10.61%。

《戰慄深隧:流亡》開啟光線追蹤後,RX 9070在1080p解析度與RTX 5070開出平盤,2K與4K解析度領先約6.95%、5.15%。

《極地戰嚎6》由於繪圖負擔較低,對處理器的效能較為敏感,RX 9070領先RTX 5070約11.66%、17.93%、26.11%。

《極地戰嚎6》開啟光線追蹤後,差距變為9.83%、17.61%、24.38%。RX 9070的表現甚至追過RTX 5070 Ti。

《刺客任務III》Dubai(杜拜)測試項目包含多種場景與NPC角色,整體負擔較低,RX 9070與RTX 5070差距為21.8%、20.28%、21.57%。

Dubai開啟光線追蹤後,差距約為8.13%、7.74%、6.50%。RX 9070 XT的表現與RTX 5070 Ti接近。

《刺客任務III》Dartmoor(達特穆爾)測試項目則包含許多槍枝射擊與爆炸效果,充滿物理與粒子模擬,對處理器的要求比較高,可以看到1080p解析度皆碰到CPU效能瓶頸限制。RX 9070在3種解析度領先RTX 5070約1.13%、4.30%、12.26%。

Dartmoor開啟光線追蹤後,1080p解析度仍卡在CPU效能瓶頸,各解析度差距約為5.89%、8.12%、8.6%。RX 9070 XT也緊咬RTX 5070 Ti。

《電馭叛客2077》關閉光線追蹤時,RX 9070能夠領先RTX 5070約8.46%、10.84%、15.49%。

《電馭叛客2077》開啟光線追蹤後,RX 9070受益於容量較大的顯示記憶體,仍能以1.7%、1.18%、0.41%的差距微幅領先RTX 5070,表現實著不錯。

《黑神話:悟空》身為新一代效能殺手,RX 9070與RX 9070 XT在1080p解析度都能將平均FPS扛過60幀門檻,4K解析度則分別介於30幀最低標準的2側。

《黑神話:悟空》開啟光線追蹤後,AMD陣營的表現慘不忍睹。

魔物獵人專用卡就是你了!

先從官方定價來看Radeon RX9070與GeForce RTX 5070皆為美金549元,自然是直接捉對廝殺,而Radeon RX9070 XT與GeForce RTX 5070 Ti分別為美金599、749元,雖有明顯價差但我們還是將它們放在同組進行比較。

在近期最熱門的《魔物獵人:荒野》中,無論在何種測試條件下,2張Radeon RX9070系列顯示卡的表現皆優於競爭對手,Radeon RX9070甚至可以在不開升頻的原生畫質下,越級追上GeForce RTX 5070 Ti。雖然目前遊戲只原生支援DLSS 3,在未來更新支援DLSS 4(或透過DLSS覆寫功能強制開啟)後可以再次提升FPS效能,但Radeon RX9070系列提供的130幀平均FPS已經能夠帶來足夠流暢的視覺體驗。

而在《電馭叛客2077》部分,Radeon RX9070的光線追蹤效能也與同價位的GeForce RTX 5070並駕齊驅,一甩AMD陣營在光線追蹤表現不佳的陰影,在筆者測試的眾多遊戲中,只有《黑神話:悟空》的表現較為落後,其餘皆為領先。

Radeon RX9070 XT與Radeon RX9070最大的「問題」,大概就是2者的價格非常接近,筆者建議若預算充足可以直接選擇多付美金50元衝上Radeon RX9070 XT,享受更高的遊戲效能。

(點我回到系列文章目錄)

加入T客邦Facebook粉絲團
✇T客邦-Techbang

AMD RDNA 4繪圖架構說明:2倍光柵繪圖、2.5倍光追、4倍AI的效能躍進之旅

AMD推出的RDNA 4繪圖架構在光柵化、光線追蹤繪圖以及AI運算的效能表現較前代產品都有長足進展,讓我們一起瞭解其中的改進之處。E8a1a7846b29d2bf4df3016522696432

AMD推出的RDNA 4繪圖架構在光柵化、光線追蹤繪圖以及AI運算的效能表現較前代產品都有長足進展,讓我們一起瞭解其中的改進之處。

回到系列文章目錄:AMD發表RDNA 4繪圖架構與Radeon RX 9070系列顯示卡,支援全新ML加持FSR 4升頻功能

較RDNA 2提升2~4倍

RDNA 4繪圖架構在基礎的運算單元(Compute Unit,以下簡稱CU)、光線追蹤加速器、AI加速器等元件都有所改善,能夠帶來顯著的效能提升,筆者將AMD所舉行的說明會內容與簡報整理如下,我們先看到RDNA 4架構的特色說明。

RNDA4的特色包括針對高階遊戲應用最佳化、強化光柵化繪圖(Rasterization,即傳統繪圖)與運算效率、改善光線追蹤效能、支援高效能機器學習(Machine Learning,以下簡稱ML)、強化記憶體頻寬,改進多媒體功能。RNDA4架構的光柵化繪圖光線追蹤繪圖、AI運算的效能表現大約可提升至RDNA 2的2、2.5、4倍。

RDNA 4架構提供許多4K遊戲應用需要的改進,包括第3代光線追蹤單元、矩陣加速器(能提高AI與ML運算效能)、最佳化快取記憶體系統(2MB整合CU快取、8MB L2快取、64MB Infinity Cache)、使用高速GDDR6顯示記憶體、強化的指令處理器、2組媒體引擎、支援DisplayPort 2.1a與HDMI 2.1b的顯示引擎,並使用先進的TSMC(台積電)4nm節點製程。

RDNA 4的媒體引擎能夠提升25% H.264格式在低流量或是11% HEVC(H.265)格式的畫質表現,並改善AV1格式的B Frame(雙向預測畫格)效率,並對FFMAPEG、OBS、Handbreak、VLC等轉檔、直播、播放軟體最佳化。

RDNA 4的媒體引擎強化FreeSync電力最佳化,並支援硬體翻轉佇列(Flip Queue,可節省影片播放時的處理器耗電)、Radeon Image Sharpening 2影像銳利化等功能。

細看各種單元改進

在瞭解RDNA 4架構的特色之後,我們接著看看各種運算單元是如何改進並提升整體效能表現。

其中比較值得注意的部分是全新的定向包圍盒(Oriented Bounding Box),它透過旋轉包圍盒方向的方式,達成以較小包圍盒覆蓋物件,能夠降低整體運算的負載,達到提升光線追縱效能的效果。

在RNDA 4的運算引擎部分,純量運算單元新增支援FP32資料類型,並整合2組SIMD32向量單元、強化光線追蹤與矩形運算效能、改進排程器與指令預取能力。

光線追蹤加速器部分,RNDA 4的單元支援每包圍合8組光線或每三角型2組光線偵測,具獨立硬體光線追蹤個體轉換(Instance Transform)並改善BVH(Bounding Volume Hierarchy)資料結構、支援BVH8光線遍歷(Ray Traversal),以提高運算效能並降低記憶體佔用量。

新增支援定向包圍盒機制能夠旋轉偵測光線是否與物件接處的「包圍盒」,讓原本需要使用尺寸相對大了許多的包圍盒(右上圖),改為使用尺寸較小但可旋轉的包圍盒來覆蓋需要偵測的物件,達到大約提升10%光線遍歷效能的成果。

RDNA 4架構進一步改善亂序記憶體存取的能力,並支援來自不同渲染器(Shaber)的存取需求,進一步降低記憶體子系統統的延持,對光線追蹤繪圖的效能表現有關鍵性的幫助。

將上述多樣改進疊加起來之漏,RDNA 4每組CU的光線追蹤效能能夠提升至RDNA 3的2倍。

過去RDNA 3暫存器的設計概念為設想最差的定址狀況,可能會造成暫存器空間的浪費(右側上圖)。而RDNA 4則可動態排列資料(右側下圖,注意頂部的動態排列區塊),有助於提高暫存器使用率,發揮降低記憶體延遲並大幅提升渲染器效率等功用。

AMD也在簡報中說明,光線追蹤的方式為計算視線(Visibility)之反射、漫射路境並反推光線照射所走過的路徑。而路徑追蹤(Path Tracing,也稱為全光線追蹤)的運作原理則是直接計算大量光線照射路徑,可以提供逼真的光照效果,但運算負載相當吃重。

AMD將與Microsoft合作開發用於路徑追蹤的神經超取樣以及降噪規範,推動這項技術發展。

筆者將持續在下篇文章中說明RDNA 4架構的AI運算細節以及FSR 4升頻等功能,也會待時機成熟帶來Radeon RX 9070 XT與Radeon RX 9070顯示卡的效能實測專題,請讀者持續保持持續關注我們的報導。

點我回到系列文章目錄

加入T客邦Facebook粉絲團
❌