阅读疯子

阅读视图

发现新文章,点击刷新页面。

Intel發布Arrow Lake更新檔,修正Core Ultra 200S處理器30%效能損失問題

代號為Arrow Lake的Intel Core Ultra 200S系列處理器在推出時效能表現不如預期,而Intel也透過Windows Update更新檔來修正這些問題。Bd86ecdc72bd8dbe8c8b808b482f5be8

代號為Arrow Lake的Intel Core Ultra 200S系列處理器在推出時效能表現不如預期,而Intel也透過Windows Update更新檔來修正這些問題。

修正效能低落問題

Intel在官方部落格指出,許多不同媒體的Core Ultra 200S系列處理器效能測試結果落差甚大,且與內部測試不一致,於是團隊於2024年10月26日至11月8日間展開調查,並在4~6週期間分析成因與擬定修正計劃。

延伸閱讀:Intel Arrow Lake S效能實測:首波K版Core Ultra 9、7、5同場較勁

在調查之後,Intel表示可以將問題分為下列5大類,其中4類已經透過更新檔修正,並大幅改善效能。

  1. 缺少效能和電源管理套件(Performance & Power Management,PPM)
  2. APO(Application Performance Optimizer)最佳化無法生效
  3. 使用Easy Anti-Cheat防作弊服務造成當機
  4. BIOS / UEFI效能範本配置錯誤
  5. 新版BIOS / UEFI之效能最佳化

使用者可以更新至最新版本BIOS / UEFI,並將Windows 11更新至26100.2314版以上,就可以修正前4項的問題,第5項則需等待日後更新。

Intel也說明,PPM的功能為在Windows作業系統中調整處理器的時脈調節、核心暫停運作(Core Parking)、C-State省電模式等等,若PPM出了問題則會導致效能低落、虛耗電源等負面影響。

而Core Ultra 200S系列處理器則遇到核心資源調度異常、單執行緒效能異常、間歇性記憶體延遲異常等,估計造成6~30%的效能折損。

Core Ultra 200S系列處理器的5大問題現在已解決前4項,第5項預計在2025年1月修正。

APO為Raptor Lake Refresh(第14代Core i處理器)之新功能,能夠最佳化動態調配P-Core與E-Core資源。

Intel預告將在2025年1月CES 2025舉辦時推出最佳化BIOS / UEFI更新檔(即上述問題的第5項),但實際情況仍需依主機板廠商推出更新檔的時間為準。

加入T客邦Facebook粉絲團

Jetson Orin Nano開發套件動手玩(一):規格介紹與開箱

NVIDIA於GTC 2023春季場發表Jetson Orin Nano開發套件,提高入門級AI裝置的效能標竿,讓我們先看看它的規格分析。F5e6cc5c3a7831bb00c0f8c1e4d04f3e

NVIDIA於GTC 2023春季場發表Jetson Orin Nano開發套件,而昨天老黃不但推出加強版的Jetson Orin Nano Super價格還降價了,還提高入門級AI裝置的效能標竿。讓我們先看看先前的Jetson Orin Nano的規格分析。

入門級AI效能新基準

Jetson Orin Nano 8GB運算模組能在15W功耗模式下,提供40TOPS的INT8資料類型AI運算效能,相較於Jetson Xavier NX僅有21TOPS的效能高出1倍左右。而與Jetson Nano的INT16資料類型效能只有0.5TOPS相比,2者差距更為達到80倍之譜,此外Jetson Orin Nano 8的FP32資料類型CUDA核心效能也達到Jetson Nano的5倍,6組Arm Cortex-A78AE處理器核心也有近7倍處理器效能。

另一方面Jetson Orin Nano 8GB運算模組也能切換至7W功耗模式,帶來更具彈性的應用方式,。整體而言,Jetson Orin Nano最高能帶來50倍於Jetson Nano的電力效率。

受益於Jetson Orin Nano平台的效能提升,並可支援更多主流AI電腦視覺模型,開發者可以利用Jetson Orin Nano開發套件打造功能更多元的入門級AI機器人、無人機和相機等應用。

  1. Jetson Orin Nano平台支援之視覺模型
  2. NVIDIA PeopleNet v2.3:精簡人員檢測
  3. NVIDIA PeopleNet v2.5:最高準確度人員檢測
  4. NVIDIA Action Recognition Net:2D和3D人員姿勢辨識
  5. NVIDIA LPRNet:車牌辨識
  6. NVIDIA DashCamNet、BodyPoseNet:人員姿勢預測
  7. ResNet-50 (224×224):圖像辨識

NVIDIA規劃Jetson Nano、Jetson Orin Nano、Jetson AGX Orin等3種不同等級的開發套件。

根據NVIDIA官方提供的參考資料,Jetson Orin Nano 8GB在特定條件可以提供40倍於Jetson Nano的AI效能,以及50倍電力效率。

Jetson Orin Nano在電腦視覺領域可以提供30倍於Jetson Nano的效能,並透過軟體最佳化將差距拉到45倍。

豐富I/O功能

Jetson Orin Nano開發套件的I/O功能與Jetson Xavier NX開發套件比較接近,比Jetson Nano開發套件豐富許多,不但能支援microSD記憶卡,也能安裝M.2固態硬碟,以滿足吞吐量更大的運算需求。

Jetson Orin Nano開發套件規格特性一覽
運算模組部分:Jetson Orin Nano 8GB運算模組
處理器:6組Arm Cortex-A78AE v8.2 64-bit核心(1.5MB L2 + 4MB L3)
GPU:1024組NVIDIA Ampere架構CUDA核心+ 32組Tensor核心
記憶體:8GB 128-bit LPDDR5(頻寬=68 GB/s)
儲存媒體:M.2 NVMe固態硬碟、microSD記憶卡
消耗電力:7~15W
母板部分:NVIDIA Reference Carrier Board
攝影機端子:2組MIPI CSI-2 22-pin Camera Connectors
M.2:Key M PCIe Gen 3x4、M.2 Key M PCIe Gen3x2、M.2 Key E PCIe (x1) / USB 2.0 / UART / I2S / I2C
USB:4組USB 3.2 Gen2、USB Type-C(Debug、Device Mode專用)
網路:GbE乙太網路
顯示:DisplayPort 1.2(支援MST多重串流傳輸)
microSD讀卡機:支援UHS-1 SDR104模式
其它端子:40-Pin擴充端子(支援UART、SPI、I2S、I2C、GPIO)、12-Pin按鈕端子、4-Pin風扇端子、DC電源輸入端子
尺寸:100 x 79 x 21mm(包含底座、運算模組與散熱器)

Jetson Orin Nano開發套件將運算模組安裝於母板並搭配主動式散熱方案,外觀與Jetson Xavier NX開發套件比較接近。

Jetson Orin Nano提供2組MIPI CSI-2攝影機端子,方便影像辨識應用。

由於它的TDP可達15W,因此還是採用具有風扇的主動式散熱。

機身右側提供40-Pin擴充端子,方便連接各種外部裝置。

I/O背板區域提供4組USB 3.2 Gen2,以及Debug用USB Type-C、GbE乙太網路、DisplayPort 1.2、DC電源輸入端子各1組。

機身底部則有3組M.2插槽。

筆者將於下篇文章對Jetson Orin Nano開發套件進行效能實測,如果沒有意外的話,也計劃進行「咳咳」的測試,敬請期待我們的後續報導。

系列文章
NVIDIA推出Jetson Orin Nano開發套件,大幅提升AI入門裝置效能
Jetson Orin Nano開發套件動手玩(一):規格介紹與開箱(本文)
Jetson Orin Nano開發套件動手玩(二):效能實測

加入T客邦Facebook粉絲團

老黃刀法出鞘!NVIDIA推出價格砍半的Jetson Orin Nano Super開發套件

NVIDIA推出加強版的Jetson Orin Nano Super開發套件,不但AI運算效能較原始版本提升67.5%,價格也打對折下殺至美金249元。8a5ee75f6952959986acebe515ca47f8

NVIDIA推出加強版的Jetson Orin Nano Super開發套件,不但AI運算效能較原始版本提升67.5%,價格也打對折下殺至美金249元。

聖誕節打對折!

NVIDIA於GTC 2023春季展發表Jetson Orin Nano開發套件,筆者當時也進行開箱介紹與實測https://www.techbang.com/posts/105172-jetson-orin-nano-development-kit。

延伸閱讀:
NVIDIA推出Jetson Orin Nano開發套件,大幅提升AI入門裝置效能
Jetson Orin Nano開發套件動手玩(一):規格介紹與開箱
Jetson Orin Nano開發套件動手玩(二):效能實測

過了大約1年半之後,NVIDIA推出加強版的Jetson Orin Nano Super開發套件,並將價格由美金499元下調至249元,它由Orin Nano 8GB SoM系統化模組與擴充母板構成,SoM搭載6組最高時脈為1.7 GHz的Arm Cortex-A78AE處理器核心,以及1024組最高時脈為1020 MHz的Ampere架構CUDA核心。

「Super版」最大的改變為將TDP提高至20 W,硬體規格與原始版比較,主要差異為處理器、CUDA核心之時脈與記憶體頻寬提高,說穿了它就是超頻版本。值得注意的是,原始版也能透過更新韌體與作業系統的方式,解放TDP限制。

「Super版」除了將最高AI運算能力由原本的40 TOPS提高至67 TOPS,也將記憶體頻寬由68 GB/s提高至102 GB/s,帶來更出色的效能,也更適合應用於在邊緣運算導入生成式AI、機器人等專案。

此外NVIDIA也同時推出Super版Orin Nano與Orin NX SoM,提供更強的AI運算效能。

NVIDIA在2024年聖誕假期推出Jetson Orin Nano Super開發套件。

Jetson Orin Nano Super開發套件的效能較原始版大幅提升,價格則是下殺一半。

將Jetson Orin Nano在多種AI模型的效能標準化為1x,Jetson Orin Nano Super最高有2.04x的表現。

NVIDIA也同時推出Super版Orin Nano與Orin NX SoM。

Jetson Orin Nano Super開發套件規格一覽,綠字部分為Super版強化部分。

Orin Nano Super與Orin NX Super SoM規格一覽,綠字部分為Super版強化部分。

Jetson Orin Nano Super開發套件現已上市,可透過NVIDIA全球經銷夥伴購買。

加入T客邦Facebook粉絲團

Intel Arc B580效能實測,中堅價位新卡搶先報到

Intel推出至針對1440p遊戲應用規劃的Arc B580顯示卡,並透過XeSS 2升頻功能提升遊戲的FPS效能,就讓我們一起來看看它的表現。B89f9548c8edc1d40e67c10da85b1e40

Intel推出至針對1440p遊戲應用規劃的Arc B580顯示卡,並透過XeSS 2升頻功能提升遊戲的FPS效能,就讓我們一起來看看它的表現。

搶先登陸中階市場

Intel的第2代Arc顯示卡首波將推出Arc B580、B570等價為為美金249與219元的產品,在AMD Radeon RX 8000系列以及NVIDIA GeForce RTX 50系列尚未發表的情況下,率先搶占2024 / 25賽季的中階市場。

延伸閱讀:Intel Arc Battlemage系列顯示卡架構說明,Xe2繪圖架構搭配XeSS 2 AI升頻
Intel Arc B580效能實測,中堅價位新卡搶先報到(本文)
Intel也有效能禁藥,Arc B580搭配XeSS 2升頻、畫格生成效能實測(工作中)

筆者已經在前文介紹過Arc Battlemage系列顯示卡架構,本文將重點放在Arc B580的效能測試,並分析XeSS 2升頻功能所帶來的效能助益。

Arc B580採用BMG-G21繪圖處理器,具有20組Xe核心,並搭載12 GB頻寬達456 GB/s的GDDR6記憶體,TDP為190 W,使用單組PCIe 8-Pin電源。

Arc B580、B570之規格簡表。

Intel Arc B580 Limited Edition的包裝以藍、紫色之漩渦為視覺設計主題。

Arc B580 Limited Edition之TDP僅190 W,採用雙風扇、雙槽設計。

從背面可以看到顯示卡尾端為穿透式散熱設計。

風扇可以直接將冷空氣吹送穿透散熱片,強化整體散熱效果。

電源部分需連接1組8-Pin PCIe電源端子。

I/O部分提供3組DisplayPort 2.1(最高支援UHBR 13.5)與1組HDMI 2.1。

Arc B580的影音輸出端子規格一覽。

測試環境與條件

本次測試過程除了手動開啟EXPO功能,讓記憶體自動超頻至DDR5-6000之外,其餘BIOS / UEFI的設定皆維持預設值,Resizable BAR為開啟狀態。

所有成績除了都是進行2輪測試,在確定沒有極端值後取平均,遊戲效能使用遊戲內建的測試模式,而《絕對武力2》為手動操作進行與電腦BOT於Dust 2地圖之對戰,搭配NVIDIA FrameView記錄FPS成績。

遊戲部分在1080p、2K、4K解析度搭配最高畫質設定,若有設定範本則套用最高範本,若無則將所有畫質相關項目調至最高,關閉VRS或動態解析度等設定,並僅進行開、關光線追蹤功能的調整。

至於對照組部分,則使用先前測試專題之Intel Arc A750與AMD Radeon RX 7600 / RX 7700XT以及NVIDIA GeForce RTX 4060 / RTX 4060 Ti 8GB / RTX 4070等顯示卡,但是它們皆搭配AMD Ryzen 7 7700X處理器與ASRock X670E Taichi主機板。考量到這些顯示卡大多落在中階區間,因此效能瓶頸大多在顯示卡本身,處理器造成的影響較小,對照組成績仍有一定參考價值。

另外筆者也加入Arc B580與Core Ultra 155H / 258V等行動版處理器之內建繪圖處理器(iGPU)之AI效能測試,在最後的《黑神話:悟空》、《絕對武力2》等2的項目則以NVIDIA GeForce RTX 4090顯示卡作為對照。至於XeSS 2的測試則會在下篇文章分析。

測試平台:
處理器:AMD Ryzen 7 9700X(105 W cTDP模式)
散熱器:MSI MEG Coreliquid S360
主機板:GIGABYTE X870E AORUS MASTER
記憶體:G.Skill Trident Z5 Neo RGB 16GBx2(@DDR5-6000)
顯示卡:Intel Arc B580 Limited Edition
儲存裝置:Solidigm P44 Pro 1TB
電源供應器:MSI MEG Ai1300P PCIE5
軟體環境:Windows 11專業版23H2(Build 22361.4460),Intel Graphics Software 32.0.101.6249

測試平台之CPU-Z資訊,使用AMD Ryzen 7 9700X處理器搭配GIGABYTE X870E AORUS主機板MASTER,並開啟105 W cTDP模式。

唯GPU-Z的部分使用Intel提供的32.0.101.6252版驅動程式查看規格資訊,可看到使用PCIe Gen 4x8匯流排並開啟Resizable BAR。

(下頁還有效能測試)

測試軟體分析

在效能測試前半段,我們先來瞭解Arc B580在3DMark與Procyon等測試軟體的表現如何。

數據圖表中的測試平台標記如下:
RX 7600:Ryzen 7 7700X、X670E晶片組、DDR5-6000、Radeon RX 7600
RX 7700 XT:Ryzen 7 7700X、X670E晶片組、DDR5-6000、Radeon RX 7700 XT
RTX 4060:Ryzen 7 7700X、X670E晶片組、DDR5-6000、GeForce RTX 4060
RTX 4060 Ti 8GB:Ryzen 7 7700X、X670E晶片組、DDR5-6000、GeForce RTX 4060 Ti 8GB
RTX 4070:Ryzen 7 7700X、X670E晶片組、DDR5-6000、GeForce RTX 4070
Arc A750:Ryzen 7 7700X、X670E晶片組、DDR5-6000、Arc A750
Arc B580:Ryzen 7 9700X(105 W cTDP)、X870E晶片組、DDR5-6000、Arc B580

3DMark Fire Strik採用Direct X 11繪圖API搭配1080p解析度(1920 x 1080),由於Arc B580使用Ryzen 7 9700X處理器,所以物理分數較高。觀察圖像分數可以看到Arc B580以25.67%的幅度領先於RTX 4060,甚至超過RTX 4060 Ti 8GB約2.71%。

Fire Strike Extreme將解析度提升至2K(2560 x 1440),在繪圖負載提高之後,Arc B580在圖像分數領先RTX 4060的幅度縮小至18.53%。

Fire Strike Ultra進一步將解析度提升至4K(3840 x 2160),Arc B580又將領先幅度擴大至33.60%。

3DMark Time Spy採用Direct X 12搭配2K解析度,Arc B580的處理器分數也因為使用Ryzen 7 9700X而特別凸出,至於圖像分數則領先RTX 4060約40%。

Time Spy Extreme將解析度提升至4K,Arc B580領先幅度擴大至43.24%。

Speed Way是採用DirectX 12 Ultimate繪API與DirectX Raytracing tier 1.1光線追蹤技術,具有全域照明與反射等效果,並透過Mesh Shaders進行效能最佳化,可以反映最新AAA大作遊戲的效能表現。Arc B580遇到光線追蹤就被RTX 4060超車,落後約3.59%。

3DMark Port Royal採用DirectX Raytracing(DXR)光線追蹤繪圖技術搭配2K解析度,是考驗顯示卡光線追蹤效能的競技場。這邊Arc B580反而能領先RTX 4060約29.66%。

但是看到同樣採用DXR技術的3DMark DirextX光線追蹤功能測試,Arc B580的表現落後RTX 4060約12.65%。

Arc B580使用PCIe Gen 4x8匯流排,在PCI Express功能測試中的頻寬表現為14.38 GB/s。

在Procyon AI電腦視覺測試中,以搭載Lunar Lake世代Core Ultra 258V處理器的Asus Zenbook S 14為主要對照。Arc B580的表現並無與Core Ultra 258V內建顯示晶片之繪圖處理器拉開明顯差距。

Procyon AI圖像生成部分,一樣與Core Ultra 258V進行對照,可以看到Arc B580的表現相當突出。

若參考Procyon AI圖像生成每張圖片所花費的時間,可以看到Arc B580在SD 1.5中大約4秒左右就可生成1張圖像,而SDXL則為23.44秒。

遊戲效能測試

接下來我們繼續分析Arc B580在實際遊戲的效能表現,看看它是否仍有「跑分快樂、遊戲翻車」的老問題。

《古墓奇兵:暗影》在關閉光線追蹤時,Arc B580與RTX 4060的表現相差不大,差距落在正5.05%到負11.78%之間。

《古墓奇兵:暗影》開啟光線追蹤後,Arc B580能夠領先RTX 4060約0.76%至28.83%不等,在2K解析度仍有超過65幀的平均FPS表現。先前Arc a750因無法執行測試,故無成績。

《看門狗:自由軍團》關閉光線追蹤時,Arc B580無法在2K解析度提供高於60幀的平均FPS,且到4K解析度才能領先RTX 4060。

《看門狗:自由軍團》開啟光線追蹤後,Arc B580能在2K解析度提供略高於30幀的平均FPS,勉強符合最低遊戲門檻。

《戰慄深隧:流亡》關閉光線追蹤時,Arc B580在1080p、2K解析度的表現不如RTX 4060,到4K解析度才因較高的顯示記憶體而扳回一城。

《戰慄深隧:流亡》開啟光線追蹤後,RTX 4060提早在2K解析度就碰到顯示卡效能瓶頸,讓Arc B580能夠超車。

《極地戰嚎6》由於繪圖負擔較低,對處理器的效能相當敏感,在較強處理器的助陣下Arc B580有較為亮眼的表現,但也讓對照組失去參考價值。

《極地戰嚎6》開啟光線追蹤後呈現相近的狀況,但也證明Arc B580能滿足2K解析度的遊戲需求。

《刺客任務III》Dubai(杜拜)測試項目包含多種場景與NPC角色,整體負擔較低,Arc B580的表現大約落在RTX 4060與RTX 4060 Ti 8GB之間。

Dubai開啟光線追蹤後由於繪圖負荷提升,Arc B580被RTX 4060超車。

《刺客任務III》Dartmoor(達特穆爾)測試項目則包含許多槍枝射擊與爆炸效果,充滿物理與粒子模擬,對處理器的要求比較高。儘管如此,Arc B580在1080p與4K解析度仍落後於RTX 4060,僅在4K解析度領先約10.37%。

Dartmoor開啟光線追蹤後,Arc B580就被RTX 4060甩開,在2K解析度的落後幅度達到29.11%。

《電馭叛客2077》閉光線追蹤時,Arc B580在3種解析度的表現都落後於RTX 4060。

《電馭叛客2077》開啟光線追蹤後,Arc B580反而能夠超越RTX 4060,但是就算在1080p解析度也無法達到平均FPS 60幀的門檻。

《絕對武力2》部分因遊戲版本更新而無法與上列對照組比較,筆者僅列出以GeForce RTX 4090重新測試的成績(但因為價格落差太大,也不適合直接比較效能)。可以看到Arc B580能在2K解析度提供超過120幀的平均FPS,99%百分位(1% Low)也超過100幀,能夠滿足電競應用的需求。

《黑神話:悟空》則是新一代效能殺手,Arc B580基本上無法滿足遊戲需求,需透過XeSS升頻技術彌補效能缺口。

填補中階市場空缺

目前低階顯示卡的市場已經被處理器內建顯示取代,目前桌上型處理器中顯示效能最高的就是AMD Ryzen 7 8700G,然而它大約只能滿足1080p解析度、中低畫質的遊戲需求,若玩家有1080p或2K解析度,搭配最高畫質加上光線追蹤的需求,就需添購中階獨立顯示卡。至於以4K遊戲應用的高階與旗艦等級的顯示卡,則有更多廠牌的產品可供選擇。

考慮到截稿當下,Ryzen 7 8700G的市場價格為新台幣9,450元,大約等於Arc B580美金249元(未稅價,約合新台幣8,160元,台灣價格尚未公布),若讀者已有現成的電腦的話,那麼單獨採購Arc B580也是個不錯的升級選擇,可以獲得較佳的遊戲體驗。

不過比較可惜的是,Arc B580僅搭載容量為12 GB的顯示記憶體,對於AI應用程式來說可能略顯不足,以筆者個人的使用經驗來說,使用SDXL或是Pony Diffusion模型生成1080p到2K解析度圖像時往往會占用14 GB顯示記憶體,若讀者想要使用這些功能的話,還是建議選擇NVIDIA GeForce RTX 4060 Ti 16GB以上的顯示卡。

最後預告一下,筆者也會針對XeSS 2的升頻與畫格生成功能進行測試,請讀者保持關注。

加入T客邦Facebook粉絲團

Intel Arc Battlemage系列顯示卡架構說明,Xe2繪圖架構搭配XeSS 2 AI升頻

Intel發表搭載Xe2繪圖架構的Arc Battlemage系列顯示卡,在效能測試解禁前夕,先讓我們來看看它的架構細節。47ca8ff4b6cf348f94b0eb6172fc2472

Intel發表搭載Xe2繪圖架構的Arc Battlemage系列顯示卡,在效能測試解禁前夕,先讓我們來看看它的架構細節。

第2代Arc登場

Intel在最初發表Arc顯示卡產品線時,就預告第1至4代的產品代號分別為Alchemist(鍊金術師)、Battlemage(戰鬥法師)、Celestial(天界人)、Druid(德魯伊)等充滿奇幻角色風格的名稱,如今也順利走到第2世代,首波將推出Arc B580、Arc B570等2款產品。

延伸閱讀:Intel Arc A750顯示卡效能實測,驅動更新、價格下殺是否值得進場?

Arc Battlemage系列顯示卡(以下簡稱B系列顯示卡)採用Xe2繪圖架構,支援SIMD16資料架構改善運算效率,並透過Xe矩陣延伸單元(Xe Matrix eXtensions,以下簡稱XMX)大幅提升AI運算效能。

Intel在測試說明文件中提到,Xe2的開發目標包括提高資源使用率、改善工作負載分配、無縫的軟硬體交握,以改善整體效率,根據官方提供的數據,能夠提升Xe核心效能最高達70%,並改善50%電力效率。

以Arc B580為例,它具有5組繪圖切片(Render Slice)以及1組媒體引擎,每組切片內部具有4組Xe核心與光線追蹤單元(Ray Tracing Unit,以下簡稱RTU),並有共用的L2快取記憶體。

上述Xe核心為B系列顯示卡的基礎運算單元,它由8組Xe向量引擎(Xe Vector Engine,以下簡稱XVE)構成,透過更寬的SIMD16寬度算術邏輯單元以強化效率與相容性,並搭載256 KB共用L1快取記憶體,以改善資料存取效率。而每組XVE所搭配的XMX能夠提供每週期2048次FP16或4096次INT8運算,並支援TF32、BF16、INT4、INT2等資料類型,在INT8資料類型的AI運算較能較傳統MAC(Multiply–accumulate,乘積累加運算)運算提高16倍之譜。

Xe2架構也整合第2代RTU,每組RTU具有3組遍歷管線(Traversal Pipeline,計算光線路徑)與18組接觸偵測單元(Box Intersection,偵測光線是否與物件接觸),較前代Xe-HPG提升50%,每運算週期能夠進行2次多邊型接觸偵測(Triangle Intersection,偵測光線是否與繪製的多邊型接觸),效能較前代提升100%,而搭載的BVH(Bounding Volume Hierarchies)快取記憶體容量也提升至16KB,為前代的2倍。

此外Xe2架構也支援DXR光線追蹤(DirectX Raytracing)、可變速率著色(Variable Rate Shading)、網格著色器(Mesh Shader)、取樣器回饋(Sampler Feedback)等多項DirectX 12 Ultimate功能,並進行效最佳化,以提供更完整的遊戲功能。

不過需要注意的是,Xe2架構的媒體引擎與Lunar Lake處理器內建的規格並不相同,因此不支援H.266(VVC)之加速,仍可H.264(AVC)、H.265(HEVC)、VP9、AV1 等格式之編解碼加速,以及JPEG、MPEG-2之解碼加速。另一方面雖然Arc B580、Arc B570等2款顯示卡都是採用PCIe x16的插槽,但僅使用PCIe Gen 4x8匯流排。參考其他廠商之中皆產品設計,這也是相當常見的規劃。

Intel發表Xe2架構的Arc Battlemage系列顯示卡,首波將推出Arc B580、Arc B570等2款產品。

2者分別將於2024年12月13日與2025年1月16日上市,其中只有Arc B580會推出等同公板卡的Intel Limited Edition。

Arc B580採用BMG-G21繪圖處理器,具有5組繪圖切片(Render Slice)以及1組媒體引擎,並搭載18 MB L2快取記憶體。

媒體引擎內部具有2組多格式轉碼器(Multi-Format Transcoder,MFX),支援H.264、H.265、VP9、AV1 等格式之編解碼加速,以及JPEG、MPEG-2之解碼加速。

每組切片內部具有4組Xe核心與光線追蹤單元,所有切片使有共用的L2快取記憶體。。

每組Xe核心則具有8組Xe向量引擎與Xe矩陣延伸單元。

Xe核心的算術邏輯單元原生支援SIMD16寬度,並支援SIMD32寬度,Xe矩陣延伸單元支援TF32、FP16、BF16、INT8、INT4、INT2等資料類型。

光線追蹤單元的各項單元為前代產品的1.5至2倍。

第2代Xe核心效能與前代相比最高提升達70%,並改善50%電力效率。。

細部分析Xe2架構的多項繪圖功能有20%到1150%不等的增益。

Arc B580、Arc B570的規格一覽。雖然表格未列出,但需要注意的是,它們僅使用PCIe Gen 4x8匯流排。

這2款顯示卡皆以1440p解析度遊戲應用為目標,瞄準普及性日益升高的1440p螢幕。

Arc B580的訂價為美金249元,光柵繪圖(左)與光線追蹤(右)效能表現較價位接近的NVIDIA GeForce RTX 4060、AMD Radeon RX 7600出色。

Arc B580的多款遊戲效能較前代Arc A750平均高出24%。

與GeForce RTX 4060相比則平均高出10%。

AI功能迎頭趕上

Intel這次也推出XeSS 2(Xe Super Sampling 2)超級採樣功能,除了既有的XeSS Super Resolution畫面升頻之外,也加入XeSS Frame Generation畫格生成以及XeSS Low Latency低延遲等功能。

畫面升頻、畫格生成功能的概念與NVIDIA DLSSAMD FSR等技術類似,前者會降低遊戲過程3D繪製畫面的解析度,並透過AI運算將其放大後再輸出,藉由降低繪圖負載以提升FPS並降低遊戲延遲,後者則是透過AI方式生成額外畫格,透過「補幀」的方式提升FSP與遊戲視覺流暢度,但對遊戲的延遲並無幫助。

至於XeSS Low Latency則與NVIDIA Flex、AMD Radeon Anti-Lag相近,都是透過改善遊戲API與資源調度的方式,縮短由玩家輸入指令到最終反應到螢幕上的延遲時間。

B系列顯示卡當然也具備執行AI功能的能力,支援PyTorch、ONNX、TensorFlow等框架與OpenVINO、ONNX、Web NN等執行環境,使用者可以自行安裝各種程式與模型,或是透過Intel提供的AI Playground軟體,體驗生成圖像(支援Stable Diffusion 1.5SDXL等模型)、圖片編輯、聊天機器人等AI功能。

XeSS 2包含畫面升頻、畫格生成、低延遲等功能。

XeSS Super Resolution畫面升頻功能會降低遊戲畫面繪製的解析度,並參考動態向量與歷史畫格等資訊,搭配AI推論放大畫面後再輸出至螢幕。

XeSS Frame Generation畫格生成則是參考動態向量、深度資料(Depth Map)等資訊,搭配AI推論生成全新的額外畫格。

畫面升頻與畫格生成可以同時使用,帶來與NVIDIA DLSS、AMD FSR等技術相近的遊戲效能提升功能。

根據Intel提供的數據,XeSS 2能在平衡模式下,將《F1 24》、1440p解析度、Ultra畫質的FPS效能推升至原始的3.2倍,若使用最高效能模式則可達到3.9倍。

遊戲延遲的部分,則是指玩家輸入指令後送達處理器運算、繪圖佇列,然後進入繪圖處理器繪製畫面,最後顯示於螢幕所經過的時間。

XeSS Low Latency能夠改善這段處理流程並縮短延遲。圖中上半部為一般流程,下半部為XeSS Low Latency流程,可以到主要省下繪圖佇列的等待時間。

上述3項XeSS 2功能可以在Arc A系列與B系列顯示卡 / 顯示晶片以及代號為Lunar Lake的Core Ultra 200V系列處理器使用。Core Ultra 1系列處理器(Meteor Lake)與Core Ultra 200S系列處理器(Arrow Lake-S)則不支援畫格生成。Tiger Lake、Alder Lake、Raptor Lake等第11~14代Core i處理器則只支援升頻功能。

Intel也提供完整的AI方案,能夠支援PyTorch、ONNX、TensorFlow等框架與OpenVINO、ONNX、Web NN等執行環境,並透過B系列顯示卡運算。

Intel提供的AI Playground軟體能夠讓使用者輕鬆使用生成圖像、圖片編輯、聊天機器人等AI功能。

根據Intel提供的數據,Arc B580在多項大型語言模型的每秒輸出字詞(Token)數量表現優於NVIDIA GeForce RTX 4060。

筆者也將製作Arc B580的測試專題,預計於2024年12月12日晚間10點新聞解禁時刊登。

加入T客邦Facebook粉絲團

Raspberry Pi 500與Raspberry Pi Monitor登場,裝起來就是筆電!

Raspberry Pi基金會推出Raspberry Pi 500鍵盤型電腦與Raspberry Pi Monitor攜帶型螢幕,以滿足更多使用情境需求。0981d2dad65fc04b29f015e433d06561

Raspberry Pi基金會推出Raspberry Pi 500鍵盤型電腦與Raspberry Pi Monitor攜帶型螢幕,以滿足更多使用情境需求。

Pi 5世代鍵盤登場

先前的Raspberry Pi 400Raspberry Pi 4為基礎,

將外型由原本的單板電腦,轉變為內建主機板的鍵盤,因此使用者只要將它接上滑鼠與顯示器,就能開始使用。

延伸閱讀:
文書機更方便啦!官方推出內建ARM晶片的Raspberry Pi 400鍵盤,接螢幕就可當電腦
Raspberry Pi 5終於來了!效能更高、內建PCIe匯流排還有實體電源鍵

而Raspberry Pi 500顧名思義就是以Raspberry Pi 5為基礎,它同樣採用Broadcom BCM2712 SoC,具有時脈高達2.4GHz的4核心64bit Arm Cortex-A76處理器,搭配 VideoCore VII繪圖處理器,記憶體部分僅提供8GB LPDDR4X-4267單一規格,不像Raspberry Pi 5提供2、4、8GB等選項

在I/O功能部分,Raspberry Pi 500具有USB 3.2 Gen1(支援同時5Gbps運作)、Micro HDMI(支援同時4K60p)端子各2組,以及USB 2.0、40-Pin GPIO與microSD與讀卡機各1組,並提供雙頻Wi-Fi 5與藍牙5.0等無線通功能。

Raspberry Pi Monitor則是專為Raspberry Pi設計的攜帶型螢幕,採用與官方外殼相同的配色,搭載可視尺寸與解析度為15.6吋、1920 x 1080的IPS類型面板,並內建1.2 W立體聲喇叭與VESA鎖孔,但官方指出色彩覆蓋率與可視角度只有45%與80度。

Raspberry Pi Monitor建議搭配5V3A的USB Type-C電源供應器,也可以透過隨附的USB Type-A轉Type-C線由Raspberry Pi機身供電,但後者會讓螢幕的量度與音量分別被限制在60%與50%(但還是夠亮、夠大聲)。

Raspberry Pi基金會推出官方版本Raspberry Pi 500鍵盤型電腦與Raspberry Pi Monitor外接式螢幕。

Raspberry Pi 500可以視為將Raspberry Pi 5主機板塞到鍵盤內的產品。

Raspberry Pi 500外觀以白色為基調,I/O端子放在鍵盤頂部。

I/O端子具有USB 2.0、USB 3.2 Gen1、microSD與讀卡機、電源、Micro HDMI、40-Pin GPIO。

Raspberry Pi Monitor為15.6吋、1920 x 1080的攜帶型螢幕,採用經典紅白配色。

這2款產品現已開賣,Raspberry Pi 500售價為美金90元(約合新台幣2,945元),加上滑鼠、27 W電源供應器、2 M micro HDMI對HDMI纜線的組合包售價為美金120元(約合新台幣3,930元),Raspberry Pi Monitor則為美金100元(約合新台幣3,275元),同時前代Raspberry Pi 400售價下調至美金60元(約合新台幣1,965元)。

加入T客邦Facebook粉絲團

3DMark更新DirectStorage測試,分析固態硬碟存取效能

UL宣佈將透過更新在3DMark加入DirectStorage測試項目,讓玩家透過量化數據瞭解DirectStorage帶來的遊戲效能改善。6cf769966c1de3ecbfb21acc7564a302

UL宣佈將透過更新在3DMark加入DirectStorage測試項目,讓玩家透過量化數據瞭解DirectStorage帶來的遊戲效能改善。

比較不同設定存取效能

DirectStorage是由Microsoft推出的DirectX家族API,能夠強化NVMe通訊協定的固態硬碟I/O效能,並使用GDeflate壓縮檔案格式透過繪圖處理器(GPU)平行運算的特色加速解壓縮,能縮短遊戲載入資料的時間,並快速讀取更多如角色服裝、風景等貼圖材質,讓遊戲畫面更加生動。

延伸閱讀:
Microsoft說明DirectStorage特色,看懂GeForce 30系列RTX IO技術有何優勢
3DMark Steel Nomad免費更新,成為新一代重量級非光線追蹤測試項目

UL表示在實際遊戲中準確測量DirectStorage的效能表現並非易事,遊戲引擎往往會在讀取遊戲檔案的同時執行繪製幾何圖形等其他任務,因此DirectStorage測試項目的設計排除其他工作負債的影響,將重點放在模擬將系統資源完全投入DirectStorage,以測得接近理論值的最佳表現,讓使用者觀查啟用DirectStorage所能帶來的最大潛在效能增益。

3DMark透過更新加入DirectStorage測試項目,能夠測試並比較開、關DirectStorage功能的檔案讀取效能。

DirectStorage測試項目能夠測試關閉、開啟、開啟並搭配GDeflate壓縮等3種不同情境的存取效能,並進行比較。

3DMark也透過這次更新為Speed Way、Wild Life、Wild Life Extreme等測試項目中提供新的音樂,並且能在在設定中切換。

使用者可以透過SteamEpic Games等平台或是直接於UL官方網站購買3DMark,如果先前已購買儲存測試DLC,則可免費更新DirectStorage測試項目。

加入T客邦Facebook粉絲團

Intel說明Xeon 6處理器與Gaudi 3加速器優勢,雙路處理器給你滿滿192條PCIe Gen 5通道

Intel在資料中心暨AI解決方案媒體說明會中提到多項Xeon 6處理器與Gaudi 3加速器的特色,並帶來實際應用範例。A35eea7af72961d731a16f7e4596049a

Intel在資料中心暨AI解決方案媒體說明會中提到多項Xeon 6處理器與Gaudi 3加速器的特色,並帶來實際應用範例。

開放軟、硬體環境強化競爭優勢

Intel亞太暨日本區總經理莊秉翰在說明會開頭便提到執行長Pat Gelsinger退休一事,回顧他致力於讓Intel重新返回技術製造的領導地位(可參考民視新聞片段)。

延伸閱讀:
Intel CEO嗆聲摩爾定律活得很好,18A節點製程Panther Lake處理器下週試產
Intel Vision 24:Intel與合作夥伴共建AI開放平台,搭配RAG技術強化企業私有LLM應用

接著莊秉翰說明,Intel在AI應用領域提供系統先決的完整堆疊方案,透過搭載P-core的Xeon 6處理器和Gaudi 3 AI加速器,以及Intel強大的x86架構與開放生態系,提供企業建構最佳化TCO(總體擁有成本)與最佳電力效率的AI系統。

莊秉翰也提到,搭載P-core的Xeon 6處理器與競爭對手AMD EPYC相比,AI推論效能最高相差5.5倍,高效能運算(HPC)則最高相差2.1倍。至於與NVIDIA H100相比,Gaudi 3 AI加速器的LLaMA 2 70B大語言模型推論吞吐量高出競爭對手19%,而成本效益則約為2倍。

Intel亞太暨日本區總經理莊秉翰於說明會指出Intel在AI應用領域的優勢。

系統先決的完整堆疊方案包含可擴充性、開放生態系、資安、總體擁有成本等優勢。

Intel提供搭載E-Core或是P-Core的Xeon 6處理器以及,Gaudi 3 AI加速器等多種運算單元滿足不同AI應用需求。

搭載P-core的Xeon 6處理器在AI推論、高效能運算的效能最高可達AMD EPYC的5.5倍、2.1倍。

Gaudi 3 AI加速器具有加速卡、通用基板、PCIe擴充卡等型式可供選擇。

Gaudi 3 AI加速器的LLaMA 2 70B大語言模型推論吞吐量高出NVIDIA H100 19%,而成本效益則約為2倍。

Xeon 6處理器提供更多PCIe通道

Intel業務暨行銷事業群商用業務總監鄭智成也接著說明Xeon 6處理器的特點,在記憶體部分支援12通道、DDR5-6400,較前代8通道、DDR5-5600的整體頻寬高出70%,此外還支援傳輸速度達8800 MT/s的MRDIMM(Multiplexed Rank DIMM),提升資料吞吐量。

Xeon 6處理器也支援CXL 2.0與Type 1、Type 2、Type 3等不同應用型態。舉例來說,透Flat2LM技術能將容量為768 GB的DDR5-6400記憶體組成的DRAM區域,與由768 GB DDR5-6400記憶體搭配768 GB DDR4-3200記憶體組成的Flat2LM區域合併為總量達2304 GB的記憶體池,雖然在執行線上分析處理(Online Analytical Processing,OLAP)工作負載時會損失3%的效能,但是可以大幅縮減1/3記憶體建置成本,整體效益相當可觀。

鄭智成在會中強調,Xeon 6處理器的多路併聯透過傳輸速度達24 GT/s的6組UPI 2.0通道交換資料,例如在使用2組具有96條PCIe Gen 5通道的Xeon 6處理器時,系統整體可以使用192條PCIe Gen 5通道。相較之下競爭對手的多路處理器仰賴PCIe交換資料,因此使用2組具有128條PCIe Gen 5通道的處理器時,處理器之間使用64條通道相互溝通,造成系統整體可用PCIe Gen 5通道僅有128條,進而降低安裝擴充卡的能力。

鄭智成也以實際應用情境為例,提到國內某金融企業先前宣佈斥資新台幣3,000萬元建置AI運算伺服器,以滿足AI模型訓練的需求,但是其成本之高,可能不是中小企業可以負擔。

不過若是以現有的開源大型語言模型(LLM)搭配檢索增強生成(Retrieval Augmented Generation,以下簡稱RAG)技術,將企業私有的資訊送入系統進行向量化處理,就能在不重新訓練或是微調模型的情況下,讓模型能夠回答針對企業相關的問題,並透過搭載Xeon 6處理器之伺服器完成AI推論運算,如此一來建置成本可以縮減至新台幣100萬元左右,相當具有優勢。

Intel業務暨行銷事業群商用業務總監鄭智成在會中分析Xeon 6處理器的優勢。

Xeon 6處理器特色一覽,其中搭載E-Core的型號最高具有288組核心,而搭載P-Core的型號最高具有128組核心。

搭載P-Core的Xeon 6處理器效能較前代產品提高最多至3.08倍(淺藍色),而電力效率介於1.43~2.16倍之間(深藍色)。

在不同應用情境下,Xeon 6處理器的電力效率可達較前代產品的1.9倍。

Xeon 6 6900P處理器特色簡表,其中在AMX進階矩陣延伸指令集除了延續支援FP8、BF16等資料格式外,也加入支援FP16。

MRDIMM(Multiplexed Rank DIMM)透過類似「雙通道」的方式提升資料吞吐量,使用MRDIMM-8800在多項運算表現的效能最高可較DDR5-6400提升32%。

CXL 2.0有助於建立更具成本效益的記憶體池,Xeon 6處理器支援Type 1、Type 2、Type 3等不同應用型態。

舉例來說CXL 2.0能在縮減1/3記憶體建置成本的前提下,維持97%的線上分析處理效能。

Xeon 6處理器較前代產品提供2倍核心數,單核心平均效能表現也高出20%。

在以處理器進行AI推論運算的效能表現圖表中,灰色基準線為AMD EPYC 9654(96核心)之成績,深藍色為前代Xeon 8592+(64核心)。而淺藍色的Xeon 6970P(96核心)表現最高能達到對手的5.5倍。

Intel也推出由32組Gaudi 3 AI加速器節點組成的運算叢集方案(共256組Gaudi 3),以滿足更大規模的AI運算需求。

鄭智成在現場展示透過RAG在不重新訓練大型語言模型的前提下,透過輸入文件的方式「教導」模型如Xeon 6特色資訊。

Intel也在現場展示透過Xeon 6處理器進行AI推論運算,圖為執行X光分析、醫療大型語言模型,以及多模態文字搜尋圖像等範例。

此外還有Llava-llama 3影像助理、LDM3D文字生成3D圖像、RAG等範例。

莊秉翰在會中表示:「隨著AI運算需求日益成長,帶動資料中心和基礎設施大規模轉型,可擴充性、成本、能源效率和安全性成為企業當前關鍵考量因素。因應市場需求攀升,英特爾推出搭載P-core的Xeon 6和Gaudi 3 AI加速器,透過英特爾強大的x86架構與開放生態系,使其能夠支援企業建構具備最佳化總體擁有成本(TCO)及每瓦最佳效能的AI系統,以更佳的效率和成本效益滿足客戶複雜的工作負載。」

加入T客邦Facebook粉絲團

Intel發表Arc B580、B570顯示卡,12月12日上市美金219元起跳

Intel發表代號為Battlemage的第2代Arc顯示卡,首波產品為高階款的Arc B580,而次階款Arc B570將於2025年1月登場。A0639dfbbfbf08d59aa8eed28ba84765

Intel發表代號為Battlemage的第2代Arc顯示卡,首波產品為高階款的Arc B580,而次階款Arc B570將於2025年1月登場。

第2代Arc來了

Intel於今日發表Arc B580、Arc B570等顯示卡,並解除Arc B580的外觀的保密條款,讓我們可以先一睹其面貌。

延伸閱讀:Intel Arc A750顯示卡效能實測,驅動更新、價格下殺是否值得進場?

Arc B580與B750採用Xe2繪圖架構,分別具有20、18組的Xe核心,前者搭載通道寬度為192 bit的12 GB顯示記憶體,後則則為160 bit、10 GB,2者都支援AV1、HEVC(H.265)、AVC(H.264)、VP9、XAVC-H等格式之硬體編解碼加速,且都支援畫面升頻、畫格生成、低延遲等XeSS 2 AI功能。

等同於公板卡的Intel Arc B580 Limited Edition採用雙風扇、雙槽設計,並具有類似GeForce RTX 30系列開始導入的穿透式散熱設計,搭載1組8-Pin PCIe電源端子。

Arc B580、Arc B570規格簡表。

Intel Arc B580 Limited Edition之TDP僅190 W,採用雙風扇、雙槽設計。

從背面可以看到顯示卡尾端為穿透式散熱設計。

風扇可以直接將冷空氣吹送穿透散熱片,強化整體散熱效果。

電源部分需連接1組8-Pin PCIe電源端子。

I/O部分提供3組DisplayPort 2.1(最高支援UHBR 13.5)與1組HDMI 2.1。

Arc B580的預定上市日期為2024年12月13日,預定售價為美金249元(約合新台幣 8,170 元),而Arc B570則預定於2025年1月16日上市,預定售價為美金219元(約合新台幣7,185元)。

筆者也預計於12月12日晚間效能解禁時帶來測試專題報導,請讀者保持關注。

加入T客邦Facebook粉絲團

GPD Pocket 4掌上型電腦,8.8吋翻轉螢幕搭配Ryzen AI 9 HX 370

GPD Pocket 4是款搭載AMD Ryzen AI 9 HX 370處理器的掌上型電腦,翻轉螢幕的螢幕提供筆電、平板等多種使用模式。E1ee60874573ef23b2aeea723bc89ce0

GPD Pocket 4是款搭載AMD Ryzen AI 9 HX 370處理器的掌上型電腦,翻轉螢幕的螢幕提供筆電、平板等多種使用模式。

軟骨功迷你筆電

Pocket 4襲承前代Pocket 3的多項設計,同樣採用可翻轉式的螢幕設計,並提供模組化擴充槽,使用者不但可以依據不同使用情境讓電腦「變身」為筆記型、平板電腦,也可以更換不同擴充配件,以滿足行動網路、KVM等特殊需求。

延伸閱讀:GPD Pocket 3超迷你8吋翻轉筆電,模組擴充槽還可連接HDMI輸入

Pocket 4具有8.8吋、解析度為2560 x 1600的觸控螢幕,並提供AMD Ryzen AI 9 HX 395、Ryzen AI 9 HX 370、Ryzen 7 8840U等處理器選擇。

Ryzen AI 9 HX 370為例,具有4組Zen 5與8組Zen 5c處理器核心,總共為12核24緒配置,2種核心的最高Turbo時脈分別為5.1 GHz、3.3 GHz,並整合16組運算單元(CUs)、最高時脈達2.9 GHz的Radeon 890M內建顯示晶片,同時也內建AI運算效能達50 TOPS的神經處理器(NPU),並可以20~28 W cTDP(可調整式熱設計功耗)模式運作,在運算與繪圖、遊戲等應用都提供出色的效能表現。

Pocket 4採用LPDDR5x-7500記憶體,提供16、32、64 GB等容量選擇,並支援PCIe Gen 4x4匯流排、NVMe 1.4通訊協定的M.2280固態硬碟,提供1、2 TB容量選擇,使用者也可以更換容量更大的固態硬碟,但需注意的是受機身內部空間限制,僅能安裝單面顆粒的固態硬碟。

Pocket 4是款搭載8.8吋翻轉螢幕的掌上型電腦,具有QWERTY鍵盤與觸控板、觸控螢幕。

其尺寸為20.68 x 14.45 x 2.22公分,重量為770公克。

其翻轉螢幕能提供多種擺放與使用模式。

使用者也可以將螢幕翻轉之後做為平板電腦使用。

擴充功能不馬虎

Pocket 4提供USB4、全功能USB Type-C 3.2 Gen2(支援資料、影音、充電)、USB 3.2 Gen2、USB 2.0、HDMI 2.1、3.5mm耳機麥克風復合、2.5GbE乙太網路等端子各1組,並支援Wi-Fi 6E、藍牙5.3等無線通訊功能。

此外它也具有可以抽換的模組化擴充槽,出廠預設的配置為microSD讀卡機,使用者也可另購其他模組。4G LTE通訊模組讓電腦能夠連接行動網路,RS-232模組則是提供RS-232端子方便連接周邊設備。

比較特別的是KVM模組,它具有1組HDMI輸入與USB端子,功能為與另一台電腦連接後,就可以在Pocket 4的螢幕上看到另一台電腦的畫面,並透過Pocket 4的鍵盤、滑鼠進行操作。

Pocket 4提供豐富的I/O功能,除了具有HDMI 2.1影音與2.5GbE乙太網路端子與指紋辨識功能外,還有模組化擴充槽。

模組化擴充槽預設的配置為microSD讀卡機。

使用者也可以安裝4G LTE通訊模組以連接行動網路。

RS-232模組則提供連接條碼機、示波器等周邊機器的能力。

KVM模組可以讓Pocket 4顯示另一台電腦的畫面,並透過Pocket 4的鍵盤、滑鼠操作。

搭配GPD G1外接顯示卡擴充底座則可添加更多I/O與3螢幕輸出等功能。

Pocket 4的預定上市日期為2025年1月,搭載Ryzen AI 9 HX 370處理器、64 GB記憶體、2 TB固態硬碟版本的預定售價為港幣10,390元(約合新台幣43,930元)。

加入T客邦Facebook粉絲團

Raspberry Pi Pico 2 W升級登場,加入Wi-Fi與藍牙功能

Raspberry Pi基金會繼8月推出Raspberry Pi Pico 2後,又推出加入Wi-Fi無線網路與藍牙等通訊功能的Raspberry Pi Pico 2 W。0a15660c0ed6d40e77699c3e1647ef40

Raspberry Pi基金會繼8月推出Raspberry Pi Pico 2後,又推出加入Wi-Fi無線網路與藍牙等通訊功能的Raspberry Pi Pico 2 W。

無線通訊更方便

Raspberry Pi Pico 2 W是款能夠用來製作各類裝置的簡易型微控制器開發板,它以先前推出的Raspberry Pi Pico 2為基礎,同樣以RP2350系列微控制器作為硬體中樞, 並加入Infineon CYW43439無線網路晶片,提供2.4 GHz頻段的Wi-Fi 4無線網路(IEEE802.11n)與藍牙5.4等無線通訊功能,讓創客不需額外安裝無線網路就能建立通訊,方便制作能夠遙控或傳輸資料的裝置。

延伸閱讀:Raspberry Pi Pico 2規格分析,開機過程可切換Arm、RISC-V架構

Raspberry Pi基金會在官方部落格回顧2021推出的初代Raspberry Pi Pico與對應的RP2040微控制器,提供2組Arm Cortex-M0+處理器核心與264KB SRAM,並支援多種高階語言與PIO(可程式化輸入輸出)子系統,成為社群玩家與專業工程師尋求性價比的首選。而RP2350微控制器則在此基礎上提供速度更快的處理器並支援浮點運算,以及容量更大的記憶體與OTP儲存媒體,不但電力效率有所改善,也支援TrustZone安全性功能,提供更多元的應用可能性。

Raspberry Pi Pico 2 W是加入無線通訊的加強版,與Raspberry Pi Pico 2相比在下方多出無線網路晶片。

Raspberry Pi Pico 2 W同樣以RP2350系列微控制器作為硬體中樞。

創客可以用這張尺寸小巧的開發板製作各種裝置。

Raspberry Pi Pico 2 W現已上市日期為,售價為美金7元(約合新台幣,元),比Raspberry Pi Pico 2高出2元。Raspberry Pi基金會也預告2025年將有更多關於Pico 2的消息,請大家保持期待。

加入T客邦Facebook粉絲團

Raspberry Pi Compute Module 5運算模組來了!價格美金45元起

Raspberry Pi基金會發表以「Pi5」為基礎的Compute Module 5運算模組,具有遠高於前代產品的效能,並維持產品相同尺寸。4e6afb7c0b2b1399ead7f004f120a571

Raspberry Pi基金會發表以「Pi5」為基礎的Compute Module 5運算模組,具有遠高於前代產品的效能,並維持產品相同尺寸。

提供多種記憶體、無線網路搭配組合

Raspberry Pi基金會表示,Raspberry Pi Compute Module運算模組系列產品在小巧的尺寸中整合各項核心功能,讓使用者更容易設計、客製化嵌入式裝置,除了 Raspberry Pi 2之外,後續每代產品都有衍生的運算,而現在也迎來了Raspberry Pi 5的模組化版本。

延伸閱讀:
Raspberry Pi運算模組4登場,尺寸與連接端子迎來大幅改變
Raspberry Pi 5終於來了!效能更高、內建PCIe匯流排還有實體電源鍵

Raspberry Pi Compute Module 5(以下簡稱CM5)與Raspberry Pi 5 Model B一樣搭載Broadcom BCM2712 SoC,具有時脈高達2.4GHz的4核心64bit Arm Cortex-A76處理器,每個核心擁有專屬512KB L2快取記憶體,整組處理器共享2MB L3快取記憶體。在記憶體與儲存部分提供1 / 2 / 4 / 8 GB LPDDR4-4267(具ECC錯誤校正功能)等選擇,儲存媒體則為0 / 16 / 32 / 64 GB eMMC,並可選擇是否具有Wi-Fi無線網路與藍牙5.0功能。

Raspberry Pi Compute Module 5運算模組的核心功能與「Pi5」相同,但是捨去正常尺寸的I/O端子以縮減尺寸。

CM5運算模組右上角有「實體」規格標示,可以一眼看出搭載的記憶體與eMMC儲存媒體容量。

官方母板、機殼一同登場

CM5的尺寸、機構位於與前代CM4同為5.5 x 4公分,並且同樣透過背面的高密度垂直連接端子(High-Density Perpendicular Connectors)提供下列I/O功能。

Raspberry Pi Compute Module 5運算模組I/O功能一覽
GbE乙太網路實體層(PHY)
1組PCIe Gen 2x1
1組USB 2.0 x1
2組USB 3.2 Gen 1
2組HDMI 2.0(支援4K60p雙螢幕輸出)
2組4通道MIPI(支援DSI影像與CSI-2攝影機)
最多30組GPIO(支援1.8或3.3 V電壓,包含最多5組UART、5組I2C、5組SPI、1組SDIO、1組DPI、1組I2S、4組PWM通道、3組GPCLK輸出)

Raspberry Pi基金會同時推出對應CM5的擴充母板(IO Board)與機殼,擴充母板尺寸為16 x 9公分,提供標準40-pin GPIO,USB 3.2 Gen 1、標準尺寸HDMI 2.0、MIPI DSI/CSI-2軟排線端子各2組,以及GeE RJ-45乙太網路(支援PoE)、M.2 2280插槽、microSD讀卡機、4-pin風扇端子、RTC電池座、USB Type-C電源輸等端子各1組,並提供實體開關電源按鍵。

官方版本外殼(IO Case)採用金屬材質,可以把CM5與擴充母板變成完整的封裝工業級電腦,機殼內建的風扇可以連接到擴充母板風扇端子,強化散熱效果。

此外Raspberry Pi基金會也推出CM5專用鋁質散熱片,能夠加強對SoC、記憶體、eMMC、無線網路晶片的散熱。而天線套件則與CM4相同,可以將無線通訊的天線拉至機殼外部,以強化收訊品質。

Raspberry Pi基金會也為CM5推出多種周邊配件。

擴充母板的尺寸為16 x 9公分,提供多種I/O端子。

CM5透過背面的高密度垂直連接端子連接至擴充母板就可使用各種I/O功能,使用者也可以根據使用與尺寸需求,自行設計不同的擴充母板。

外殼與擴充母板的I/O相互搭配,並具有1組散熱風扇。

鋁質散熱片能夠加強對SoC、記憶體、eMMC、無線網路晶片的散熱。

天線套件則可強化收訊品質。

Raspberry Pi Compute Module 5運算模組現已發售,價格由美金45元(約合新台幣1,475起,4 GB 記憶體、32 GB eMMC、具無線網路與藍牙功能的版本參考價格為美金70元(約合新台幣2,300元)。

加入T客邦Facebook粉絲團

NVIDIA總部解密,以《星際爭霸戰》命名的Endeavor、Voyager大樓

筆者在GTC 2024春季場時趁機參訪了NVIDIA位於美國加州聖塔克拉拉的總部,讓我們一起去看看最新落成的Endeavor、Voyager等2棟大樓。Ceeb509350dc2673f797ef8542f15173

筆者在GTC 2024春季場時趁機參訪了NVIDIA位於美國加州聖塔克拉拉的總部,讓我們一起去看看最新落成的Endeavor、Voyager等2棟大樓。

採用RTX先模擬、再興建

由於筆者是在GTC 2024春季場期間前往NVIDIA總部,所以當時也有許多員工戒展期邀請家屬前來參觀,以致現場人潮較多。NVIDIA官方為維護相關人員隱私,故參觀流程中禁止攝影,僅開放於少數定點拍照,所以本文的圖片數量會較為貧乏,也請讀者海涵。

延伸閱讀:GTC 2024春季場系列報導

NVIDIA總部的Endeavor與Voyager等2棟大樓分別落成於2017年與2021年,其中Endeavor透過橫跨San Tomas快速道路的天橋連接至總部舊大樓區。

新建的Endeavor與Voyager分別以科幻影集《星際爭霸戰》的奮進號、旅行者號太空船命名,而其字首發音也分別與NVIDIA的「N」、「VI」諧音,所以導覽人員也打趣地說,位於印度預計完工的下一棟大樓將要以「D」進行命名。

Endeavor與Voyager都導入綠建築的概念,考慮自然採光與通風等要素,以節省能源消耗,而在這個過程當然會透過NVIDIA的3D繪圖技術進行模擬,在設計階段就能精確模擬完工後的狀態,並在實際動工前就修正潛在的問題。

而導覽人員不忘宣傳自家的RTX技術,在設計Endeavor時還RTX尚未問世,雖然還是可以進行光線追蹤運算,但效能表現比較低落,而到了設計Voyager的時候,則可透過RTX的硬體光線追蹤運算與DLSS加速模擬渲染,大幅提升工作效率。

NVIDIA位於美國加州聖塔克拉拉總部的空拍照。圖中左下方為Endeavor,右上方為Voyager。(圖片來源:NVIDIA)

Endeavor與Voyager透過有Nest(鳥巢)之稱天幕遮蔽的廣場相連,也有天橋前往舊園區。(圖片來源:NVIDIA)

從Google地圖可以看到Endeavor外型偏向三角型,而Voyager較接近六角型。(圖片來源:Google)

筆者趁著GTC 2024春季場期間前往NVIDIA總部參觀。

搭車前往的訪客須在接送點下車,再走過天橋進入Endeavor,或是沿無障礙坡道進入Voyager。

Endeavor與Voyager中間有個廣場,上方稱為Nest的天幕設有太陽能發電板。

三角型VS四邊型

以Voyager為例,其設計概念為山谷,除了具有沿襲自Endeavor同時也是NVIDIA官方視覺圖像常見的三角型元素之外,也加入了更多四邊型元素,這2種幾合圖型元素分別象徵山與谷。

Voyager建築內部採挑高設計,並在建立了有如中央山脈的4層房間,除了有辦公室、研究室之外,也有員工餐廳、飲料吧、舞台等設施,並提供許多開放式的會議空間。

如同飄降於山峰的雨水匯集後經由山谷流向三角洲,NVIDIA相信開放空間能匯集員工,不但能讓同事相互打招呼、噓寒問暖,也有助於討論工作事項、激發更多創意。

值得注意的是,雖然Endeavor與Voyager內部相當寬氅,但是並沒有回音,主要的原因是在設計過程中就考慮到這個問題,因此在天花板與牆面鋪設了厚達30公分的隔音與隔熱材料,除了能消除回音之外,也能節省空調所消耗的能源。

新落成的Voyager以山谷為設計概念。(圖片來源:NVIDIA)

Voyager內部挑高相當宏偉,並以4層樓的「山峰」。

從Voyager的「稜線」往前看,可以看到建築內部有許多三角型的元素。

然後往後看,則可看到許多四邊型的元素。

說到員工餐廳,大家應該會覺得NVIDIA應該會有免費提供讓人稱羨的員工餐,但導覽人員卻說公司只提供3種免費的東西「空氣、椅子、咖啡」。

由於公司發現提供免費的餐點會造成員工比較不愛惜食物,常常會發生拿太多吃不完而丟棄的情況,這時承包商為了降低成本,就會發生餐飲品質降低的情況。於是公司決定酌收些許費用,反而讓大家只拿取適量的食物,減少食物浪費,承包商也能將相同的成本花費在提升品質,而不是提供更多份量。

接下來或許我們會在某場發表會中,看到NVIDIA分享如何透過AI提升員工餐服務品質的案例吧。

加入T客邦Facebook粉絲團

AAEON UP 710S超迷你單板電腦,信用卡尺寸搭載x86架構Intel Alder Lake-N處理器

AAEON UP 710S是款尺寸有如Raspberry Pi,但是卻搭載x86架構處理器的單板電腦,最高可選擇Intel Processor N200。7cdd1092e93882cab89d78a739cf8fef

AAEON UP 710S是款尺寸有如Raspberry Pi,但是卻搭載x86架構處理器的單板電腦,最高可選擇Intel Processor N200。

超迷你x86電腦

UP 710S的尺寸為8.5 x 5.6公分,機身最厚處為2.513公分,整體尺寸與Raspberry Pi 5 Model B差不多,但是它卻不是採用Arm架構處理器,而是x86架構的Intel Alder Lake-N處理器。

延伸閱讀:Aaeon推出GENE-EHL7單板電腦,搭載Elkhart Lake世代Intel Atom、Celeron系列處理器

UP 710S提供Intel Processor N200 / N100 / N97 / N50等4種處理器選擇,最高階的Intel Processor N200採用4核4緒配置,最高Turbo時脈達3.7 GHz,並整合32組執行單元(EUs)、最高時脈達750 MHz的UHD Graphics內建顯示晶片,TDP為6 W。

UP 710S最高可選8 GB LPDDR5記憶體以及128 GB eMMC儲存媒體,但不支援SATA、M.2 NVMe、microSD記憶卡等儲存媒體,主機板背面提供1組可以安裝無線網路卡的M.2 2230 E-Key插槽,並提供3組USB 3.2 Gen 2端子,以及HDMI 1.4b、GbE乙太網路端子各1組,可透過Wafer排線擴充2組USB 2.0端子,以及I2C、PWM、SPI、GPIO、RS-232/422/485等端子。

UP 710S是款x86架構單板電腦,尺寸為8.5 x 5.6公分,與Raspberry Pi 5 Model B接近。

主機板正面具有處理器、各種連接端子,以及12V電源輸入端子台。

主機板背面則有M.2 2230 E-Key插槽,能夠加裝無線網路卡。

主機板側面提供3組USB 3.2 Gen 2端子,以及HDMI 1.4b、GbE乙太網路端子各1組。

UP 710S取消了先前UP Board系列產品的40-pin HAT擴充腳針,改以透過Wafer排線擴充GPIO、I2C、SPI、COM等端子。

AAEON尚未公布UP 710S的上市日期與售價,但根據經驗日後應該可以透過Aaeon eShop網路商店以零售型式購買。

加入T客邦Facebook粉絲團

NVIDIA公布MLPerf Training 4.1測試成績,DGX B200系統GPU效能提升最高達2.2倍

NVIDIA在最新公布的MLPerf Training 4.1測試成績中揭露,Blackwell系列GPU之效能表現最高可達前代產品之2.2倍,並強調自家提供的完整AI解決方案。7b02732e626ce750fb64c1448b6d6487

NVIDIA在最新公布的MLPerf Training 4.1測試成績中揭露,Blackwell系列GPU之效能表現最高可達前代產品之2.2倍,並強調自家提供的完整AI解決方案。

GPU單位效能再創新高

MLPerf是由學術界、研究實驗室和業界人士共同組成組織旨在打造公正且能夠反映實際應用情境的AI運算測試基準。最新MLPerf Training 4.1 AI模型訓練效能測試的內容包含Stable Diffusion v2文字生成圖像、GPT-3 175B與Llama 2 70B大型語言模型、R-GAT圖像神經網路、BERT自然語言處理、RetianNet物件偵測的模型訓練與微調。

延伸閱讀:NVIDIA公布MLPerf 4.1推論測試結果,首見Blackwell與FP4成績

舉例來說,更新軟體核心(Kernel)改善矩陣相乘的效能並改善GPU(繪圖處理器)中Tensor核心的運算效率,就能達到提高許多深度學習(Deep Learning)的運算效能。透過這種方式,NVIDIA將H100的單GPU訓練效能提高了30%,

另一種提高效能表現的方式,就是改善多GPU叢集的連接與網路環境。透過NVLink、NVSwitch、Quantum-2 InfiniBand網路等高速連接技術組成的11,616組Hopper GPU運算叢集,能在GPT-3 175B訓練測試提高了3倍以上效能。

而最「簡單有效」的解決方案,當然還是升級至新一代GPU。NVIDIA表示採用Blackwell平台的Nyx超級電腦在Llama 2 70B大型語言模型微調的每GPU效能表現為前代H100的2.2倍,而GPT-3 175B預訓練則為2倍,且提交了所有測試項目之成績。

NVIDIA也將自己定位為資料中心平台公司,在累積多年的開發成果後,能夠提供完整的軟、硬體堆疊,在硬體方面小至晶片、大至機櫃甚至資料中心,軟體部分則從最基礎的晶片、系統、叢集軟體與驅動程式,到運算API與函數庫,都有對應的技術與產品,能夠解決企業的加速運算與AI運算需求。

MLPerf Training 4.1訓練測試包含Stable Diffusion v2文字生成圖像、GPT-3 175B與Llama 2 70B大型語言模型、R-GAT圖像神經網路、BERT自然語言處理、RetianNet物件偵測的模型訓練與微調。

既有的Hooper GPU在NVSwitch交換器的協助下較先前首次提交MLPerf Training 4.1訓練測試成績成長30%,且最高可串接11,616組GPU,是目前效能最佳的解決方案。

Hooper GPU搭配NVSwitch交換器也對AI推論有所幫助,能提高Llama 3.1效能90%,或是讓生成第1組字詞(Time to First Token)的速度提升至3倍。

Blackwell GPU的MLPerf Training 4.1訓練測試成績最高可達到前代產品的2.2倍。

在軟、硬體最佳化整合的助益下,HGX B200的大型語言預訓練效能可達HGX A100的12倍,或是HGX H100的2倍。

NVIDIA的AI運算解決方案包含完整的軟、硬體堆疊,包含各種晶片、連接、機櫃、散熱等硬體,以及晶片、系統、叢集、API、函數庫等不同層級的軟體。

NVIDIA的「1年節奏」(One Year Rhythm)包含晶片設計與生產、資料中心驗證、快速布署,協助客戶加速導入AI轉型。

NVIDIA計劃於2024年推出Blackwell運算平台,並於2025年更新至Blackwell Ultra加強版,2026年則會推出Rubin運算平台。

另一方面,NVIDIA也重申「1年節奏」(One Year Rhythm)的產品更新規劃,包含晶片、機櫃、資料中心等不同層級的組合,讓企業能夠根據自身需求選擇最新的解決方案。

加入T客邦Facebook粉絲團

再次香爆!OneXPlayer推出OneXFly F1 Pro EVA貳號機聯名版掌上型電腦與外接顯示晶片

OneXPlayer OneXFly F1 Pro是款搭載AMD Ryzen AI 9 HX 370處理器的掌上型主機型式電腦,並推出以動畫《新世紀福音戰士7a8078538278931f5494cd3f00084d17

OneXPlayer OneXFly F1 Pro是款搭載AMD Ryzen AI 9 HX 370處理器的掌上型遊戲機型式電腦,並推出以動畫《新世紀福音戰士》貳號機為主題的聯名限定版。

香爆聯名再一發

Asus在2023年推出了動畫《新世紀福音戰士》劇中主角明日香及她所駕駛的「汎用人型決戰兵器貳號機」為主題的主機板、機殼等零組件。到了2024年OneXPlayer則推出相同主題的OneXFly F1 Pro EVA貳號機聯名版掌上型遊戲機型式電腦,以及搭載AMD Radeon RX 7800M顯示晶片的外接式擴充底座。

延伸閱讀:
[掃雷組] Asus ROG x Evangelion聯名系列襲來:香爆警戒,開香!
AMD Ryzen AI 9 HX 370效能實測:Asus TUF Gaming A16內顯、AI效能大躍進,還有獨顯火力支援

既然是與明日香與貳號機為主題的聯名款,自然需要採用紅色機身,並在機身加入相關相關圖案,除此之外位於Windows 11作業系統中的OneXPlayer專屬快捷選單也同樣加入《新世紀福音戰士》視覺元素,讓玩家在調整設定時能夠沉浸於劇中的世界觀。

OneXPlayer OneXFly F1 Pro EVA聯名版掌上型遊戲機型式電腦採用明日香與貳號機作為主題。

除了電腦之外,還有對應的AMD Radeon RX 7800M外接顯示晶片擴充底座。

機身採用鮮明的紅、橘配色,正面具有貳號機與「Emergency六角」圖案,背面則有明日香圖案與散熱進氣口。

機身頂部具有RB、RT、LB、LT以及額外2個自定按鍵,還有電源、音量鍵,並具有散熱出風口。

系統的快捷選單也融入《新世紀福音戰士》視覺元素,不確定是否僅提供簡體中文介面。(身為狂熱粉絲需要批評一下,沒有還原劇中超級電腦「MAGI」的介面風格相當可惜)

搭載最強內顯還可外接顯示晶片

OneXFly F1 Pro EVA聯名版搭載Ryzen AI 9 HX 370處理器,具有4組Zen 5與8組Zen 5c處理器核心,總共為12核24緒配置,最高Turbo時脈分別為5.1 GHz、3.3 GHz,並搭配具有16組運算單元(CUs)、RDNA 3.5架構的Radeon 890M內建顯示晶片。

需要注意的是雖然Ryzen AI 9 HX 370處理器的cTDP(可配置熱設計功耗)最高可達54 W,但從下方的快捷選單圖片中看出,可設定的功耗最高僅為30 W,應為權衡散熱與續航力的限制,但可能會造成效能無法完全展現的副作用。

聯名版擴充底座具有USB Type-C與OCuLink介面(但電腦主機只有USB4),整合Radeon RX 7800M顯示晶片,並提供2組DisplayPort、1組HDMI影音輸出端子,以及2組USB與microSD讀卡機、RJ-45乙太網路端子各1組,連接後可以為主機充電,同時提供更強的遊戲效能並擴充連接能力。

OneXFly F1 Pro搭載Ryzen AI 9 HX 370處理器、解西度達1080p、144p的7吋顯示器。

從快捷選單可以看到cTDP的調整上限為30 W。

其機身正面按鍵採用薄膜機構,RB、LB採用微動開關,RT、LT則採用霍爾感應器。

內建的喇叭經Harman認證,可以確保較佳音效體驗。

聯名擴充底座整合Radeon RX 7800M顯示晶片,並提供豐富I/O端子。

OneXFly F1 Pro規格表,出廠預載Windows 11作業系統。

OneXFly F1 Pro EVA貳號機聯名版現已開始預購,預計於2024年11月30日上市,32GB記憶體搭配2TB固態硬碟版本售價為人民幣9999元(約合新台幣45,365元)。

加入T客邦Facebook粉絲團

《決勝時刻:黑色行動6》搭配AMD FSR 3.1效能禁藥實測,預告將推出AI基礎的下代技術

AMD在FSR 3.1強化畫質呈現,並讓FSR畫格生成能與其他顯示卡廠商之升頻技術併用,也預告將在2025年推出以機器學習為基礎的下代FSR技術。5433c51302664e46c34147e3cc648dd1

AMD在FSR 3.1強化畫質呈現,並讓FSR畫格生成能與其他顯示卡廠商之升頻技術併用,也預告將在2025年推出以機器學習為基礎的下代FSR技術。

本文使用之《決勝時刻:黑色行動6》序號由AMD提供

FSR 3.1技術分析

AMD在GPUOpen部落格更新了FSR 3.1的技術介紹,提到新版技術改善了畫面細節、殘影等效果,並支援Vulkan繪圖API,此外的一大改便是拆分升頻與畫格生成的運作流程,以改善畫質並讓其他廠商的升頻技術能與FSR畫格生成混搭用。

延伸閱讀:
AMD FSR 3真的來了!首波支援《魔咒之地》及《亙古魔戰》,還有全遊戲都可用的AFMF
AMD AFMF 2畫格生成效能禁藥再升級,疊加FSR 3猛上加猛效能實測!

FSR 3.0的運作過成會先套用升頻並同時產生動態向量(Motion Vector)、深度(Depth)等資料之後,再進行畫格生成。雖然這樣可以提高整體效能與品質,但缺點就是需要將2個流程綁定在一起。

FSR 3.1則會在升頻之前產生動態向量與深度等資料,如此一來便能讓FSR畫格生成搭配其他升頻技術協同運作。由於FSR除了支援AMD自家Radeon RX 5000系列之後的顯示卡之外,也支援NVIDIA GeForce RTX 20系列之後的顯示卡,因此讓不支援DLSS 3畫格生成的GeForce RTX 20、30系列,也能使用DLSS 2升頻混搭FSR 3.1畫格生成,帶來更流暢的視覺體驗。

AMD運算與顯示卡事業部的資深副總裁暨總經理Jack Huynh也在Ryzen 7 9800X3D的介紹影片中提到(3:27處),AMD與Activision共同在《決勝時刻:黑色行動6》遊戲中導入FSR 3.1,並持續合作開發以機器學習(Machine Learning)為基礎的下代FSR技術。

FSR 3.1除了改善畫質之外,最大的改變在於可以將升頻與畫格生成功能解耦,讓它們分別獨立運作。

FSR 3.1推出時支援6款遊戲,剛推出的《決勝時刻:黑色行動6》也加入支援。

▲AMD運算與顯示卡事業部的資深副總裁暨總經理Jack Huynh在影片3:27處提到,AMD與Activision共同在《決勝時刻:黑色行動6》遊戲中導入FSR 3.1,並持續合作開發以機器學習為基礎的下代FSR技術。

FSR 3.1效能實測

接下來筆者使用《決勝時刻:黑色行動6》來測試FSR3.1的效果,過程使用遊戲內建的效能測試工具以4K解析度、最高畫質進行2輪測試,在確定沒有極端值後取平均,並附上使用AverMedia GC553G2擷取盒以4K、60p解析度錄製展示影片作為畫質參考。

測試平台:
處理器:AMD Ryzen 7 9800X3D
散熱器:MSI MEG Coreliquid S360
主機板:GIGABYTE X870E AORUS MASTER
記憶體:G.Skill Trident Z5 Neo RGB 16GBx2(@DDR5-6000)
顯示卡:AMD Radeon RX 7800 XT
儲存裝置:Samsung 990 Pro 1TB
電源供應器:MSI MEG Ai1300P PCIE5
軟體環境:Windows 11專業版23H2(Build 22361.4391),Adrenalin 24.10.1

《決勝時刻:黑色行動6》支援FSR 3.1技術,並可選擇升頻強度與是否開啟畫格生成功能。

▲《決勝時刻:黑色行動6》4K解析度、最高畫質的畫面展示。

▲《決勝時刻:黑色行動6》開啟FSR升頻(平衡)功能的畫面展示。

▲《決勝時刻:黑色行動6》開啟FSR升頻(平衡)加上畫格生成功能的畫面展示。

開啟FSR升頻(平衡)大約可以帶來9.33%的效能增益,搭配畫格生成可以帶來總共70.67%增益。

從上述測試數據可以看到,《決勝時刻:黑色行動6》在Radeon RX 7800 XT原本就能在4K解析度、最高畫質提供平均FSP超過60幀的效能表現,加上FSR升頻即可達到82幀,提供較低的操作延遲。

若玩家想要追求更低的延遲,則建議進一步提高FSR升頻的強度,透過犧升部分畫質的條件提升FPS並降低延遲。需要注意的是,透過畫格生成提升的FSP並不會降低操作延遲,所以對於《決勝時刻:黑色行動6》這類遊戲並無競技優勢,但玩家仍可感受更流暢的視覺體驗。

加入T客邦Facebook粉絲團

AMD Ryzen 7 9800X3D處理器效能實測:搭載第2代3D V-Cache,遊戲效能再度爆錶!

AMD推出搭載第2代3D V-Cache的Ryzen 7 9800X3D處理器,不但維持與前代產品相同的96MB超大L3快取記憶體,強化散熱效果也帶來高達5.2 GHz的Boost時脈。5282c8a5f74cba3229d8ded58978df3b

AMD推出搭載第2代3D V-Cache的Ryzen 7 9800X3D處理器,不但維持與前代產品相同的96MB超大L3快取記憶體,強化散熱效果也帶來高達5.2 GHz的Boost時脈。

9000世代X3D火速報到

不同於過去「X3D」版處理器大約晚「X」版半年之後才會上市,這次AMD在Ryzen 7 9700X上市的3個月之後就推出Ryzen 7 9800X3D,會將時程壓縮得如此緊迫,多少有些與Intel Arrow Lake S系列處理器搶奪市場的意圖。

延伸閱讀:
Zen 5架構詳解(二):Zen 5、RDNA 3.5、XDNA 2架構解說
Zen 5效能實測(一):Ryzen 7 9700X、Ryzen 5 9600X搶先上市,單核心效能增益最高達20%
Zen 5效能實測(二):Ryzen 9 9950X、Ryzen 9 9900X上市,正16大核怪獸降臨

Ryzen 7 9800X3D以Ryzen 7 9700X為基礎,同樣採用AM5腳位與8核16緒配置,L1、L2快取記憶體也同樣為640 KB、8 MB,而L3快取記憶體則透過第2代3D V-Cache技術,由原本的32 MB擴充至96 MB,能夠有效提高快取命中率並降低運算延遲,對於遊戲效能的助益非常明顯,也能緩解遊戲卡頓的狀況,並提高1% Low的FPS成績。

第2代3D V-Cache與前代並同樣透過直接銅對銅連接(Direct Copper-to-Copper Bonding)與矽穿孔(Through Silicon Via,TSV)等技術連接,最大的改變之處為將擴充的L3快取記憶體改為堆疊至CCD(Core Chiplet Die,核心裸晶)下方,且不像前代需要透過結構性矽晶(Structural Silicon)填充空隙。

這樣最大的好處在於處理器核心為於整顆晶片的最上層,有助於改善散熱,這讓Ryzen 7 9800X3D的TDP達到120 W,基礎時脈上看4.7 GHz,而Turbo則高達5.2 GHz,比前代Ryzen 7 7800X3D的4.2 / 5.0 GHz更高,此外也能爭取更高的超頻潛力,對於玩家來說是一大福利。

(若手機版瀏覽器無法顯示表格,請點我看完整表格

Ryzen 9000系列處理器規格簡表
處理器型號 核心/執行緒 基礎時脈 最大Boost時脈 L2快取記憶體 L3快取記憶體 可用PCIe通道數 內建顯示運算單元、時脈 TDP 發表當時定價(美金)
Ryzen 9 9950X 16 / 32 4.3 GHz 5.7 GHz 16 MB 64 MB 24x PCIe Gen 5 2CUs、2200MHz 170 W $649
Ryzen 9 9900X 12 / 24 4.4 GHz 5.6 GHz 12 MB 64 MB 24x PCIe Gen 5 2CUs、2200MHz 120 W $499
Ryzen 7 9800X3D 8 / 16 4.7 GHz 5.2 GHz 8 MB 96 MB 24x PCIe Gen 5 2CUs、2200MHz 120 W $479
Ryzen 7 9700X 8 / 16 3.8 GHz 5.5 GHz 8 MB 32 MB 24x PCIe Gen 5 2CUs、2200MHz 65 W $359
Ryzen 5 9600X 6 / 12 3.9 GHz 5.4 GHz 6 MB 32 MB 24x PCIe Gen 5 2CUs、2200MHz 65 W $279

Ryzen 7 9700於2024年8月8日至正式上市,而Ryzen 7 9800X3D閃電發表則並於11月7日上市。

Ryzen 5000X3D、Ryzen 7000X3D系列處理器採用第1代3D V-Cache技術,擴充的64 MB L3快取記憶體堆疊於CCD上方,並需要使用結構性矽晶(Structural Silicon)填充上下層尺寸不同之空隙。

第2代3D V-Cache將擴充的64 MB L3快取記憶體放至於CCD的下層,且不需要結構性矽晶,對處理器核心的散熱有所幫助。

測試環境與條件

這次測試使用AMD提供的「平台套餐」,內容包含Ryzen 7 9800X3D處理器、GIGABYTE X870E AORUS MASTER主機板、G.Skill DDR5-6000記憶體、Samsung 990 Pro 1TB固態硬碟。需要注意的是這組記憶體的CL值為28,時序值比先前測試平台使用的DDR5-6000(CL=30)緊一點。

另一方面,由於AMD表示希望使用上述測零組件搭配的試平台,故筆者無使用先前《Intel Arrow Lake S效能實測》專題中的DDR5-8000記憶體。

這次測試過程除了手動開啟EXPO功能,讓記憶體自動超頻至DDR5-6000之外,其餘BIOS / UEFI的設定皆維持預設值。而對照組的Ryzen 7 9700X為重新測試,除了使用預設的cTDP(Configurable TDP,可調整熱設計功耗,預設為65 W)之外,也手動開啟105 W cTDP模式,瞭解不同功耗限制的效能表現。

所有成績除了Handbreak影片轉檔僅執行1輪之外,其餘項目都是進行2輪測試,在確定沒有極端值後取平均,遊戲效能使用遊戲內建的測試模式,而《絕對武力2》為手動操作進行與電腦BOT於Dust 2地圖之對戰,搭配NVIDIA FrameView記錄FPS成績。

遊戲部分在1080p、2K、4K解析度搭配最高畫質設定,若有設定範本則套用最高範本,若無則將所有畫質相關項目調至最高,關閉VRS或動態解析度等設定,並僅進行開、關光線追蹤功能的調整。

其於對照組的成績則取自先前《10大處理器效能實測2024開幕版》、《Zen 5效能實測(二)》、《Intel Arrow Lake S效能實測》等專題報導。

測試平台:
處理器:AMD Ryzen 7 9800X3D、Ryzen 7 9700X
散熱器:MSI MEG Coreliquid S360
主機板:GIGABYTE X870E AORUS MASTER
記憶體:G.Skill Trident Z5 Neo RGB 16GBx2(@DDR5-6000)
顯示卡:NVIDIA GeForce RTX 4090 Founders Edition
儲存裝置:Samsung 990 Pro 1TB
電源供應器:MSI MEG Ai1300P PCIE5
軟體環境:Windows 11專業版23H2(Build 22361.4317),GeForce Game Ready 566.03,Adrenalin 24.10.34

這次的測試平台使用GIGABYTE X870E AORUS MASTER主機板,採用AM5腳座並支援 Ryzen 9000 / 8000 / 7000系列處理器。

供電模組採用16+2+2相電源解決方案,其中VCORE的16相採8+8相並聯電源設計,並以大型鏡片散熱片覆蓋。

第1組M.2插槽具有採用EZ-Latch Click免鎖螺絲設計的大型散熱片,插槽部分採用EZ-Latch Plus免鎖螺絲快拆設計。

第2~4組M.2插槽同樣採用免鎖螺絲設計,將圖中右側中央的彈片撥開即可拆下散熱片。

主機板ATX電源端子旁設有Sensor Panel Link端子,方便透過HDMI連接至機殼內部的副顯示器。

I/O背板部分具有2組USB4以及USB 3.2 Gen 1(藍)、USB 3.2 Gen 2(紅)各4組,Wi-Fi無線網路天線採用快拆設計。

測試使用之記憶體為G.Skill Trident Z5 Neo RGB 16GBx2,EXPO參數為DDR5-6000、CL=28。

固態硬碟為Samsung 990 Pro 1TB。

Ryzen 7 9800X3D與主機板之CPU-Z資訊。

記憶體之CPU-Z資訊,運作速度為DDR5-6000,但CL值為比先前緊的28。

獨立顯示卡與內建顯示晶片之GPU-Z資訊。

測試過程使用預設BIOS / UEFI設定並開啟EXPO記憶體自動超頻,此外僅在Ryzen 7 9700X 105 W cTDP項目中調整開放功耗限制。

(下頁還有測試數據分析)

 

Ryzen 7 9800X3D處理器運算效能分析

在效能測試的前半部,我們同樣聚焦在處理器的運算效能,讀者除了可以注意Ryzen 7 9800X3D因為改善CCD散熱的設計而讓運作時脈有所提升,因此在「純運算」效能表現會更接近非X3D版的Ryzen 7 9700X,同時也可觀察Ryzen 7 9700X在不同cTDP設定下的效能差異。

圖表縮寫與處理器重點規格:
Core i7-14700K:搭配Z790晶片組、DDR5-6000(CL=30)
Core i9-14900K:搭配Z790晶片組、DDR5-6000(CL=30)
Core Ultra 7 265K:搭配Z890晶片組、DDR5-8000(CL=40)
Core Ultra 9 285K:搭配Z890晶片組、DDR5-8000(CL=40)
Ryzen 7 7800X3D:搭配X670E晶片組、DDR5-6000(CL=30)
Ryzen 9 7950X3D:搭配X670E晶片組、DDR5-6000(CL=30)
Ryzen 7 9700X(65W):搭配X870E晶片組、DDR5-6000(CL=28)、cTDP=65W
Ryzen 7 9700X(105W):搭配X870E晶片組、DDR5-6000(CL=28)、cTDP=105W
Ryzen 9 9950X:搭配X670E晶片組、DDR5-6000(CL=30)
Ryzen 7 9800X3D:搭配X870E晶片組、DDR5-6000(CL=28

在綜合效能測試項目PCMark10 Extendend中,4款Ryzen 9000系列的表現相當出色,Ryzen 7 9800X3D的表現與Ryzen 7 9700X甚至Ryzen 9 9950X幾乎相同。

同為綜合效能測試的CrossMark中,Ryzen 7 9800X3D也有與Ryzen 7 9700X接近的表現。

在Cinebench R20處理器渲染測試中,Ryzen 7 9800X3D在單核心部分落後Ryzen 7 9700X(105W)約4.98%,但在多核心僅落後0.56%。而Ryzen 7 9700X的cTDP提高到105W之後,在單核心部分沒什麼影響,但多核心效能大幅成長15.52%。

Cinebench R23處理器渲染測試呈現接近的趨勢,Ryzen 7 9800X3D在單、多核心分別落後Ryzen 7 9700X(105W)約5%、1.06%。

最新版本的Cinebench 2024處理器渲染測試負載比較重,Ryzen 7 9800X3D在單核心落後Ryzen 7 9700X(105W)2.17%,但多核心超車領先2.68%,大體算是平盤表現。

POV-Ray光線追蹤渲染測試的部分與前面的測試接近,Ryzen 7 9800X3D與Ryzen 7 9700X(105W)開出平盤表現。

V-Ray光線追蹤渲染測試中Ryzen 7 9800X3D以1.21%的微幅領先Ryzen 7 9700X(105W),落在誤差範圍內。

x264與x265 Benchmark軟體編碼影片轉檔測試的情況,可以看到105W cTDP對Ryzen 7 9700X的幫助相當大,而Ryzen 7 9800X3D表現不分軒輊。

在Handbreak轉檔軟體進行4K影片純軟體轉檔測試(無使用硬體加速)中,Ryzen 7 9800X3D的表現也追上Ryzen 7 9700X。

3DMark CPU Profile處理器多工測試能夠看出同處理器在不同負載的效能表現,Ryzen 7 9800X3D的表現介於cTDP為65W與105W的Ryzen 7 9700X之間。

分析3DMark CPU Profile處理器多工測試的多核心增益,圖中有方框者為Ryzen 7 9800X3D,可以看到在Max Threads具有8.28倍於1 Thread的效能表現,可以正常發揮多工效能。

在記憶體頻寬部分剔除使用DDR5-8000記憶體的Arrow Lake S處理器成績,Ryzen 7 9800X3D的表現與Ryzen 7 9700X差不多。

L1快取記憶體頻寬的表現,Ryzen 7 9800X3D與Ryzen 7 9700X有一小段落差。

L2快取記憶體頻寬的表現部分,可以看到cTDP提升對Ryzen 7 9700X的影響很大。

Ryzen 7 9800X3D的L3快取記憶體頻寬的表現受到3D V-Cache的影響,造成與Ryzen 7 9700X的落差擴大至36.98~38.71%。

各處理器的記憶體延遲表現。其中2組Ryzen 7 9700X與Ryzen 7 9800X3D之使用CL值為28的DDR5-6000,而Core Ultra 7 265K、Core Ultra 9 285K則使用CL值為40的DDR5-8000。

AIDA64燒機測試的功耗表現,預設TDP為120 W的Ryzen 7 9800X3D,在項表現與開啟105 W cTDP模式的Ryzen 7 9700X接近。

在燒機溫度表現部分,Ryzen 7 9800X3D的溫度在FPU壓力測試碰觸到95度的Tjmax保護溫度。

Ryzen 7 9800X3D遊戲效能分析

Ryzen 7 9800X3D的強項在於執行遊戲,可以透過容量更大的L3快取記憶體儲存更多資料以提升快取命中率,並有效降低運算延遲,能夠大幅改善遊戲效能,接下來就看看它的表現如何。

效能測試軟體3DMark的Fire Strike Extreme項目使用Direct X 11繪圖API搭配2K(2560 x 1440)解析度,Ryzen 7 9800X3D並沒有拉開明顯差距。

3DMark的Time Spy Extreme項目使用Direct X 12繪圖API搭配4K(3840 x 2160)解析度,Ryzen 7 9800X3D的表現也僅與Ryzen 7 9700X接近。

在實際遊戲部分先到競技類的《絕對武力2》。Ryzen 7 9800X3D的表現一馬當先,不但在1080p解析度的平均FPS突破550幀大關,99%(即1% Low)的指標表現也很好,可以降低遊戲卡頓感。

《古墓奇兵:暗影》在關閉光線追蹤時,Ryzen 7 9800X3D在1080p解析度的平均FPS達到358幀,不但大幅領先Ryzen 7000X3D系列,也領先Ryzen 7 9700X(105W)達39.14%。

《古墓奇兵:暗影》開啟光線追蹤後,Ryzen 7 9800X3D表現依然驚人,能夠在1080p解析度領先Ryzen 7 9700X(105W)達21.89%。

《看門狗:自由軍團》關閉光線追蹤時,Ryzen 7 9800X3D的表現較Ryzen 7000X3D系列高出許多,能夠領先Ryzen 9 7950X3D約12.32%。

《看門狗:自由軍團》開啟光線追蹤後,各處理器在1080p解析度表現還有落差,但到2K解析度則因碰觸顯示卡效能瓶頸(GPU Bound),而表現拉近。

《戰慄深隧:流亡》關閉光線追蹤時,Ryzen 7 9800X3D在1080p、2K解析度都拿下冠軍,而4K解析度同樣碰到顯示卡效能瓶頸。

《戰慄深隧:流亡》開啟光線追蹤後,提早在2K解析度就碰到顯示卡效能瓶頸,但在1080p解析度還是由Ryzen 7 9800X3D(105W)脫穎而出。

《極地戰嚎6》由於繪圖負擔較低,對處理器的效能相當敏感,Ryzen 7 9800X3D表現好得驚人,在1080p解析度領先Ryzen 7 9700X的幅度達到25.37%。

《極地戰嚎6》開啟光線追蹤後,仍然由Ryzen 7 9800X3D一枝獨秀,在1080p解析度領先Ryzen 7 9700X(105W)的幅度擴大至31.67%。

《刺客任務III》Dubai(杜拜)測試項目包含多種場景與NPC角色,整體負擔較低,Ryzen 7 9800X3D在1080p解析度的平均FPS快要追到450幀大關。

Dubai開啟光線追蹤後由於繪圖負荷提升,導致成績分佈比較接近。

《刺客任務III》Dartmoor(達特穆爾)測試項目則包含許多槍枝射擊與爆炸效果,充滿物理與粒子模擬,Ryzen 7 9800X3D仍有優勢,在1080p解析度領先Ryzen 7 9700X(105W)約27.23%。

Dartmoor開啟光線追蹤後,Ryzen 7 9800X3D在1080p解析度領先幅度下降至5.68%。

即便《電馭叛客2077》是相當吃重繪圖資源的遊戲,在關閉光線追蹤的情況下Ryzen 7 9800X3D仍在1080p解析度領先Ryzen 7 9700X(105W)約10.08%。

《電馭叛客2077》開啟光線追蹤後,Ryzen 7 9800X3D的領先優勢明顯縮小。

《黑神話:悟空》中,效能瓶頸集中於顯示卡,所以各處理器表現基本上完全相同。

《黑神話:悟空》開啟光線追蹤後各處理器的表現基本一致。

遊戲效能驚人,生產力不打折

Ryzen 7 9800X3D襲承先前「X3D」版處理器的優良傳統,透過容量更大的L3快取記憶體大幅提升遊戲效能,而它還站在這個基礎上,透過第2代3D V-Cache技術改善處理器核心的散熱條件,以達到更高的運作時脈,讓它能有接近於「X」版處理器的多工效能。

這樣最大的好處在於使用者不需像過去,為了追求極致遊戲效能,而在多工效能做出犧牲,讓Ryzen 7 9800X3D可以在遊戲之餘也兼顧多媒體創作、科學運算、程式編譯等倚重多核心運算效能的使用情境。

雖然Ryzen 7 9800X3D的價格高達美金479元(約合新台幣15,440元,截稿時台灣售價尚未公布),比起Ryzen 7 9700X市場價格的新台幣11,550元高出不少,但對於重視遊戲效能的玩家來說,仍然比Ryzen 9 9950X等旗艦級處理器更有吸引力。

另一方面,由於Ryzen 7 9800X3D也是採用AM5腳位,除了相容本世代800系列晶片組之主機板,也能向下相容600系列晶片組,因此現在Ryzen 7000 / 8000系列處理器的使用者能夠直接升級,透過單換處理器的升級方式取得極大幅遊戲效能提升,並省下更換平台的成本,相當有價格優勢。

加入T客邦Facebook粉絲團

Arm Tech Symposia 2024:Arm強調軟體先決發展策略,目標在2025年達到1000億AI裝置壯舉

Arm在Tech Symposia 2024科技論壇分享公司與AI技術發展策略,將自己定位為平台公司,提供完整運算單元組合與軟體框架。0104fea20782b7624152a6cead553f2b

Arm在Tech Symposia 2024科技論壇分享公司與AI技術發展策略,將自己定位為平台公司,提供完整運算單元組合與軟體框架。

硬體之外,軟體先決!

Arm北美業務副總裁曾志光在活動開場時,表示Arm做為運算平台公司,致力將AI推向每個角落,並攜手合作夥伴釋放AI的潛力,此外也加強與軟體開發者的溝通,並舉辦軟體工作坊活動以加強交流。

延伸閱讀:
Computex 2024:Arm發表終端產品運算子系統,全新Cortex-X925搭配Immortalis-G925效能提升高達36%
Computex 2024:Arm CEO Keynote重點整理,推動更全面的軟體、硬體生態系統
Arm Tech Day 2024解析終端產品運算子系統(3):完整軟體開發工具靠處理器就能加速AI

Arm資深副總裁暨終端產品事業部總經理Chris Bergey在主題演說中除了再次以平台公司(Platform Company)描述Arm,說明Arm具有CPU(中央處理器)、GPU(繪圖處理器)、NPU(神經處理器)等異質運算單元,能夠透彈性組合提供多元解決方案,但所有的硬體都需要搭配軟體,而軟體並不是魔法,需要開發者編寫程式,而Kleidi軟體函式庫就是個可以簡化軟體開發流程,且能發揮各種運算單元的運算能力,並依不同架構的CPU套用NEON、SVE2、SME等延伸指令集,提供最佳化AI運算效能。

活動也邀請MediaTek通訊事業部副總經理陳一強、Amazon Web Services台灣暨香港總經理王定愷對談,前者以近期發表的Dimensity 9400為例說明透過Armv9.2架構強化效能與AI圖像生成,後者則提到採用Arm Neoverse架構的AWS Graviton4處理器,以強大的AI與ML效能提供領先業界的效能、彈性與效率。

Arm北美業務副總裁曾志光為活動開場。

曾志光表示Arm舉辦多場軟體溝通會、工作坊活動以加強與開發者的交流。

Arm資深副總裁暨終端產品事業部總經理Chris Bergey在Tech Symposia 2024發表主題演說。

Chris Bergey提到台灣位於AI的中心,90%的高階晶片皆來自台灣。(投影片攝自活動現場,畫質不佳敬請見諒,下同)

Arm與Microsoft、軟體生態系統夥伴密切合作,推出更多原生Arm架構的Windows應用程式。

Kleidi函式庫能在多種Arm異質運算單元上執行,也支援多種AI運算框架,有助於簡化軟體開發並達成效能最佳化。

Chris Bergey提出在2025年底達成1000億個Arm裝置能夠執行AI應用程式的目標。

MediaTek通訊事業部副總經理陳一強表示智慧型手機等行動裝置具備執行4B參數的大語言模型(LLM)的能力,也能進行AI圖像生成等應用。

Amazon Web Services台灣暨香港總經理王定愷表示AWS提供多種Graviton4處理器驅動的執行個體選擇,能夠搭配多種AI運算框架使用。

鼓勵台灣把握邊緣AI發展機會

前Google台灣董事總經理簡立峰博士也受邀於主題演講壓軸登台,分享他對AI發展趨勢的觀點。簡立峰認為評估AI「能力」的關鍵在於推理能力(Reasoning),當AI具有一定程度的推理能力時,它就能自主「學習、理解」更多事物,並自我進化。

簡立峰舉例,以往老闆想要做某些事,但他又不懂、沒有能力時,只要丟一些書給員工,命令他們把書讀懂並完成任務即可。而現在人們也可以命令AI去「讀書」,讓AI自主取得更多知識與能力,如果AI分析完1億冊書籍(相當於100座大學圖書館的藏書),那麼它就能生成更具參考價值的回應。

簡立峰舉另一個例子,如果有個執行於筆記型電腦或智慧型手機的AI應用程式,可以透過課堂的錄音、錄影自動幫學生整理筆記,甚至在AI系統「學習」到課堂上的知識之後,還能寫作業甚至寫考卷,那麼學生可就輕鬆了。

聽起來很像天方夜譚嗎?其實現在Google推出的NotebookLM服務已經可以達成上述的使用情境。這已經是現在進行式,看來家長可能要有些不開心了。

簡立峰也提到,目前NotebookLM仍屬於免費試用階段,但未來應該會開始收費,其中原因不外乎使用這些雲端AI服務的時候,仍需負擔要資料中心建置與維護、運作電力等成本,只是目前由Google自行吸收。

如果將這類服務轉換為能在使用者電腦或手機上執行的邊緣運算AI應用程式,就能大幅分擔這些成本(或是說使用者自行負擔),而且對於電力的使用需求也從原本的集中在資料中心,轉變為分散至位於不同區域的使用者,能夠降低發電廠、電網等基礎設施的負擔。

這波邊緣AI運算也是台灣產業的一大商機,簡立峰表示台灣廠商很擅長生產硬體,但是對軟體、軟硬整合等服務則有待加強,鼓勵廠商應把握機會發揮創意,研發更多能夠解決方案與產品。

前Google台灣董事總經理簡立峰博士於主題演講中暢談AI觀點。

簡立峰表示當AI具有接近人類的推理能力後將會大幅改變AI的功能與應用。圖表為AI能力發展趨勢,縱軸的0.0代表人類基準能力,可以看到2020年開始AI的語言與閱讀理解能力已經達到人類能力。

AI模型發展的趨勢朝向大者更大以提供更精準、強大的功能,小者更小則適合在小型裝置執行或節省電力。邊緣AI、機器人AI等領導的軟硬體整合是台灣可以把握的產業發展機會。

量體較小的邊緣AI特色為運算需求較低,執行時消耗的電力也比較低,並且可以部署到不同地點,降低單一區域的電力負荷。

不同參數量體的LLaMA模型之各種能力指標的對比,其中100%為65B參數之標準化基準。例如7B的平均能力為65B的65%,閱讀理解能力為90%。

Chris Bergey在QA訪談中與媒體進行意見交流。

Arm在活動會場展示以FPGA開發板透過Cortex-M55 CPU搭配Ethos-U85 NPU執行0.15B參數的Llama2-tiny模型。

以TinyStories資料集為基礎的功能讓使用者輸入提示詞後,Llama2 會生成剩餘的故事內容。在時脈為32 MHz的FPGA開發板之效能為每秒約7.84組字詞(Token)。

Chris Bergey也在主題演講後與媒體進行QA訪談,但是對於大家都很感興趣的Qualcomm訴訟事件相關提問,僅回應「請參考公司聲明」。不過他同樣也鼓勵台灣廠商,應該跳脫硬體為主的思維(Think out of hardware.),並再次強調Arm是軟體先決(Software first)的公司,言下之意就是重申自家優勢,並期望雙方能擦出火花。

在活動會場的展示區,Arm展示了透過Cortex-M55 CPU搭配Ethos-U85 NPU執行0.15B參數的Llama2-tiny模型開發板作為概念性驗證(Proof of Concept,POC),證明在透過電池驅動的小行裝置或穿戴式裝置也能執行生成示AI,如果能將這些AI用於解決生活中的問題,就是前述軟硬整合的實踐。

加入T客邦Facebook粉絲團

Intel AI Playground動手玩:在本機套用第三方SDXL模型生成圖像、使用AI聊天機器人

Intel推出的AI Playground具有AI圖像生成、修圖、圖片擴展以及聊天機器人等功能,我們就透過搭在Core Ultra 258V的AI PC來體驗一下它的功能與效能。Ad5956f5ba235005260acb38b63f4745

Intel推出的AI Playground具有AI圖像生成、修圖、圖片擴展以及聊天機器人等功能,我們就透過搭在Core Ultra 258V的AI PC來體驗一下它的功能與效能。

可掛載第三方SDXL模型

Intel AI Playground是款可以免費下載的公用程式,但是需要電腦搭載Core Ultra-H、Core Ultra 200V系列處理器,或是具有8GB以上顯示記憶體之Arc顯示卡、顯示晶片才可使用。目前版本提供Create、Enhance、Answer等3大功能,分別能進行AI圖像生成、圖像放大、Inpaint修圖、更變圖像風格與Outpaint圖片擴展,並可透過大型語言模型(LLM)架設聊天機器人,所有功能都於本機運作,不需連接網路就可執行。

延伸閱讀:
Intel Lunar Lake效能實測: Asus Zenbook S 14效能微漲,AI、續航力翻倍!
Stable Diffusion AI算圖使用手冊系列文章目錄

讀者可以到AI Playground專案Github的Release頁面依硬體找到對應版本的安裝檔,在安裝後第一次執行各項功能時,程式會自動下載對應的模型。

在圖像生成部分,除了使用程式預設的模型之外,還可以自行下載Stable Diffusion 1.5或SDXL、Pony Diffusion的Checkpoint模型,並且可以套用LoRA小模型。

舉例來說,讀者可以到參考《Pony Diffusion安裝與使用技巧》一文,至CivitAI網站下載模型,並存放於對應的預設路徑,即可在AI Playground中使用。

開啟AI Playground程式後,使用者可以Create頁面使用AI圖像生成功能,並點擊右上角的齒輪圖示設定生成圖像的模型、解析度、迭代步數、亂數種子、CFG控制權重、生成數量、負面提示詞等,並在主畫面中輸入正面提示詞,再點擊生成按鈕就可以開始圖像生成。

以搭載Core Ultra 258V處理器的 Asus Zenbook S 14筆記型電腦為範例,使用內建顯示晶片進行解析度為1024 x 1024、迭代25步的SDXL圖像為例,大約38秒可以生成1張圖像,速度方面算是可以接受。

相關資訊:
AI Playground下載頁面:https://github.com/intel/AI-Playground/releases
CivitAI網站:https://civitai.com/
Checkpoint模型預設路徑:C:\Users\{使用者名稱}\AppData\Local\Programs\AI Playground\resources\service\models\llm\checkpoints
LoRA小模型預設路徑:C:\Users\{使用者名稱}\AppData\Local\Programs\AI Playground\resources\service\models\stable_diffusion\lora

▲Intel官方頻道之AI Playground功能簡介影片。

舉例來說,筆者使用代號為Lunar Lake的Core Ultra 200V系列處理器,在下載時可以選擇「LNL」版本。如果使用的Core Ultra 1系列處理器則可下載「MTL」版本,Arc顯示卡則選擇「dGPU」版本。

安裝後執行程式,可以在Create頁面使用AI圖像生成功能,程式會在第一次執行時下載對應的預設AI模型。

使用者也可以將Stable Diffusion 1.5、SDXL、Pony Diffusion等格式的第三方Checkpoint、LoRA模型放到對應資料夾,並在AI Playground中調用。

Checkpoint與LoRA模型可以在選單中進行指定。雖然官方說明文件中指出僅能同時1組LoRA,但是筆者卻無法正常載入,或許是程式的Bug。

此外在選單中還可以進行解析度、迭代步數、亂數種子、CFG控制權重、生成數量、負面提示詞等設定。

之後回到主畫面,輸入正面提示詞並點擊「生成」(Generate)即可。

AI Playground搭配personaStyle_v2Pony模型且無使用LoRA所稱成的範例圖項。

▲AI Playground圖像生成功能操作範例。

聊天機器人也可離線使用

AI Playground的Answer頁面為類似GhatGPT的聊天機器人功能,在大型語言模型檔案下載之後就能離線執行,其優勢為不需連接至網路,就算在飛機等無網路的環境也能使用,而且所有資料都留在本機,不會有資料外洩之疑慮。

Answer的使用方式也很簡單,同樣在第一次使用時會自動下載模型(建議可使用輕量的Phi-3-Mini-4K-Instruct),然後在提示詞區輸入對話內容,聊天機器人就會根據模型內的資料進行回答。

1

▲Answer功能可以選擇多種不同的大型語言模型,建議可選用輕量的Phi-3-Mini-4K-Instruct以達成較快的回應速度,系統會在第一次使用時會自動下載模型。

2

▲使用者在提示詞區輸入問題後,聊天機器人就會根據模型內的資料進行回答。

▲聊天機器人功能操作範例。

筆者在使用AI Playground的過程,還是有遇到一些小問題,例如無法自動下載圖像生成模型(仍可手動安裝),無法套用LoRA,手動輸入生成圖像解析度數值後需按下Enter鍵才能套用,在圖像生成功能輸入提示詞時無法使用Enter鍵換行(但可從外部貼上包含換行的文字),以及在載入圖像生成的模型時需要連接到網路(載入後斷網仍可正常運作),不過所幸這些問題都不大,且都能透過軟體更新修正。

由於AI Playground是免費軟體,且操作方式相當簡單,有興趣的讀者不妨自己下載並體驗各項AI功能。

加入T客邦Facebook粉絲團
❌