阅读视图

发现新文章,点击刷新页面。
✇T客邦-Techbang

Qualcomm Snapdragon X2 NPU效能稱霸!80 TOPS輾壓群雄,AI筆電2026登場

在看完Snapdragon X2平台的CPU與GPU解析之後,我們一起來看看同樣整合於SoC內的NPU,它以高達80 TOPS的AI運算效能成為現今最強的整合式NPU。29d6c511e6e22b693cd0641421b07ac8

在看完Snapdragon X2平台的CPU與GPU解析之後,我們一起來看看同樣整合於SoC內的NPU,它以高達80 TOPS的AI運算效能成為現今最強的整合式NPU。

代際效能成長78%

Snapdragon X2平台內建的Hexagon NPU(神經處理器)具有高達80 TOPS的AI運算效能,不但高於現在已推出的AMD Ryzen AI9 HX 375則為的55 TOPS,以及Intel Core Ultra 9 288V的48 TOPS,也高於Apple M4 Max的38 TOPS,成為當今AI運算效最強的整合式。

延伸閱讀:
Intel Panther Lake處理器NPU詳解,效能小幅提升、尺寸驟降40%
AMD Tech Day 2024(三):XDNA 2 AI運算架構解析,Block FP16資料類型運算效率倍增
NPU有什麼用?AMD說明處理器內建Ryzen AI加速單元的好處

Qualcomm為了改進Hexagon NPU的效能表現,分析超過300種不同AI模型運算過程中所占用的資源,並改進架構設計以達到更平均的純量、向量、矩陣運算以及記憶體資源分配,達到提升整體效能表現的成果。

筆者將Qualcomm於Snapdragon Compute Architecture Deep Dive 2025大會的說明整理於下。

Snapdragon X2平台內建的Hexagon NPU具有高達80 TOPS的AI運算效能,較前代產品提高78%。

Qualcomm表示Hexagon NPU能夠滿足代理式AI與多樣AI應用程式的許用需求。

回顧Hexagon的發展史,它在2004年應用於Hexagon DSP(Digital Signal Processor,數位訊號處理器),能夠加速乘積累加運算(Multiply Accumulate,MAC)。而衍生的Hexagon處理器則加強影像方面運算能力,並於2019年進化為Hexagon NPU,進一步強化機器學習運算能力。

在2019年改名為Hexagon NPU之後,運算單元的規模也是逐代擴大,滿足更複雜的運算需求。

Qualcomm分析超過300種不同AI模型對純量、向量、矩陣運算以及記憶體的資源需求,以利改進NPU架構能夠平均分配純量、向量運算以及直接存取記憶體(DMA)頻寬等資源,進而提升整體效能。

Hexagon NPU的純量引擎透過多執行緒技術(SMT)降低運算延遲,並藉由多層級分枝預測、使用者模式權限虛擬DMA、硬體資料同步等功能,以降低運算虛耗。

Hexagon NPU的純量引擎具有12條執行緒,具有與前代NPU相比2倍的記憶體頻寬,並具備64 bit DMA定址能力。

上述這些改進能夠讓Snapdragon X2平台的Hexagon NPU較前代產品的純量運算吞吐量提升143%。

受益於快取記憶體與DMA,讓Hexagon NPU的匯流排頻寬較前代提升127%。

Hexagon NPU的向量引擎具有8條執行緒,每組執行緒具有4組SIMD(Single Instruction Multiple Data,單指令流多資料流)指令窗口,新增支援FP8、BF16等資料類型。

Snapdragon X2平台的Hexagon NPU較前代產品的向量運算吞吐量提升143%。

矩陣運算單元支援2 bit格式的資料權重與FP8、BF16等資料類型,此外也支援融合激勵函數與深度捲積等運算的硬體加速,並具有獨立電源迴路以在閒置時節省電力。

Snapdragon X2平台的Hexagon NPU較前代產品的矩陣運算吞吐量提升78%。

NPU效能對照

Qualcomm為Snapdragon X2平台提供了完整的軟體堆疊,讓多種AI應用程式、執行環境、運算框架能夠分配到最適合的處理器(CPU)、繪圖處理器(GPU)或是NPU等運算單元,達到提供最佳效能同時兼顧電池續航力的效果。

筆者也將Qualcomm提供的官方效能數據整理於下。

Snapdragon X2平台的軟體堆疊可以將Phi、Llama、GPT、Gemini、Stable Diffusion等多種AI軟體,並調用CPU、GPU、NPU等單元執行運算。

利用CPU執行AI運算的特色為具有較快的反應速度,適合文字辨識、Windows Hello偵測,GPU效能較高,適合用於生成式AI。NPU則有出色效能與電力效率,適合持續性AI負載、代理式AI、視訊會議逐字稿等等。

以開啟1組上下文長度為1024個字詞的3B參數量大型語言模型(LLM)的AI代理為例,大約需要6 TOPS才能滿足流暢運作的需求。若將負載提高後,Snapdragon X2平台的80 TOPS AI運算效能能夠應付4組7B參數量的AI代理(需72 TOPS)。

Snapdragon X2 Elite Extreme的Procyon AI效能成績大幅領先Intel Core Ultra 9 288V、Core Ultra 9 285H等競爭對手的處理器,電力效率(每瓦電力獲得的分數)也領先許多。

Snapdragon X2 Elite Extreme與前代Snapdragon X Elite相比,在同樣消耗5 W電力的情況下,執行EDSR超解析度圖像升頻的效能大約成長60%。

在消耗相同電力的前提下,不同的資料類型或量化最佳化具有不同的效能表現。利如從FP16改為INT8或W4A16(INT4的特化量化,代表4 bit Weight與16 bit Activation混合量化)可提升4倍運算表現,若進一步改為W4A8可再提升2倍效能。

Qualcomm整理競爭對手處理器內建NPU的AI運算效能,自家Snapdragon X2 Elite Extreme達到80 TOPS,排名第2的AMD Ryzen AI9 HX 375則為55 TOPS。

在實際進行Procyon AI電腦視覺效能測試時,Snapdragon X2 Elite Extreme大幅領先競爭對手,領先第2名的Apple M4約95.71%。

Snapdragon X2 Elite Extreme在Geekbench AI 1.5也能領先Apple M4約69.78%。AMD Ryzen AI9 HX 370無法完成測試。

Procyon AI電腦視覺效能測的電力效率也是由Snapdragon X2 Elite Extreme大幅領先,可以超前Intel Core Ultra 9 285H達3.8倍。

Hexagon NPU的特色簡表。

首批搭載Snapdragon X2平台的筆記型電腦預計將於2026年上半年推出,屆時我們就有機會一窺新一代Windows on Snapdragon的實際效能與相容性表現。更多Snapdragon X 2平台詳細解說請參考Snapdragon Compute Architecture Deep Dive 2025系列報導

回到系列全文目錄

加入T客邦Facebook粉絲團
✇T客邦-Techbang

Snapdragon X2處理器電源管理與效能分析,解放200 W TDP變身效能怪獸

Qualcomm於Snapdragon Compute Architecture Deep Dive 2025活動說明Snapdragon X 2平台處理器的功耗、電力曲線,官方也提供效能參考數據。24c86634d887bb13fa31897289d21f21

Qualcomm於Snapdragon Compute Architecture Deep Dive 2025活動說明Snapdragon X 2平台系列處理器的功耗、電力曲線規劃,官方也提供了多筆效能參考數據。

輕薄到狂爆我全都要!

Snapdragon X2平台系列處理器主打的特色為低功耗、高效能,在提供超長電池續航力的同時,也能兼顧效能表現,顯著改善筆記型電腦的使用體驗。

延伸閱讀:
MSI Titan 18 HX AI效能實測,Core Ultra 9 285HX+ RTX 5090 Laptop旗艦組合
Intel Lunar Lake效能實測:Asus Zenbook S 14效能微漲,AI、續航力翻倍!
AMD Ryzen AI 9 HX 370效能實測:Asus TUF Gaming A16內顯、AI效能大躍進,還有獨顯火力支援

但是這並不代表Snapdragon X2平台僅能應用於輕薄的文書筆電,旗艦款的Snapdragon X2 Elite Extreme並沒有對持續性TDP做出功耗限制,能在電力、散熱條件允許的前提下盡可能提高TDP,達到更高的效能輸出,適合應用於TDP介於110 ~ 200 W的高階筆記型電腦,做為桌上型電腦的替代機種。

Qualcomm也精心調整Snapdragon X2平台的電力曲線,並推出能夠自動調整效能與功耗的SBO技術,也開放筆記型電腦OEM廠商自行調整參數,以利針對不同機種打造差異化設計。

Qualcomm說明Snapdragon X2平台對應的筆記型電腦設計考量包含尺寸、重量、成本、機身表面溫度、出風口溫度、噪音等等。

Snapdragon X2 Elite Extreme並沒有對持續性TDP做出功耗限制,能在電力、散熱條件允許的前提下盡可能提高TDP以解放最高效能。Snapdragon X2 Elite則將持續性TDP限制在22 W,追求較為平衡的效能、續航力、電腦尺寸與重量。

Qualcomm將產品規劃為SoC持續TDP小於20 W ~ 40 W的輕薄款式,以及60 ~ 100 W的高階輕薄款與110 ~ 200 W的桌上型替代機種。

Pirem叢集會依啟用中的處理器核心數量調整時脈。只啟用1個核心時,時脈可達5.0 GHz,2個核心則為4.8 GHz,6個核心全部啟用也能達到4.45 GHz,。

Qualcomm提出INPP(Idle Normalized Platform Power,平台閒置標準化功耗)概念,指將執行測試時的全機功耗,扣掉閒置時的全機功耗,大約等同於SoC、記憶體、電源轉換的功耗總和,表示這項數據更適合用於比較耗電量。

Scenario-Base Optimization(SBO)技術會偵測使用情況自動調整效能與功耗設定,在確保效能表現的同時延長續航力。筆記型電腦廠商也能針對產品規劃自行調整參數。

Snapdragon X2平台規劃SYS(系統)與SOC(單晶片)等2種不同的電力限制,數字越高代表TDP越高。SYS PL1、SOC PL1代表在機身表面溫度限度的持續性TDP,SYS PL2則為符合電池與充電器使用情況的持續性TDP。SYS PL3、SOC PL2則為Boost情況下短期拉高TDP以提升瞬時效能。

根據官方提供的數據,Snapdragon X2 Elite Extreme X2E-96-100在測試時,SoC的TDP最高達107.94 W。

閒置時系統會維持在低功耗狀態,在高負載時切換到PL2模式,並在碰到機身表面溫度上限時下降至PL1。而以EWMA(Exponentially Weighted Moving Average,指數加權移動平均)為基礎的電源控制模式能進一步改善效能輸出。

從效能圖表可以看到在攝氏44.2、50.4、53.2度等機身表面溫度限制下的運作狀態。

根據Qualcomm提供的效能數據,Snapdragon X2 Elite Extreme X2E-96-100執行Cinebench多執行緒、不限制TDP測試的表現遠高於Intel Core Ultra 9 285H與AMD Ryzen AI 9 HX 370。

Qualcomm也提供了3款不同Snapdragon X2平台SoC在Cinebench多執行緒測試的電力曲線圖表。

受益於SoC架構與電源模式的軟、硬體整合,讓小尺寸的Snapdragon X2平台概念機也能在小巧尺寸中提供強大效能。

官方公佈參考效能數據

Qualcomm也在活動中透過簡報透露了Snapdragon X2平台在多個測試工具的效能表現,筆者將數據圖表整理於下。

筆者也將文首延伸閱讀中提到的Intel Core Ultra 9 285HX、Intel Core Ultra 7 258V、AMD Ryzen AI 9 HX 370等3款處理器之Cinebench 2024測試數據與Snapdragon X2平台進行對照,可以發現旗艦款Snapdragon X2 Elite Extreme的表現相當出色,單核心效能壓制所有對照組,多核心部分也僅落後Core Ultra 9 285HX約14.36%。

Snapdragon X2平台系列處理器的設計目標為維持前代優異電池續航力的前提大幅提升效能。在瀏覽網頁、辦公軟體、觀看YouTube影片、Teams視訊會議時節省10%以上電力,閒置與播放影片時則消耗相近電力。

Snapdragon X2平台在插電與使用電池的情況具有效能一致性,2種情況的效能表現相當接近。

與前代產品相比,Snapdragon X2 Elite Extreme在單核心、多核心、繪圖處理器、神經處理器等分別有39%、50%、130%、78%的效能提升。

目前已發表的X2E-96-100、X2E-88-100、X2E-80-100等3款Snapdragon X2平台系列處理器,在Geekbench CPU測試的參考成績。

Cinebench 2024測試的參考成績。

筆者將先前專題報導的Cinebench 2024測試數據與Snapdragon X2平台進行對照。

3DMark Solar Bay、Steel Nomad Light測試參考成績。

Procyon AI電腦視覺、Geekbench AI測試的參考成績。

在Edge瀏覽器執行Speedometer 3.1、Procyon Office測試的參考成績。

Qualcomm提供的官方測試數據一覽。

在看完效能數據後,筆者將會繼續介紹Snapdragon X2平台的繪圖處理器,詳情請參考Snapdragon Compute Architecture Deep Dive 2025系列報導

回到系列全文目錄

加入T客邦Facebook粉絲團
✇T客邦-Techbang

Snapdragon X2處理器架構全解析:12大6小核心是怎麼煉成的?

我們接著看Qualcomm於Snapdragon Compute Architecture Deep Dive 2025發表的資訊,瞭解Snapdragon X2平台處理器的規格與「大小核」架構。372bde5c5e405b1c905d9623d9fc477c

CPU核心配置我們接著看Qualcomm於Snapdragon Compute Architecture Deep Dive 2025活動發表的資訊,瞭解Snapdragon X2平台系列處理器的規格與「大小核」架構。

12大6小,3叢集設計

Snapdragon X2平台的處理器也是採用「大小核」混合設計,其中效能較佳的稱為Prime核心,而電力效率較佳的則稱為Performance核心,2者可以依照電腦執行的程式即時調配工作負載與運作狀態,發揮兼顧效能表現與電池續航力的效果。

延伸閱讀:
【COMPUTEX 2025】Arm主題演講探討Arm架構上的AI發展,目標搶下PC與平板40%市占率
【COMPUTEX 2025】高通將和 NVIDIA 合作進軍資料中心市場,Snapdraogn 8 Elite 2 處理器預計九月底發表
Snapdragon X2 Elite Extreme 與 X2 Elite 正式亮相,主打 PC 效能與 AI 運算

在Snapdragon X2平台的架構設計中2者皆是以6個核心構成1個叢集,旗艦款的Snapdragon X2 Elite Extreme X2E-96-100具有2組Prime叢集搭配1組叢集Performance叢集,達成「12 + 6」共18核心的處理器組態,能夠透過靈活調度不同種類核心的方式兼顧效能與電池續航力表現。 

Snapdragon X2 Elite系列SoC規格簡表
SoC型號 CPU核心配置  最高Turbo時脈 快取記憶體總量 內建顯示晶片型號 內建顯示晶片最高Turbo時脈 最高NPU效能
X2E-96-100 12 Prime + 6 Performance 5.0 GHz 53 MB X2-90 1.85 GHz 80 TOPS
X2E-88-100 12 Prime + 6 Performance 4.7 GHz 53 MB X2-90 1.70 GHz 80 TOPS
X2E-80-100 6 Prime + 6 Performance 4.7 GHz 34 MB X2-85 1.70 GHz 80 TOPS

 

以Snapdragon X2 Elite Extreme X2E-96-100為例,它具有2組Prime叢集搭配1組叢集Performance叢集,每個叢集都由6個處理器核心構成,整組SoC具有18個核心。

大核架構衝上5 GHz

Snapdragon X2平台的「大核」為Prime核心,它以6個為單為組成Prime叢集,目前已發表的Snapdragon X2平台SoC最高具有2個叢集共12個Prime核心。比較特別的是,它的最高Turbo時脈可達5.0 GHz,成為首款達到5.0 GHz的Arm架構處理器。

為了加強在處理器執行AI應用程式的能力,叢集內部整合Qualcomm Matrix Engine矩陣引擎,它能夠提升矩陣與AI、ML(機器學習)等運算負載的效能,在進行AI運算時不需要將資料搬移到繪圖處理器(GPU)或神經處理器(NPU),具有更快的反應速度並節省搬運資料所消耗的電力,適合輕量AI應用程式。

筆者將處理器架構特色整理於下。

在Snapdragon X2平台的Prime叢集具有6個處理器核心,共享16 MB L2快取記憶體,並具有1組Qualcomm矩陣引擎。 

核心內部具有存取、記憶體管理、重命名與隱退、指令預取、指令執行、向量執行等多種單元。

在指令預取與解碼部分,具有192 KB L1指令快取記憶體,每週期可以預取16組指令,搭配9 Wide解碼器,最多每週期可以指派9組微指令(Micro Operation)。

暫存器具有9 Wide重命名機制以匹配解碼器,指派機制則能將微指令分發至14組以上的預留窗口,改善亂序處理的效率。

整數執行單元部分具有6 Wide 64 Bit整數管線,每週期最多可以執行6個算術邏輯運算,或4組分枝,或2組乘法、乘積累加運算。

向量與浮點數執行單元部分具有4 Wide 128 Bit向量管線,每條管線每執行4組FP32或INT32資料類型的加法、乘法、乘積累加運算,並可支援FP16、FP64、BF16等資料類型。

存取單元具有容量為96 KB的完全一致性6 Way L1快取記憶體,每週期能進行4個讀取或儲存動作(可以任意組合),並整合多種預取演算法改善運作效率。

記憶體管理單元部分支援4 KB與64 KB粒度轉譯,具有獨立的L1指令、資料快取記憶體轉譯後備緩衝區 (Translation Lookaside Buffer,TLB。存取需1個週期),以及統一L2快取記憶體TLB(存取需2個週期),並支援2階段轉譯以及巢狀虛擬化,強化虛擬機器的應用。

Prime叢集具有容量為16 MB的16 Way L2快取記憶體,運作時脈與處理器同步,並採用包含式設計(Inclusive,會儲存與L1指令、資料快取記憶體相同的資料),L1 Miss、L2 Hit的平均延遲為21個週期。而所有的18個處理器核心可以共享位於各叢集、總容量44 MB的L2快取記憶體。

Qualcomm Matrix Engine矩陣引擎可以加速矩陣以及AI、ML運算,支援512 Bit長度向量以及FP32、FP16、BF16、INT32、INT16、INT8等資料類型。其運作時脈能與處理器脫勾,在閒置時降速或關閉,以節省電力消耗,並降低發熱以避免影響處理器時脈。

在安全性方面,Snapdragon X2平台支援Security States EL3的TrustZone 技術、Security States EL2等安全層級,也支援記憶體標籤Memory Tagging技術。

與前代Snapdragon X Elite相比,Snapdragon X2 Elite Extreme的效能成長幅度達39%。在相同效能表現時,INPP功耗降低43%。

INPP(Idle Normalized Platform Power,平台閒置標準化功耗)指的是將執行測試時的全機功耗,扣掉閒置時的全機功耗,大約等同於SoC、記憶體、電源轉換的功耗總和。Qualcomm表示這項數據更適合用於比較耗電量。

小核能壓到2 W以下

Snapdragon X2平台的「小核」為Performance核心,它以6個為單為組成Performance叢集,目前已發表的Snapdragon X2平台SoC最高具有1個叢集共6個Prime核心。

Performance叢集縮減執行管線、亂序處理窗口,並縮小快取記憶體、轉譯後備緩衝區,以達到最佳效能與電力消耗的平衡,尤其適合功耗2 W以下的應用情境。

Performance叢集同樣由6個核心構成,搭載12 MB L2快取記憶體,並且具有Qualcomm Matrix Engine矩陣引擎。

Performance核心具有較佳的電力效率,適合負責背景、長駐程式,以及低於2 W功耗的使用情境。

Snapdragon X2平台的處理器特色一覽。無論是Prime核心或Performance核心都具有能夠加速AI運算的矩陣引擎,3個群組據總共擁有可共享的44 MB L2快取記憶體。

Snapdragon X2平台將在Arm架構與Android作業系統成熟的「大小核」經驗帶到Windows作業系統,發揮兼顧效能以及電力效率的功效,有助於延長筆記型電腦的電池續航力,帶來更理想的使用體驗。

更多Snapdragon X2平台詳細解說請參考Snapdragon Compute Architecture Deep Dive 2025系列報導

回到系列全文目錄

加入T客邦Facebook粉絲團
✇T客邦-Techbang

為手機設計的Abxylute M4磁吸式遊戲手把,可旋轉、分離還有經典致敬配色

Abxylute M4是款針對智慧型手機設計的遊戲手把,它採用藍牙5.3介面與MagSafe磁吸式安裝設計,方便隨時遊玩各種遊戲。6f4b0c94d9555d29b64f746f4ad54da6

Abxylute M4是款針對智慧型手機設計的遊戲手把,它採用藍牙5.3介面與MagSafe磁吸式安裝設計,方便隨時遊玩各種遊戲。

NGC配色解鎖

Abxylute M4是款小巧的磁吸式遊戲手把,尺寸為7.48 x 6.95 x 1.5公分,具有十字鍵、ABXY鍵、L1L2R1R2鍵,以及2組類比搖桿與4個功能鍵,它採用藍牙5.3介面與裝置連接,能夠支援Android、iOS等行動裝置,並且可以搭配PC以及Nintendo Switch使用。

延伸閱讀:
用FPGA打造的Game Bub遊戲機,支援GB、GBA實體卡匣還可連線對戰
拿了就走GamerCard掌上型遊戲機,超薄機身內裝Raspberry Pi Zero 2 W
Downing's Basement推出第5代改裝套件,任天堂Nintendo N64原始主機變身掌上型

Abxylute M4能夠直接安裝於具有MagSafe功能的iPhone 12之後的手機,其他智慧型手機則可在安裝MagSafe磁吸貼片後使用。安裝完成後可以將Abxylute M4折疊於手機背面收納,使用時可以配合手機的橫向或直立方向,或是將手把分離當作無線手把使用。

Abxylute M4除了黑、白等基本配色外,還有向Nintendo GameCube手把致敬的橘、紫色,以及透明紫等特殊配色可以選擇。

Abxylute M4是款相容MagSafe功能的遊戲手把,可以配合手機的橫向或直立方向使用。

Abxylute M4安裝後可以順著MagSafe旋轉,手把支架本身具有上下伸縮功能。

此外使用者還可將它與手機分離,當作無線手把。

分離時原本的磁吸機構可以發揮手機支架的功用。

Abxylute M4的尺寸為7.48 x 6.95 x 1.5公分,與最新的iPhone 17 Pro搭配也沒有問題。

Abxylute M4提供黑、白、橘、紫、透明紫等5種配色選擇。

Abxylute M4的各部功能一覽。

Abxylute M4的預定上市日期為2025年12月,預定售價為美金49元(約合新台幣1,540元)。

加入T客邦Facebook粉絲團
✇T客邦-Techbang

Snapdragon X 2系列平台功能解析:為Windows平台打造並整合豐富平台功能,讓筆電也能有智慧手機的流暢體驗

Qualcomm於Snapdragon Compute Architecture Deep Dive 2025活動中詳細介紹為Windows作業系統設計的Snapdragon X 2系列SoC。0e5a430210518138927fcba07962f2e3

Qualcomm於Snapdragon Compute Architecture Deep Dive 2025活動中詳細介紹為Windows作業系統設計的Snapdragon X 2系列SoC,我們先從平台功能切入,看看新一代產品具有哪些特色。

讓Windows電腦體驗更像智慧型手機

Qualcomm在Windows 10時期就開始推動Snapdragon on Windows 10計劃,讓x86架構的Windows作業系統與應用程式能運作於Arm架構的處理器,除了能夠帶來優異的電池續航力表現之外,Qualcomm也相當擅長開發行動裝置行動裝置,並將快速喚醒、常時連網、行動上網、常時感知(Always-On Sensing)、遠端管理等特色帶到Windows平台,改善使用者體驗。

延伸閱讀:
Computex 2018:Qualcomm發表Snapdragon 850處理器,不但提升30% Windows 10效能,明年可能登陸Chromebook
【COMPUTEX 2025】Arm主題演講探討Arm架構上的AI發展,目標搶下PC與平板40%市占率
Snapdragon X2 Elite Extreme 與 X2 Elite 正式亮相,主打 PC 效能與 AI 運算

到了Windows 11的時期,Qualcomm於2024年7月開始陸續發表Snapdragon X世代平台,旗下包含X Elite、X Plux、X等不同產品定位的SoC。到了2025年10月,Qualcomm發表全新Snapdragon X 2世代平台,首波產品包含18核心的旗艦款Snapdragon X2 Elite X2E-96-100 SoC。

Snapdragon X 2平台採用tsmc(台積電)3nm節點製程,最高具有18組第3代Oryon處理器核心,最高時脈可達5 GHz,是當下最快的Arm架構處理器,其整合的神經處理器(NPU)具有80 TOPS AI運算效能,較前代產品提升78%,能夠帶來更豐富的AI應用程式與使用體驗。

Snapdragon X 2平台也整合Wi-Fi 7無線網路、藍牙5.4無線傳輸、5G行動網路等通訊功能,Snapdragon Guardian可以提供遠端管理與升級、尋找裝置、清除裝置資料、遠端操作等資安進階功能。

Qualcomm於2025年10月發表全新Snapdragon X 2平台,對應的筆記型電腦產品預計於2026年上半上市。

Snapdragon X 2平台結合Windows筆記型電腦與智慧型手機的特色,打造更接近行動裝置的使用體驗。

Snapdragon Guardian的尋找裝置、清除裝置資料、遠端操作等資安進階功能可以透過網頁或App操作,提供有如行動裝置的資安防護功能與體驗。

整合豐富平台功能

Snapdragon X 2平台的處理器(CPU)部分最多可以配置2組效能較高的6核心Prime叢集(概念類似Intel處理器之P-Core),以及1組電力效率較高的6核心Performance叢集(類似E-Core),達到最高18核心的組態,並整合Adreno繪圖處理器(GPU)以及Hexagon神經處理器(NPU)。特別的是它與Intel的Lunar Lake處理器一樣將記憶體與SoC封裝在單一晶片,具有能夠節省空間、傳輸功耗,並提高傳輸效能的優點,但不同的是Snapdragon X 2平台還能額外擴充LPDDR5記憶體,以滿足更進階的使用需求。

另一方面,Snapdragon X 2平台最大的特色就是導入許多智慧型手機設計概念,除了支援5G行動網路數據機之外,也加入稱為Sensing Hub的感知中心運算單元,能夠在待機或低功耗的狀態下持續提供多種運算功能,帶來不同於傳統Windows筆記型電腦使用體驗。

筆者會先在這邊介紹平台的功能,至於CPU、GPU、NPU等運算單元則預計於後續文章說明。

Snapdragon X 2平台將SoC與記憶體封裝於同一晶片,筆電廠商還可以額外擴充LPDDR5x記憶體。

Snapdragon X 2平台採用tsmc 3nm節點製程,處理器部分最多可以配置2組6核心的Prime叢集(效能較高),以及1組6核心的Performance叢集(較省電),並整合Adreno GPU以及Hexagon NPU。

Snapdragon X 2平台的功能方塊圖。

Snapdragon X 2平台的記憶體控制器最高支援LPDDR5-9523,頻寬可達228 GB/s,並支援128 GB以上的記憶體定址能力。

其快取記憶體與記憶體互連(Memory Fabric)也經改善,搭載容量為9 MB的末端快取記憶體(Last Level Cache,LLC),供應CPU、GPU、NPU、感知中心(Sensing Hub)能夠共用。

行動網路部分Snapdragon X 2平台支援透過M.2 PCIe 3.0介面連接Snapdragon X75 5G數據機,上傳、下載頻寬分別高達10 Gbps、3.5 Gbps,頻段寬度可達1000 MHz。

無線網路部分則整合FastConnect 7800系統,使用6 GHz頻段時可提供5.8 Gbps傳輸頻寬,延遲低至2 ms,並支援藍牙5.4與LE Audio無線音訊。

Snapdragon X 2平台提供3組USB4端子,12條PCIe Gen 5通道以及4條PCIe Gen 4通道,支援最多2組NVMe協定PCIe Gen 5x4固態硬碟,以及UFS 4.0儲存媒體、SD Express與UHS-I規範之SDUC、SDXC記憶卡。

資安方面除了支援前面提到的Snapdragon Guardian技術,也搭載安全處理器(Secure Processing Unit,SPU)並支援Microsoft Pluton安全框架,提供SoC、記憶體保護,並確保系統、應用程式、網路的隱私。

Snapdragon X 2平台整合了常時開啟子系統(Always-On Subsystem),顧名思義可以在裝置待命或睡眠狀態提供常時連網與特定功能,並可將感應器的運算負載轉移至低功耗運算單元。此外也提供處理器、記憶體之動態效能調整,以發揮省電功效。

為了讓裝置在待命或睡眠狀態時攝影機、喇叭、麥克風、無線網路、藍牙、定位等常時感知功能可以在省電的前提持續運作,Snapdragon X 2平台新增了稱為Sensing Hub的感知中心,內部具有輕量的數位訊號處理器(DSP)、eNPU、記憶體,能夠執行簡單的功能。

音效及語音功能部分則搭載Hi-Fi等級Aqstic編解碼器,最多支援連接8組麥克風與喇叭,常時語音啟動功能讓使用者能在系統待命狀態透過語音控制喚醒,也能透過感知中心的eNPU進行語音降噪與消除迴音。

在Snapdragon Sound技術的加持下可以提供頂極藍牙音訊體驗,支援44.1kHz取樣頻率的無損音訊傳輸,延遲也能壓制在89 ms以下。

感知中心內的時常感知ISP影像訊號處理器能夠提供裝置自動喚醒、鎖定,以及自動螢幕亮度調整、旁觀者偵測等功能。

Spectra ISP影像處理器最多支援同時連接2組RGB加上2組紅外線攝影機,訊號處理部分最高支援2組3600萬畫素、30 FPS攝影機,以及6400萬畫素零延遲快門(Zero Shutter Lag,ZSL)、1080p 120FPS慢動作攝影等功能。此外它也提提供降低雜訊、多影格HDR、自動HDR、臉部偵測、背景模糊等功能。

Spectra ISP在低光源與HDR強化部分具有絕佳攝影品質,成為DxOMark評分最高的Windows裝置。

Adreno VPU影像處理器支援雙路8K60p解碼以及單路8K30p編碼,並支援獨立AV1格調編碼器與強化的10 Bit HDR,最高能夠同時進行32路視訊會議,若使用Microsoft Teams則可達49路。

Adreno DPU顯示處理器支援4組4K144p或5K60p影像出輸出,並支援Adaptive-Sync同步功能。

電源管理功能放置於SoC外部。

電源管理功能可以將電池或充電器輸入的5~20 V電壓轉換為3.3 V供應給電源管理積體電路(PMIC),並連接至多個快速切換的動態迴路,以提供各元件運作所需並減少電力耗損。

充電功能同樣放置於SoC外部。

充電部分支援Qualcomm Quick Charge 5 Plus技術,提供6段電壓與3段電流,最高支援20 V、7 A共140 W功率充電,具有更快的充電速度。

Snapdragon X 2平台特色功能一覽。

筆者也會持續更新Snapdragon X 2平台之CPU、GPU、NPU之架構解析與說明,請讀者參考下方目錄。

Snapdragon Compute Architecture Deep Dive 2025系列文章目錄:
Snapdragon X 2系列平台功能說明,用智慧型手機匠心打造Windows系統筆電(本文)
Snapdragon X 2平台CPU解析(暫定,工作中)
Snapdragon X 2平台GPU解析(暫定,工作中)
Snapdragon X 2平台NPU解析(暫定,工作中)

加入T客邦Facebook粉絲團
✇T客邦-Techbang

Arm Unlocked Taipei 2025:從雲端到邊緣的AI運算平台策略

繼先前在亞太區域4個城市之後,Arm於2025年11月13日在台北舉行壓軸場Arm Unlocked Taipei 2025大會,分享對於AI產業的觀察與產品規劃。D7d954f2eeb875628333bff4921500a1

繼先前在亞太區域4個城市之後,Arm於2025年11月13日在台北舉行壓軸場Arm Unlocked Taipei 2025大會,分享對於AI產業的觀察與產品規劃。

多層面強化AI效能

Arm日前於Unlocked中國上海場次發表了全新Lumex CSS平台,其中包含C1系列處理器(CPU)與Mali G1系列繪圖處理器(GPU),前者支援能夠加速矩陣與AI運算的SME 2指令集,後者則帶來更強悍的繪圖與AI運算效能。更多詳細說明請參考下方相關報導。

延伸閱讀:
Arm發表全新Lumex CSS平台,C1 CPU與Mali G1 GPU為旗艦級手機帶來25%效能增長
Arm Lumex CSS平台搭配全新C1系列處理器,4種型號隨意混搭最高14核心效能怪獸
Arm Lumex CSS平台Mali-G1系列繪圖處理器與平台功能解析,為旗艦級智慧型手機帶來2倍光線追蹤效能

Arm終端產品事業部產品管理資深總監Stefan Rosinger在《塑造智慧消費性電子的未來:Arm 終端產品藍圖》主題演說中再次介紹Lumex CSS平台以及C1 CPU與Mali G1 GPU的特色,並補充系統IP與軟體堆疊等資訊,筆者將現場簡報整理於下。

Arm終端產品事業部產品管理資深總監Stefan Rosinger在《塑造智慧消費性電子的未來:Arm 終端產品藍圖》主題演說中介紹全新Lumex CSS平台特色。

 

Arm透過Neoverse(資料中心)、Zena(智慧車輛)、Lumex(行動裝置)、Niva(個人電腦)、Orbis(物聯網)等產品線滿足差異化的AI運算需求。

CSS平台以中的C1 CPU較前代產品有雙位數百分比的IPC(Instructions per Cycle,每周期指令)效能成長,並支援能帶來5倍AI效能的SME 2指令集。Mali G1 GPU在繪圖與AI部分的效能成長幅度也達到雙位數百分比,光線追蹤效能則達到2倍。

4款新CPU中,由C1-Ultra與C1-Premium接替先前Cortex-X925的型號,而C1-Pro與C1-Nano則分別接替Cortex-A725與Cortex-A520。。

Arm預估到了2030年,SME與SME2指令集將為超過30億台裝置提供總量達到100億TOPS的AI運算效能。

 

Stefan Rosinger也補充了系統IP的優勢,SI L1系統互連能夠降低75%互連延遲,MMU L1記憶體管理單元最多可以降低83% TBU(Translation Buffer Unit,轉譯緩衝單元)延遲。

全新Lumex CSS平台相容於多間晶圓代工廠的2、3 nm製程節點,可以帶來更出色的PPA(Performance、Power、Area,效能、省電、尺寸)優勢。

Arm也在由韌體、虛擬機器、核心、函數庫與執行環境、運算框架、應用程式等軟體堆疊的多個環節導入SME 2支援,提升AI運算的效能表現。

改善Windows on Arm效能與

Arm首席應用工程師余志誠在《Windows on Arm應用程式效能與可靠性的實務知識》主題演說中,提到軟體最佳化對Windows on Arm使用者體驗的重要性,並介紹Arm提供的多種資源,協助開發者將應用程式移植為原生Arm版本,以展現更高的執行效能並提高筆記型電腦的電池續航力。

Arm首席應用工程師余志誠在《Windows on Arm應用程式效能與可靠性的實務知識》主題演說中介紹原生Arm架構應用程式的優勢。

Arm與Microsoft提供多種程式開發工具、工具鏈(Toolchain)、運算框架來簡化原生Arm架構應用程式的開發流程。

原生Arm架構應用程式(紅線)在處理器佔用率與記憶體使用量都低於x86模擬器(藍線),有助於帶來更流暢的使用體驗。

在同時使用視訊、視訊特效、螢幕分享、語音等繁重負載的情況下,x86模擬器(藍線)的耗電量大約為原生Arm架構應用程式(紅線)的1.95倍,可見原生Arm架構應用對於筆記型電腦的電池續航力有很大的幫助。

Arm與Microsoft也提供豐富的線上學習資源,協助開發者能夠瞭解程式最佳化的概念與實作方式,進而達成將應用程式移植為原生Arm版本。

3種運算單元各展所長

Arm資深產品經理Vahan Ter- Grigotyan在《橫跨 CPU 與 GPU:打造無所不在的裝置端人工智慧》主題演說中說明不同運算單元的特性,分析CPU、GPU、NPU(神經處理器)所擅長的使用情境。

CPU具有最高的普及率,基本上所有裝置都有CPU,有利於將AI應用程式推廣給最多數的使用者。雖然它的架構並非最有利於AI運算常用的矩陣迭代運算,但是具有最佳軟體彈性,能夠在不需更新硬體的前提下相容最新的AI模型或是資料類型,而且在運作過程具有無需資料搬移、即時運算等優勢,延遲低於其他種類運算單元。

而GPU則有次高的普及率,大多數的智慧型手機、平板電腦都具有GPU,可程式化的特性讓它具備較好的軟體相容性,適合應用於高強度AI運算或與圖像相關的AI應用程式。

NPU的普及率比較低,部分中、低階智慧型手機、平板電腦可能不會搭載NPU,但是它具有為矩陣迭代運算需求特化的架構,具有相對出色的AI運算效能與電力效率,適合需要長時間或於背景執行的AI功能。

Arm資深產品經理Vahan Ter- Grigotyan在《橫跨 CPU 與 GPU:打造無所不在的裝置端人工智慧》主題演說中說明CPU、GPU、NPU等運算單元的特性。

CPU適合應用於小型、低延遲的AI運算負載,GPU適合與圖像相關應用,NPU則適合各類AI負載。

CPU具有高度普及與高軟體相容性等優勢,能夠達到「Develop once deploy everywhere」(寫一次程式即可部署到任何裝置)的優勢。

大多數的智慧型手機、平板電腦都具有GPU,也很適合用於AI應用。

Vahan Ter- Grigotyan補充相較於遊戲應用,透過GPU進行AI運算所消耗的記憶體電力大約相差5倍,因此改善記憶體的運作效率與功耗也相當重要。

CPU、GPU、NPU等運算單元在代理式AI運算的不同階段能夠各展所長。

利如Google相簿中的橡皮擦功能也利用了CPU、GPU等運算單元。

總結來說,CPU適合對記憶體延遲敏感的負載,GPU適合與影像相關的應用,NPU適合高度量化與重複的推論工作。

Arm除了在消費性產品中提供完整的運算系統與解決方案,在資料中心、智慧車輛、物聯網等使用情境也都有推出對應的產品,滿足各種不同量體與使用情境的AI運算需求。

加入T客邦Facebook粉絲團
✇T客邦-Techbang

走進Intel亞利桑那晶圓廠,一窺Intel 18A製程節點生產基地

Intel位於美國亞利桑那州錢德勒市的Fab 52晶圓廠肩負Intel 18A製程節點製造的重責大任,讓我們走進廠內看看晶圓廠究竟長怎麼樣。78e5981fcde0771836345dd4cb08d9f3

Intel位於美國亞利桑那州錢德勒市的Fab 52晶圓廠肩負Intel 18A製程節點製造的重責大任,讓我們走進廠內看看晶圓廠究竟長怎麼樣。

投資總額超過美金500億元

Intel自1979年起於亞利桑那州展開業務,並於1980年在錢德勒市(Chandler)開始製造與組裝等業務之營運,至今投資總額已超過美金500億元,讓Intel成為亞利桑那州最大的民營企業之一,也讓亞利桑那州成為美國主要的半導體製造中心。

延伸閱讀:
Intel執行長Pat Gelsinger宣稱Intel不但未來10年能延續摩爾定律,甚至能帶來2倍的開發速度
半導體製程怎麼命名比較好?Intel:遵照摩爾定律走就對了

Intel於2021年3月宣布在錢德勒市的Ocotillo廠區擴建Fab 52與Fab 62等2座先進晶圓廠,總投資金額高達美金320億元,其中Fab 52於2021年末動土,開挖超過100萬立方公尺的土石,相當於400座奧運標準游泳池,使用60萬立方公尺的混凝土與7.5萬噸鋼筋,是世界最高建築杜拜哈里發塔(Burj Khalifa in Dubai)的2倍用量,安裝的管線總長度約900萬公尺,相當於214場全程馬拉松的距離。

Intel也相當重視永續性,並投入大筆資源推動廠內水處理與循環再利用,透過水循環分配系統淨化水源,每日可處理與回收再利用900萬加侖的水,並在亞利桑那州已實現水資源正效益(water positive),不僅在營運中節約用水,並資助周邊區域水資源復育計畫,Intel於2023年為亞利桑那州復育了11億加侖的水資源。

Intel位於美國亞利桑那州錢德勒市Ocotillo廠區的Fab 52晶圓廠肩負Intel 18A製程節點製造。

晶圓廠的高度達70英尺(約21.33公尺),全年無休生產數以百萬計的晶片,雖然其尺寸只有指甲般大小,卻是世上最複雜的產品之一。

晶圓廠外部具有許多管線,輸送運作過程所需的水以及各類化學藥劑。

走進Fab 52晶圓廠內部

筆者這次有機會進入Fab 52晶圓廠內部參觀,但是受到保密因素而無法自由攝影,因此使用Intel提供的圖像進行介紹。

晶圓廠主要可以分為4層樓層,由下往上看,1樓是公共設施層,包含支援晶圓廠的電力面板與主管線等設置,冷卻與壓縮系統,監控設備的員工會穿著便服,但必須戴安全帽和防護眼鏡。

2樓為無塵室下層,包含數千個幫浦、變壓器、電力櫃與其他系統以支援無塵室的運作,稱為「Laterals」的大型管線負責輸送氣體、液體、廢棄物與廢氣,並將其運往或運離生產設備,此區員工不需穿著防塵衣,但必須戴安全帽、防護眼鏡、手套以及鞋套

3樓為無塵室層,由超過1,200台工廠設備組成,是唯一實際進行晶片生產的地方,用來處理直徑30公分、外觀如披薩般大小的矽晶圓,最終將其轉化為數百顆電腦晶片。員工會身穿防塵衣,以避免毛髮與皮屑掉落到晶圓上。

4樓則為間隙層,安裝了確保無塵室空氣潔淨的系統,並能夠精確控制在生產過程所需的溫度與濕度。

為了避免光阻劑在微影製程中受到短波長光線的非預期曝光,所以無塵室通常使用黃色燈光,部分員工會配戴藍色鏡片的眼鏡以校正人眼感受的顏色。

不過有趣的是導覽人員表示,現在使用的光阻劑「應該」是不會受到白色燈光的影響,但是如果替換為白色燈光而造成預期外的影響,可能會造成金額極為龐大的財務損失,所以仍傾向維持黃色燈光,選擇「流程沒問題就不要亂改」的保守選項。

晶圓廠內部的生產區域為無塵室環境,所有人員都必需穿著無塵衣。

採用Intel 18A製程節點的Panther Lake處理器就是在Fab 52製造。

工作人員可以利用背包攜帶所需物品,但因為保密與資安需求而需使用指定的透明背包。

微影機是晶圓廠內最重要的機器,ASML TWINSCAN NXE:3800E是目前最先進的微影機之一,造架高達美金1.8億元(約合新台幣55.67億元)。

晶圓廠內還有許多不同功能的機器以及工作人員操作區域。

晶圓的搬運工作則交由天車負責,每台天車能夠裝載25片晶圓。Ocotillo廠區具有超過2100台天車以及30英哩的軌道(約48.28公里)。

在4層樓高的晶圓廠中,其中3層的功能為支援無塵室,而圖中編號2號的無塵室是唯一實際進行晶片生產的地方。無塵室通常使用黃色燈光,以防光阻劑在微影製程中受到短波長光線的非預期曝光。

在Ocotillo廠區內因保密因素而無法自由攝影。筆者於會議室的佈景前穿著無塵衣留影。

Ocotillo廠區是現在Intel 18A製程節點的主要製造基地,負責Panther Lake與Clearwater Forest等處理器中運算模塊的生產,更多詳細資訊可以參考全文目錄中這2款處理器的架構說明。

回到系列全文目錄

加入T客邦Facebook粉絲團
✇T客邦-Techbang

簡單1步驟防詐騙,查看TLS憑證確認普發10000網站真偽

隨著普發10000措施上路,相信許多讀者都迫不及待上網登記,只要記得查看TLS憑證這個簡單的動作,就能避免落入詐騙或釣魚網站的圈套。D9e0a72f6e9a627cd38ceac607fb0fc3

隨著普發10000措施上路,相信許多讀者都迫不及待上網登記,只要記得查看TLS憑證這個簡單的動作,就能避免落入詐騙或釣魚網站的圈套。

1步防詐超簡單

普發10000措施的官方網站網址為「https://10000.gov.tw」,由於阿拉伯數字的1、0與英文O、大寫I、小寫L等字體外觀相當接近,因此很可能成為詐騙或釣魚網站利用的圈套。

延伸閱讀:
Google擴大HSTS應用範圍,確保旗下更多網站安全性
Apple出包,你的SSL加密是否安全?SSL原理解析,從密碼學看加密技術的安全性
中華電信TLS憑證遭Google撤信任,董事長道歉推8大改革拚2026回歸名單

為了避免詐騙,筆者建議能夠先在Google、Bing等知名搜尋引擎搜尋「中華民國財政部」官方網站,再由網頁上的連結轉至普發10000措施官方網站,如此一來便可大幅降低詐騙風險。

另一方面也可以檢查普發10000措施官方網站的TLS憑證是否為TWCA(台灣網路認證)所簽發,也可以避免遭騙。操作方式請參考下列圖文說明。

如果想要透過登記入帳方式領取普發的10,000元現金,請務必小心不要遇到詐騙或釣魚網站。

以Windows電腦的Chrome瀏覽器為例,依序點擊網址前的「選單」、「已建立安全連線」、「憑證有效」。

就能夠確認憑證的發行者是否為TWCA。

以iOS 18.4以上版本為例,內建的Safari瀏覽器能夠查看TLS憑證,依序點擊網址前的「選單」、「放大鏡」等圖示。

然後點擊「連線安全資訊」,查看憑證的發行者是否為TWCA。

如果讀者的iOS版本較低,仍可利用Chrome瀏覽器。操作時依序點擊右下角「選單」、「網站資訊」。

然後點擊網「連線」,查看憑證的發行者是否為TWCA。

Android裝置部分以Chrome瀏覽器為例,依序點擊網址前的「鎖頭」、「已建立安全連線」,查看憑證的發行者是否為TWCA。

SSL、TLS加密保護資安

除了透過確認TLS憑證查核網頁是否為真之外,可以注意到普發10000措施官方網站的網址開頭為「https://」,而非只是http,代表著它採用加密的HTTP(HyperText Transfer Protocol,超文本傳輸協定)通訊協定。

加密HTTP協定可以透過SSL、TLS等方式對使用者與網站之間的雙向傳輸資料進行加密,以防止中間人攻擊。即便攻擊者從中攔截資料封包,也無法判讀其中的資料,另一方面也能夠阻止攻擊者篡改封包中的資料,能夠大幅提高瀏覽網頁的安全性。

更多加密HTTP協定的詳細說明可以參考筆者先前撰寫的《SSL原理解析,從密碼學看加密技術的安全性》一文,隨然它的日期比較舊,但基本概念與現今的加密技術仍然一致,有助於了解SSL、TLS的運作原理。

簡單地說SSL、TLS加密能夠防止攻擊者攔截資料封包並且竊聽、篡改,有助於提高資訊安全性。

能領取普發10,000元現金故然是件開心的事,但可不要因為一時疏忽而遭遇詐片並造成財務損失。

加入T客邦Facebook粉絲團
✇T客邦-Techbang

Arm策略暨生態系執行副總裁Drew Henry分享趨勢觀點,改善運算平台延續「經濟摩爾定律」

Arm在媒體說明會邀請Drew Henry,分享半導體產業在晶片、系統、軟體等發展趨勢的觀點,並強調Arm身為運算系統公司的自我定位。20c7c9f647a2c470d595ebbb56729931

Arm在媒體說明會邀請Drew Henry,分享半導體產業在晶片、系統、軟體等發展趨勢的觀點,並強調Arm身為運算系統公司的自我定位。

協助生態系統發展與創新

Arm策略暨生態系執行副總裁Drew Henry媒體說明會中,以Arm在產業扮演的角色開場,除了透過多種產品線滿足不同特定使用情境的需求,也提供完整軟、硬體堆疊,給予生態系統夥伴更多元的解決方案。

延伸閱讀:
Arm發表全新Lumex CSS平台,C1 CPU與Mali G1 GPU為旗艦級手機帶來25%效能增長
Arm發表Zena CSS車用運算平台,簡化AI定義車輛開發並節省20%工程資源
【COMPUTEX 2025】Arm主題演講探討Arm架構上的AI發展,目標搶下PC與平板40%市占率

Drew Henry在會中說明Arm為各種AI運算的應用需求提供多種解決方案,以滿足資料中心、智慧車輛、行動裝置、個人電腦、物聯網裝置等不同運算規模,並提供架構、運算、軟體之完整堆疊,協助開發者將各種創新的想法轉換為實際產品。

Arm策略暨生態系執行副總裁Drew Henry於媒體說明會分享對產業趨勢的觀察。

Drew Henry表示擴大AI模型、日益增加的AI應用程式需求、裝置端代理式AI、設計複雜度與成本、電力限制、快速創新等多個因素重新定義運算的需求。

Arm提供多種不同運算單元,能夠滿足資料中心、智慧車輛、行動裝置、個人電腦、物聯網裝置等不同規模的運算需求。

Arm的運算平台提供完整的架構、運算、軟體堆疊,並重視生態系統的經營。

在運算部分,Arm為透過Neoverse(資料中心)、Zena(智慧車輛)、Lumex(行動裝置)、Niva(個人電腦)、Orbis(物聯網)等產品線滿足差異化運算需求。

Arm生態系統的另一個優勢為「Write once deploy everywhere」(寫一次程式即可部署到任何裝置),彰顯軟體與開發環境的重要性。

Drew Henry也強調台灣位於AI的中心,具有晶片設計、晶片製造、先進封裝、主機板與伺服器等技術優勢。

從經濟角度思考摩爾定律

Drew Henry提到自己造訪台灣的資歷超過25年,每次來台灣都感到非常興奮,稱讚台灣不只有堅韌的個人電腦、智慧型手機、伺服器等供應鏈,也是許多新技術的開發者與早期採用者(Early Adopter)。

Drew Henry也在會後訪談中分享對趨勢的觀點,認為AI並不是泡沫。回顧許多產業泡沫化的問題在於運算能量(原文為Capacity)被創造出來之後,並沒有投入實際應用,而AI則是實際應用的需求仍高於現在全球運算能量的總合,而AI也已經投入許多疾病、藥物的研究,以及其他相當多領域的應用,因此不認為AI會有泡沫化的狀況。

而筆者也提出延續摩爾定律的方式除了可以透過改善晶片設計以及半導體製程技術之外,改善軟體執行效率是否可以視為在半導體微縮遇到物理極限後,持續推進業界發展的手段。

Drew Henry表示他會從經濟的層面切入,而不是技術的角度回答這個問題。原始摩爾定律指出「積體電路上可容納的電晶體數目,每隔約2年便會增加1倍」,Drew Henry則以「經濟摩爾定律」來思考,將目標定為每單為成本可提供的運算能力,每隔約2年便會增加1倍。

更進一步,如果以系統性方式來解決問題,除了軟體架構的改善之外,互連性(Connection)與I/O等效率也都在系統扮演重要的角色,不但與Arm的核心經營理念相符,也與Arm近年規劃的運算平台與解決方案不謀而合。

Drew Henry表示自己的工程師性格相當喜歡挑戰:「當你給我1個限制,我就會找到新的方式來解決問題」,在AI運算消耗的電力日漸提高的趨勢下,Arm將持續提供業界最佳電力效率的運算單元(即相同消耗電力下提供最高效能),並樂觀面對x86架構處理器(CPU)以及繪圖處理器(GPU)等競爭對手的正面競爭,促進各廠商共同為業界帶來更理想的解決方案。

Drew Henry對於台灣的產業與供應鏈抱持相當正面的評價。

Drew Henry在訪談中自信地提到,Arm是業界內為雲端、邊緣、本地等不同場域AI運算準備最為充份的公司,透過豐富的產品線滿足差異化的需求。

加入T客邦Facebook粉絲團
✇T客邦-Techbang

Intel Xeon 6+ Clearwater Forest 處理器解析,18A 製程與先進封裝塞入 288 組核心

Clearwater Forest處理器採用Intel 18A製程節點與Foveros Direct 3D先進封裝製造,在單一處理器中整合288組代號為Darkmont的E-Core核心。Ed30ef8f91b3eb1e41107efb25b4a7c9

代號為Clearwater Forest的Intel Xeon 6+處理器採用Intel 18A製程節點與Foveros Direct 3D先進封裝製造,在單一處理器中整合288組代號為Darkmont的E-Core核心,帶來更高的核心密度。

3種模塊的高度模組化設計

Clearwater Forest架構的模組化程度相當高,能夠混合搭配多種不同製程,達到控制成本與良率等優點。

延伸閱讀:
Intel說明Xeon 6處理器與Gaudi 3加速器優勢,雙路處理器給你滿滿192條PCIe Gen 5通道
Intel推出新款Xeon 6處理器,強化AI運算效能與效益還能跑DeepSeek
Intel Vision 24:Lunar Lake、Xeon 6處理器以及Gaudi 3加速器推動AI無所不在

Clearwater Forest下列3種不同的模塊構成:

  • 運算模塊(Compute Tile,Intel 18A製程節點):內含代號為Darkmont的E-Core處理器核心
  • 主動式基底模塊(Active Base Tile,Intel 3製程節點):運算模塊的載板,並搭載最高4組48 MB末端快取記憶體(總計192 MB),與4組DDR5-8000記憶體控制器
  • I/O模塊(I/O Tile,Intel 7製程節點):延用前代模塊以達成向下相容性,整合PCIe、CXL、UPI等介面,以及8組加速器

從最小的分類組別開始看,Clearwater Forest內所有的核心皆為Darkmont架構E-Core核心,4組E-Core以及共用的4 MB L2快取記憶體將構成1組運算模組(Module),而6組運算模組會構成1組運算模塊(等於總共有24組E-Core),成為Clearwater Forest可擴充設計中最基本的單元。

Clearwater Forest規格上的亮點包含最高288組核心、576 MB末端快取記憶體、12通道DDR5-8000記憶體等。

Clearwater Forest架構的設計目標除了提高效能與電力效率之外,也包含透過模組化的設計達到生產最佳化。

第3代Xeon採用單一裸晶設計,第4、5代則透過EMIB將2組裸晶封裝為單一晶片。第6代採用模組化設計,以2種製程以及EMIB 2.5D封裝。Clearwater Forest則提高模組化程度,包含3種製程以及EMIB 2.5D、Foveros Direct 3D封裝。

回顧代號為Granite Rapids的第6代Xeon,運算與記憶體模塊採用Intel 3製程節點,I/O模塊採用Intel 7製程節點,並以EMIB 2.5D封裝。

Clearwater Forest的概念有點像把前代的運算與記憶體模塊拆分,運算模塊採用Intel 18A製程節點,主動式基底模塊採用Intel 3製程節點。I/O模塊則沿用先前設計。

Clearwater Forest的Foveros Direct 3D封裝之點距為9 um的銅對銅連接,晶片上也有主動運算邏輯以及快取記憶體等功能。

Clearwater Forest的主動式基底模塊與I/O模塊透過EMIB 2.5D封裝與連接。

Clearwater Forest的運算模塊之中,最小的單元為4組E-Core與4 MB L2快取記憶體構成的運算模組。

運算模塊由6組運算模組構成。

也就是說整個運算模塊總共具有24組E-Core,Clearwater Forest的各型號處理器具有數量相異之運算模塊。

同腳位可直接升級288核心處理器

Clearwater Forest的主動式基底模塊最多可以安裝4組運算模塊,並為每個運算模塊擴充48 MB末端快取記憶體(Last Level Cache,LLC)。整個主動式基底模塊搭載4組DDR 5記憶體通道,並提供最多192 MB末端快取記憶體。

I/O模塊則延用代號為Granite Rapids的Xeon 6處理器的設計,具有48組PCIe Gen 5通道、32組CXL通道、6組UPI 2.0端子(Ultra Path Interconnect,總計96組通道),以及可提供資料加密與壓縮的QAT(QucikAssist Technology)、佇列排序與封包最佳化的DLB(Dynamic Load Balancer)、加速資料傳輸的DSA(Data Streaming Accelerator)、提升資料庫記憶體效率的IAA(In-Memoty Analytics Accelerator)等功能的加速器各2組(總共8組加速器)。

受益於延用I/O模塊的社設計,讓Clearwater Forest處理器對外通訊的機制與先前世代相同,進而達到Pin-to-Pin腳位相容的升級彈性,能夠相容於Xeon 6900P系列的FCLGA7529腳位主機板。

Clearwater Forest的SoC(System on Chip,系統單晶片)最多能容納12組運算模塊、3主動式基底模塊組、2組I/O模塊。

「滿血版」Clearwater Forest具有12組運算模塊,總共具有288組實體核心,L2快取記憶體總容量達288 MB,並具有576 MB末端快取記憶體,支援12通道DDR5-8000記憶體(最高容量達3 TB,頻寬達1,300 GB/s),提供96組PCIe Gen 5通道、64組CXL通道、6組UPI 2.0端子。

Clearwater Forest也支援雙路處理器配置,等同於在單一伺服器提供高達576組實體核心,以及192組PCIe Gen 5通道,適合需要高核心數、高執行個體的應用,並提供充沛的擴充能力連接顯示卡、運算卡、固態硬碟以及各類運算卡。

主動式基底模塊的功能是承載4組運算模塊,並提供最多192 MB末端快取記憶體,以及4組DDR 5記憶體通道。

I/O模塊具有48組PCIe Gen 5、32組CXL 2.0、3組UPI 2.0端子,以及8組各類加速器。處理器含有2組I/O模塊,帶來2倍數量的上述通道與加速器。

Clearwater Forest之規格特色。

Clearwater Forest之規格簡表。

Clearwater Forest與Sierra Forest之重點規格對照表。

Clearwater Forest最大的突破,就是在Intel 18A製程節點與Foveros Direct 3D先進封裝的助拳下,將更多核心塞入單一處理器,並強化電力效率。此外它也提供腳位相容的升級選項,讓現有的伺服器能透過單純更換處理器的方式進行升級,達到擴充核心數、提升效能、降低運作功耗等優勢,並壓低升級的經費成本。

對於隔代升級的企業用戶來說,Clearwater Forest大幅提高的核心數,並提供高達8:1的伺服器合併率,剩餘的空間與電力、散熱預算(Power Budget、Thermal Bugdet )也能用來擴充AI伺服器或其它基礎設置,為資料中心的建置與轉型提供更高的彈性。

筆者也將會在後續文章詳細說明Intel晶圓廠以及Intel 18A製程節點、各先進封裝的特色,請讀者參考全文目錄繼續閱讀。

回到系列全文目錄

加入T客邦Facebook粉絲團
✇T客邦-Techbang

Sora App動手玩,使用Sora 2 AI影片生成模型搭配Cameos功能讓自己客串演出

OpenAI現已在台灣正式推出iOS平台的Sora App,使用者只需註冊免費帳號就能使用AI影片生成功能,讓我們一起來玩玩看效果如何。C6d2a4202c2fc5f062a28dbb0956a7f7

OpenAI現已在台灣正式推出iOS平台的Sora App,使用者只需註冊免費帳號就能使用AI影片生成功能,讓我們一起來玩玩看效果如何。

(刊頭圖片使用Stable Diffusion生成)

建立Cameos並生成影片

筆者在前文介紹了Sora App的功能與特色,接著我們就在這篇文章中實際操作。使用iOS裝置的讀者可以從App Store網路商店下載App,而Android裝置使用者則可至Google Play網路商店預先註冊,以在開放下載時收到通知。

延伸閱讀:
OpenAI推出台灣版Sora App,免費下載、透過Sora 2模型生成AI影片
Sora App 正式登台!Sora 2 影片生成模型客串功能再進化,讓你的寵物也變 AI 網紅
Stable Diffusion AI算圖使用手冊(1-1):這是什麼黑魔術?

Sora App的概念與多數社群媒體App接近,使用者可以在Sora App中利用AI生成影片並發表在個人頁面,也可以瀏覽朋友或其他使用者發表的影片,並利用Remix功能重新編輯影片進行二次創作。

筆者以羅浮宮為主題生成了4支影片,並透過Cameos功能讓自己客串演出。使用說明整理於下方圖文說明。

▲筆者利用Sora App生成4支影片,第1集為開車出發前往羅浮宮。

▲第2集則是開始「工作」的準備。

▲參觀羅浮宮美術館有100種方式,各有各的特色。

▲而參觀羅浮宮美術館也有100下場,歹路還是不要走。

▲首次執行Sora App的時候需要註冊免費帳號,並可跟隨指示建立自己的Cameos。如果錯過建立Cameos,則進入App主畫面右下角的帳號中心,並點選新增角色。

完成初始設定後,在App主畫面點選下方的「+」符號建立新影片。

接著在提示詞欄位輸入影片內容的描述,並選擇客串清單中的角色以讓自己出現在影片中。完成後點擊送出按鈕並等待片刻。

影片生成完成後,會出現在主畫面右下角的帳號中心內的草稿區。

在草稿區確認影片沒問題之後就可以點擊發佈影片,或是點擊右上角的選單下載影片。

如果生成影片的內容不如預期,則可點擊編輯影片修改提示詞以修正內容。這支失敗範例影片中的人物並沒有如預期唸出台詞。

在修改提示詞以「對著鏡頭說:」指令,成功讓人物唸出正確的台詞。

設定Cameos權限與確認剩餘額度

Sora App的功能相當簡明易懂,比較需要注意的部分就是設定Cameos權限,以及確認影片生成額度,詳情請參考下方圖文說明。

首先在帳號中心頁面右上角的選單鍵。

就可以開啟帳號設定選單。

進入客串存取權頁面,就能夠設定誰能夠使用你的Cameos,以免未經許可的人使用你的臉孔。

進入使用情況頁面,則可確認免費與付費影片生成的剩餘額度。

雖然Sora App本身具有安全審查功能,但是為了避免自己的臉孔被其他人拿去生成影片,所以筆者建議將客串存取權設定為「只有我」,以避免不必要的困擾。

加入T客邦Facebook粉絲團
✇T客邦-Techbang

OpenAI推出台灣版Sora App,免費下載、透過Sora 2模型生成AI影片

OpenAI將台灣納入亞洲首批推出Sora App的名單,使用者可以在免費下載iOS平台App,利用Sora 2模型生成栩栩如生的影片,Android平台App預計隨後登場。2d17fc217bfb5709266ca8dbc0640cc1

OpenAI將台灣納入亞洲首批推出Sora App的名單,使用者可以在免費下載iOS平台App,利用Sora 2模型生成栩栩如生的影片,Android平台App預計隨後登場。

AI影片生成免費玩

Sora是OpenAI推出的AI文字生成影片模型,能夠根據使用者輸入的提示詞生成影片。OpenAI於2025年10月1日推出第2代模型Sora 2,帶來更擬真的影像與物理行為,並提高影片的連貫性與可控性,改善影音同步,以提升輸出影片的整體品質。

延伸閱讀:
Sora App動手玩,使用Sora 2 AI影片生成模型搭配Cameos功能讓自己客串演出(工作中)
Sora App 正式登台!Sora 2 影片生成模型客串功能再進化,讓你的寵物也變 AI 網紅
Microsoft微軟整合OpenAI GPT-5至多款產品,電腦、Android、iOS裝置嚐鮮免費使用
Stable Diffusion AI算圖使用手冊(1-1):這是什麼黑魔術?

Sora App則是OpenAI推出、以Sora AI生成影片創作為主軸的社交應用軟體,也提供正體中文介面,並且支援正體中文提示詞,降低App的操作門檻,讓,讓使用者更輕鬆地生成更貼近本地文化的影片。

Sora App也提供Cameos功能,使用者只需在App內跟隨指示錄製1次自己的影片與聲音,隨後即可建立自己的客串角色,並成為影片中的人物,將自己的形象搭配提示詞以生成各種影片,添增影片的趣味性,也成為與朋友互動的新方式。

此外使用者可以利用Remix功能,藉由輸入提示詞的方式編輯現有影片或是他人分享的影片。為了能留下編輯過程所使用的「原素材」,每部Remix影片都會明確標示,並可左右滑動查看編輯過程以及創意發展脈絡。

使用者可以利用Sora App的Cameos功能,讓自己出現在AI生成影片中。

▲在Sora App中建立客串角色之後,就可以使用Cameos功能將自己的形象搭配提示詞以生成各種影片。

Remix功能則可透過輸出提示詞改編現有影片。

重視安全與尊重版權

OpenAI也特別強調Sora App的安全性與相對應的企業負責。舉例來說,OpenAI認為Sora App應以創作為核心,而非是繞人上癮的無止盡瀏覽,因此在演算法推薦內容以來自使用者追蹤或互動過的創作者為主,並優先顯示模型判斷最能激發其靈感、促進創作的影片,而非以「停留時間」作為目標,以達到鼓勵創作,而非單純消耗內容的設計宗旨。

OpenAI也在訪談中提到,為了尊重現有各種電影、動畫等作品的創作價值,將會在使用者輸入提示詞,以及影片生成之後,進行2輪內容審查,以確保內容不會侵犯到他人著作權。此外每部Sora App所生成的影片都包含可見的動畫浮水印,以及不可移除的C2PA數位浮水印,以明卻標示影片由Sora生成。

在使用Cameos功能時,使用者可以完全掌控自己的肖像權,只有自己能設定自己肖像資料的存取權限,且可隨時撤回或移除含有自己肖像的影片。系統針對青少年使用者設有更嚴格的Cameos使用權限,並預設限制青少年每日可瀏覽的生成影片數量,同時也將擴大人工審查團隊,以快速處理潛在霸凌情況,家長則可透過ChatGPT啟用Sora家長監控功能,調整捲動限制、關閉演算法個人化推薦與管理私訊等設定。

iOS版Sora App已開放下載,Android版則可預先註冊,正式推出時間未定。

目前Sora App僅提供iOS版本,可免費使用,未來將推出Android版本,並可能因運算資源進行費用與方案調整。

加入T客邦Facebook粉絲團
✇T客邦-Techbang

【NVIDIA GTC DC 2025】Vera Rubin Superchip登場,打造超級資料中心數位孿生與物理AI

NVIDIA執行長黃仁勳於美國華盛頓特區舉行的GTC DC大會中,展示Vera Rubin Superchip以及相關產品,並說明透過數位孿生技術規劃超級資料中心,以及針對機器人應用的物理AI。F5b33f860b9ca758bfc8dfcdb176b65e

NVIDIA執行長黃仁勳於美國華盛頓特區舉行的GTC DC大會中,展示Vera Rubin Superchip以及相關產品,並說明透過數位孿生技術規劃超級資料中心,以及針對機器人應用的物理AI。

無纜線設計

黃仁勳先前已於Computex 2024 CEO Keynote演說中提到Vera處理器(CPU)與Rubin繪圖處理器(GPU)等產品命名,到了GTC 2025也再次說明更多技術細節。

延伸閱讀:
NVIDIA於GTC DC 2025大會(上):當AI摩爾定律放緩就用加速運算與外部擴展解決問題
NVIDIA於GTC DC 2025大會(下):Vera Rubin Superchip登場,打造超級資料中心數位孿生與物理AI(本文)
Computex 2024:NVIDIA CEO 黃仁勳 Keynote 重點整理,揭露下代運算平台規劃
【GTC 2025】黃仁勳演說深入分析:提出「終極摩爾定律」,追求相同耗電更高效能
NVIDIA於AI Infra Summit 2025發表Rubin CPX GPU,透過分離運算提升6倍AI推論效能
Hot Chips 2025:NVIDIA發表Spectrum-XGS Ethernet,實現Scale-Across分散式運算

Vera Rubin Superchip的整體設計與先前Grace Blackwell Superchip,電路板上具有1組Vera CPU晶片封裝(總共具有88核176緒配置的客製化Arm架構處理器核心),以及2組Rubin GPU晶片封裝(總共具有4組GPU裸晶)。

比較特別的是它採用無纜線連接,Vera Rubin Superchip與伺服器主機板透過插槽連接,而不再需要纜線,能夠改善伺服器內部空間以及散熱效果。

NVIDIA執行長黃仁勳於的GTC DC大會中提到,2026會計年度中Blackwell與Rubin等架構的GPU有望帶來美金5,000億元的累計收益。

Rubin架構GPU遭直2025年問世,下代Feyman預計於2027年推出。

Vera Rubin Superchip由6兆個電晶體構成,能夠提供100 PFLOPS運算效能,並搭載總容量達2 TB的記憶體。

黃仁勳於活動舞台展示Vera Rubin Superchip。

黃仁勳也提到Vera Rubin CPX運算托架,圖中左側最上方為2組Rubin GPU晶片封裝,往下其次為1組Vera CPU晶片封裝、4組Vera Rubin CPX晶片封裝、4組Connect-X網路晶片。右側亦同。

黃仁勳也同步發表NVIDIA BlueFiel-4智慧型網路卡,提供速度高達800 Gbps的頻寬。

擬真物理環境訓練機器人

黃仁勳表示開源模型對AI生態系的發展相當重要,讓更多開發者能站在現成AI模型的基礎上,開發更多元的應用程式或是客製化微調模型,而NVIDIA也響應這個觀點,推出Nemotron(代理式AI)、Cosmos(物理AI)、GR00T(機器人)、Clara(生物醫學)等多種開源基礎模型。

另一方面,NVIDIA的Omniverse平台適合用於建立數位孿生,這次發表的Omniverse DSX Blueprint是針對超級資料中心(Gigascale AI Factory)設計的工作流程範本,讓廠商能進行氣體與液體管線、配電、伺服器設置的設計,並在虛擬環境中驗證可行性並進行最佳化,待確認無問題之後再進行施工,以簡化整體工作流程。

Omniverse平台也能用於機器人的AI模型訓練,搭配物理AI與模擬功能,讓虛擬環境也能反映真實的物理行為,提高訓練的成效。

黃仁勳也提到開源模型對AI生態系的發展相當重要。

NVIDIA提供Nemotron(代理式AI)、Cosmos(物理AI)、GR00T(機器人)、Clara(生物醫學)等多種開源基礎模型。

黃仁勳介紹透過Omniverse DSX Blueprint建立資料中心的工作流程範本,廠商能在數位孿生中設計並驗證資料中心的氣體與液體管線、配電、伺服器設置,在電腦中確認無誤後再行施工。

Omniverse DSX Blueprint整合多種應用程式與AI功能,能夠簡化程式的部署與前置作業。

▲透過Omniverse平台以數位孿生方式設計資料中心,能夠簡化整體工作流程。

NVIDIA與Disney Research合作的Blue機器人也在物理AI的虛擬環境中訓練,並強化它對周圍環境的適應力。

舉例來說,啟用物理模擬後(右),虛擬環境中的布簾就會與機器人產生互動。

機器人在沙地中行走時,腳步也會與沙石產生互動,如此一來能夠強化訓練效果。

▲從影片中可以看到啟用物理模擬後,能讓機器人在更擬真的虛擬環境中進行訓練。

對GTC DC 2025大會有興趣的讀者,可以在NVIDIA的YouTube頻道觀看開幕演說影片重播,以瞭解更多資訊。

加入T客邦Facebook粉絲團
✇T客邦-Techbang

【NVIDIA GTC DC 2025】黃仁勳:當 AI 摩爾定律放緩,就用加速運算與外部擴展解決問題

NVIDIA於美國華盛頓特區展開GTC DC大會,執行長黃仁勳除了分享對AI發展的趨勢分析,也介紹多樣技術資訊,並在舞台上展示Vera Rubin Superchip。659f053681178024dd7fc66600340b76

NVIDIA於美國華盛頓特區展開GTC DC大會,執行長黃仁勳除了分享對AI發展的趨勢分析,也介紹多樣技術資訊,並在舞台上展示Vera Rubin Superchip。

透過GPU加速各種運算

黃仁勳在GTC DC大會的開幕演說中,以摩爾定律放緩為引。隨著半導體製程技術漸漸碰觸到物理極限,電晶體的尺寸難以持續縮小,造成單一晶片的效能成長也隨之放緩,為了解決這個問題,黃仁勳表示透過GPU進行加速運算就是個明確的解方。

延伸閱讀:
【NVIDIA GTC DC 2025】黃仁勳:當 AI 摩爾定律放緩,就用加速運算與外部擴展解決問題
NVIDIA於GTC DC 2025大會(下):Vera Rubin Superchip登場,打造超級資料中心數位孿生與物理AI(工作中)
Hot Chips 2025:NVIDIA發表Spectrum-XGS Ethernet,實現Scale-Across分散式運算
NVIDIA於AI Infra Summit 2025發表Rubin CPX GPU,透過分離運算提升6倍AI推論效能
NVIDIA於GTC 2023春季展發表多樣AI技術,帶來更多生成式AI還能用AI加速晶片設計與生產

黃仁勳表示NVIDIA提供多款以CUDA運算架構為基礎的加速運算API(應用程式介面),並以與Nokia合作的ARC(Aerial RAN Computer,無線電接入網天線電腦)為例,透過AI協助6G網路基礎系統強化無線頻譜、束波成型的管理,以提升通訊品質。

另一方面NVIDIA也發表NVQLink連接量子電腦的量子處理器(QPU),透過繪圖處理器(GPU)強大的平行運算能力為量子位元進行即時錯誤校正。

隨著半導體製程技術漸漸碰觸到物理極限造成效能成長放緩,黃仁勳表示能夠透過GPU加速運算解決問題。

NVIDIA提供多款以CUDA運算架構為基礎的加速運算API。

NVIDIA發表與Nokia合作的ARC,透過AI協助6G網路基礎系統強化無線頻譜、束波成型的管理,以提升通訊品質。

NVQLink是款能夠連接量子電腦的量子處理器(QPU)的互連技術。

如此一來能夠透過GPU強大的平行運算能力為量子位元進行即時錯誤校正。

目前已經有多間合作夥伴與NVIDIA在量子運算領域上展開合作。

透過Scale-Across彌補摩爾定律放緩

黃仁勳也重提AI運算的3個擴展法則,其中預訓練(Pre-Training)為透過大量資料進行AI基礎模型的訓練,而後訓練(Post-Training)則是針對使用需求,輸入特定專業領域的資料對模型進行微調,而推論中思考(Test-Time Training)則指所謂的長思考或是推理式AI,在AI推論運算的過程中,透過思維鏈(Chain of Thoght)的方式讓AI系統反覆進行思考推論,以提高答案的精準度。

另一方面,黃仁勳也分析了AI生態系統的循環趨勢。當企業透過AI服務營利之後,將利潤投入擴建AI基礎設施,如此一來就能提高服務品質以及同時上線的使用者人數,以賺取更多利潤。

至於另一個解決摩爾定律放緩的方式,就是透過外部擴展解決問題。傳統上擴產電腦效能的方式有Scale-Up與Scale-Out,前者可以理解為更換效能更強的運算單元,以提高單一伺服器的效能,後者則是串聯多台伺服器,提高整體效能輸出。

以NVIDIA的產品為例,Grace Blackwell NVL72機櫃內整合72組Blackwell GPU,彼此透過NVLink互聯技術整合為單一運算叢集,對軟體與應用程式而言它就像是1顆效能優異的超大型GPU,發揮類似於Scale-Up的效果。而各機櫃還可以透過InfiniBand或Ethernet(乙太網路)等方式進行Scale-Out擴展。

黃仁勳則再次重申先前在Hot Chips 2025大會提到的Scale-Across分散式運算概念。透過超低延遲、高頻寬的資料交換技術,串聯位於不同地理位置的資料中心,將多座獨立的資料中心整合為單一超級AI工廠,以滿足超大量體(Giga-Scale)AI運算需求。

黃仁勳表示AI的一切基礎是能源,並透過GPU以及AI資料中心的基礎設施,搭配AI模型與應用程式提供多種功能與服務。

AI運算的3個擴展法則為預訓練、後訓練、推論中思考等環節,而生態系統的「永動機」循環則為透過AI服務獲取營利,然後將利潤投入擴建AI基礎設施,再提供更優質的服務。

Scale-Across概念為透過網路串聯多個位於不同地理位置的資料中心的運算節點,進一步提升整體運算效能。。

Grace Blackwell NVL72是將72組GPU透過NVLink互聯技術整合為單一大型GPU。黃仁勳手中的「矽盾」為具像化的舞台道具。

NVLink的強大之處在於可以讓多顆GPU整合為單一運算節點,簡化軟體開發流程,並提高整體運作效率。

黃仁勳也在演說中提到Vera Rubin Superchip與相關產品,並介紹了超級資料中新數位孿生與物理AI等技術進展,筆者將在下篇文章中繼續說明。讀者可以參考文首的延伸閱讀連結。

加入T客邦Facebook粉絲團
✇T客邦-Techbang

Intel Panther Lake邊緣運算動態展示,將推出工控寬溫版還有迷你單板電腦

Intel在2025年度Tech Tour.us活動的動態展示議程中,說明將Panther Lake應用於邊緣運算的優勢,並提供應用實例參考。D2296bddf7c7517dd24249445b2e2dd9

Intel在2025年度Tech Tour.us活動的動態展示議程中,說明將Panther Lake應用於邊緣運算的優勢,並提供應用實例參考。

AI工控電腦解決方案

Panther Lake的中央處理器(CPU)、繪圖處理器(GPU)、神經處理器(NPU)分別具有最高10、120、50 TOPS的AI運算效能,本身也整合Wi-Fi 7 R2無線網路功能,再加上充沛的處理器運算效能,以及採用x86架構能夠相容許多既有程式的優勢,讓它也能在邊緣運算領域發揮所長。

延伸閱讀:
NVIDIA推出加強版的Jetson Orin Nano Super:性能達 67 TOPS,價格約台幣8200元
Jetson Orin Nano開發套件動手玩(一):規格介紹與開箱

Panther Lake的另一個優勢就是整合IPU 7.5影像處理器,能夠同時連接3組MIPI介面攝影機或紅外線攝影機,以利擷取更清晰的即時影像,對於需要透過電腦視覺(Computer Vision)與真實世界互動的倉儲機器人、自走車、機械手臂、人型機械人等應用來說相當重要。

Intel表示將會推出能夠在更高或更低環境溫度中運作的寬溫版Panther Lake處理器,以滿足工控電腦更加嚴苛的運作環境,此外也在活動中展示開發板形式的迷你單板電腦樣品,方便開發者可以將其導入自動化工業、機械手臂、醫療器材、智慧城市等各種邊緣運算裝置,或根據需求修改、客製化設計,以滿足在不同使用情境以及所需構型的多樣化需求。

Intel表示過去40年精通邊緣運算與嵌入式系統的經驗,並在過去10年間達到2億邊緣運算運算用x86架構處理器出貨量,也累計超過4,000個邊緣運算生態系統夥伴。

邊緣運算的未來趨勢包括工業用生成式AI、AI視覺瑕疵偵測、通用人型機器人、基礎設置安全之代理式AI、醫療影像用多模態AI等領域。

Panther Lake具有高AI運算效能、高繪圖效能、高電力效率、工業應用可靠度、應用彈性等優勢,更高的效能也有助於降低AI運算的延遲。

Intel也提出使用過去Meteor Lake、Lunar Lake、Arrow Lake等處理器應用於超音波成像、數位病理學、心臟肥大偵測、生產品管等領域,在長達5年的稼動期間最多節省87%總體擁有成本(Total Cost of Ownership,TCO)。

Intel推出的Robotics AI Suite整合多個AI函數庫、樣本、效能測試以協助開發者快速提出機器人解決方案。

Panther Lake也能以開發板或單板電腦等形式以縮小尺寸,以利塞入邊緣運算裝置內部。

AI功能應用展示

在智慧零售的展示中,所有的運算負載以及AI推論完全運作於本地端的Panther Lake的處理器,而不需仰賴雲端伺服器的協助,對企業來說能夠省下在雲端運算的伺服器租賃費用。

系統透過攝影機拍攝包裝工作區,自動辨識進入區域的商品是否與訂單相符,並統計打包的正確率、自動生成報表,大幅簡化需要透過人工審查並建立表單的工作流程。

在智慧城市應用部分,則以智慧路口代理式AI做為示範,系統能夠自動計算路口各方向的車流量,並監控各項環境數據,自動判讀是否有意外狀況發生。

若發生堵塞或事故,系統也能夠提出應變措施的決策,並提早在前方路口的資訊看板提醒用路人改道或顯示相關資訊,以緩解交通擁塞或避免災難擴大。

智慧零售以訂單打包的正確率統計為範例。

系統透過攝影機影像辨識進入區域的商品是否與訂單相符,並統計打包的正確率。

系統會偵測打包動作的開始與結束時間點,並透過YOLO物件偵測、LVLM大型視覺語言等AI模型分析物品,並比對是否與訂單相符。

Panther Lake具有高效能GPU、NPU等運算單元,能夠執行多個AI模型以滿足代理式AI的使用需求。

智慧城市應用部分,則以智慧路口代理式AI做為示範。

系統能夠並監控交通流量與事故狀況,並自動做出應對的提示。

Panther Lake省電的特性讓它能夠以電池驅動並維持數小時運作,相對充沛的AI運算效能讓它也有於本地端進行AI運算的能力,讓它能夠在斷網、斷電的情況下運作,舉例來說能夠應用於自走車、機器人等非定點使用的裝置,發揮更大的使用彈性。

更多Intel Tech Tour資訊請讀者參考全文目錄繼續閱讀。

回到系列全文目錄

加入T客邦Facebook粉絲團
✇T客邦-Techbang

Intel Panther Lake處理器動態展示,比Lunar Lake更省電、AI應用工作更方便

Intel在2025年度Tech Tour.us活動中透過實機展示的方式,說明Panther Lake處理器的特色,同時介紹了許多AI相關應用實例。0d3c786d62f1e9fccd310452197aa5b0

Intel在2025年度Tech Tour.us活動中透過實機展示的方式,說明Panther Lake處理器的特色,同時介紹了許多AI相關應用實例。

LP E-Core發揮省電功效

Panther Lake的運算模塊(Compute Tile)內的效率叢集具有4組低功耗LP E-Core,受益於架構改進與先進製程帶來的效能提升,LP E-Core也能勝任越來越多程式運作的需求。而當4組LP E-Core能夠滿足系統整體的運算負載需求時,就可以關閉P-Core與E-Core所在的效能叢集,達到節省電力的效果。

延伸閱讀:
Intel Lunar Lake效能實測: Asus Zenbook S 14效能微漲,AI、續航力翻倍!
CES2025:Intel展示Panther Lake處理器實機,還有超酷的互動觸控板
Computex 2024:Intel於Technology Tour Taiwan發表Lunar Lake處理器,帶來1.5倍GPU、3倍NPU效能

在現場展示中,搭載Panther Lake以及前代Arrow Lake、Lunar Lake處理器的筆記型電腦同時執行Team 4人視訊會議、打開10個分頁的Chrome瀏覽器(包含播放YouTube影片)、Excel、Power Point等程式的效能需求,模擬日常使用情境。

在運算負載的分佈狀況部分,Panther Lake與Lunar Lake的4組LP E-Core的都能滿足運算需求,所以其餘核心都處於關閉狀態。而Arrow Lake將2組LP E-Core放置於SoC模塊(SoC Tile),因為效能無法滿足需求,因此需要啟動運算模塊並將負載轉移到P-Core與E-Core。

在耗電量部分,Lunar Lake全機8.28 W的瞬時功耗已經相當出色,然而Panther Lake能進一步將功耗降低至8.00 W,然而Arrow Lake則高達11.3W,可見Panther Lake的省電效果相當出色。

特別值得注意的是,展示的Panther Lake處理器為16核心的版本(4P + 8E + 4 LP E),比Lunar Lake的8核心(4P + 4 LP E)還要多出8組E-Core,但可以在此測試條件下達到更低的耗電量,讓人期待屆時實際測試的續航力表現。

Intel客戶端技術專家Craig Raymond於會場展示Panther Lake處理器運算模塊之12吋晶圓。

在現場動態展示中,Panther Lake的全機瞬時功耗僅8.00 W,相較之下Lunar Lake功耗還達到8.28 W,Arrow Lake則高達11.3W,。

測試條件為在筆記型電腦同時執行Team 4人視訊會議、打開10個分頁的Chrome瀏覽器(包含播放YouTube影片)、Excel、Power Point等程式,並使用外接螢幕。

Panther Lake處理器為16核心的版本(4P + 8E + 4 LP E),負載集中在4組LP E-Core,所以只需開啟效率叢集,並關閉效能叢集以節省電力。

Lunar Lake處理器為8核心的版本(4P + 4 LP E),4組LP E-Core依然能滿足運算需求。

Arrow Lake處理器為16核心的版本(6P + 8E + 2 LP E),但是2組LP E-Core無法滿足運算需求,所以需要開啟整個運算模塊,並將負載放在P-Core與E-Core,因此消耗更多電力。

AI功能再進化

另一項能夠節省電力的技術是針對HDR高動態範圍設計的Smart Power HDR功能,它會透過顯示驅動程式計算畫面的亮度資訊,與顯示器的面板時序控制器溝通並動態調整顯示亮度,達到顯示器在HDR模式下播放SDR內容時,節省20%顯示器亮度耗電的效果。

此外Intel也在現場展示多款AI應用程式,在與Adobe Premiere影片編輯軟體的整合功能中,能夠透過AI自動將匯入的影片、照片標註標籤,隨後使用者就可以透過文字搜尋的方式快速找到這些素材,另一方面也新增AI調色功能,能夠自動最佳化色彩呈現並在整部影片唯持一致性。

在與elgato提詞機的合作中,系統會使用神經處理器(NPU)偵測使用者讀稿的進度,並自動捲動提詞機的文字,如此一來不但不需手動操作翻頁,還不會占用中央處理器(CPU)或繪圖處理器(GPU),能夠確保使用該功能時不影響遊戲效能。

Smart Power HDR功能透過動態調整顯示亮度,達到顯示器在HDR模式下播放SDR內容時,節省20%顯示器亮度耗電的效果。SDR顯示模式之面板耗電為1.183 W,HDR顯示則為1.376 W。開啟Smart Power HDR功能可降至1.2 W。

Adobe Premiere影片編輯軟體會透過AI為匯入影片、照片標註標籤,隨後使用者就可以透過文字搜尋的方式快速找到這些素材。

AI調色功能,能夠自動最佳化色彩呈現並在整部影片唯持一致性。

elgato提詞機將AI運算交給NPU處理,不會占CPU與GPU的運算資源,因此不會影響遊戲效能。

系統會偵測使用者讀稿的進度,並自動捲動提詞機的文字,讓直播主可以專心讀稿與操作遊戲。

筆這也將在下篇文章中介紹將Panther Lake處理器應用於邊緣運算的動態展示,Intel也宣佈將推出寬溫版Panther Lake處理器,並展示單板電腦樣品,請讀者參考全文目錄繼續閱讀。

回到系列全文目錄

加入T客邦Facebook粉絲團
✇T客邦-Techbang

Intel Panther Lake強化電源管理,給予內建顯示晶片更多電力以提升遊戲效能

Intel說明Panther Lake處理器改進電源管理機制,透過第3代智慧型偏差控制在遊戲進行過程為內建顯示晶片提供更多電力,以舒解效能瓶頸。70ee1e22cb90e188c2e846442767b83b

Intel說明Panther Lake處理器改進電源管理機制,透過第3代智慧型偏差控制在遊戲進行過程為內建顯示晶片提供更多電力,以舒解效能瓶頸,另一方面也提供預先編譯渲染器,縮短玩家第一次執行遊戲的等戴時間。

強化電源管理壓榨遊戲效能

Panther Lake處理器的一大特色就是最高具有12組Xe 3顯示核心的組態,在內建顯示晶片的等級中,能夠帶來相對可觀的繪圖效能,對於遊戲應用來說相當重要。然而在筆記型電腦的電池續航力以及散熱能力有限的前提下,要如何分配處理器與內建顯示晶片的電力預算,就是門大學問。

延伸閱讀:
Intel Arc B580效能實測,中堅價位新卡搶先報到
Intel Arc B570顯示卡效能實測:多省一點的甜蜜價格卡
【COMPUTEX 2025】Intel發表Arc Pro B系列運算卡,還有雙GPU魔改卡與Battlematrix工作站

Intel針對Panther Lake設計了第3代智慧型偏差控制(Intelligent Bias Control v3)電源管理功能,會優先將處理器負載放置於E-Core,並透過韌體判斷遊戲對於處理器或內建顯示晶片的需求較高,進而動態調整電力供應的比重以及彼此的時脈。

這樣的好處是能夠透過較省電的E-Core降低處理器功耗並,騰出更多電力預算給內建顯示晶片,以提高內建顯示晶片的效能輸出,並舒緩因顯示效能瓶頸(GPU Bond)的狀況,達到提高整體遊戲效能表現的功效。

先前的電源管理功能對於遊戲、應用程式的感知程度較低,雖然已經能夠改善遊戲效能,但是往往將較多電力預算給予處理器(圖表中藍色),內建顯示晶片(紫色)僅能使用較少電力,因此運作時脈受到限制。

先前的電源管理功能已經能改善遊戲的平均FPS以及99百分位(1% Low)之FPS。

Panther Lake導入第3代智慧型偏差控制電源管理功能。由於Darkmont架構的E-Core效能有顯著改善,所以在工作排程時優先將負載交給E-Core。

第3代智慧型偏差控制電源管理功能(右)會將更多電力預算交給內建顯示晶片,達到提升遊戲效能的效果。

縮短遊戲等待時間

Intel也透過預先編譯渲染器(Precompiled Shader Distribution)功能改善玩家的遊戲體驗。考慮到現在有許多遊戲需在第一次執行的時候進行渲染器編譯工作,由於內建顯示晶片的效能比較低落,將會導致玩家需要等待相當長的編譯時間,造成掃興的不良感受。

此功能則是由Intel預先進行編譯工作,透過Intel Graphic Software驅動程式自動偵測支援的遊戲,並直接下載編譯完成的渲染器檔案,加速遊戲啟動流程,將低玩家苦苦等待的不良感受。

目前Intel尚在研擬如何傳遞最佳使用者體驗,衡量是在驅動程式偵測到遊戲支援此功能就先行下載渲染器檔案,或是等真正執行時才下載,詳細情況以及支援的遊戲陣容有待日後公布。

預先編譯渲染器可以透過顯示驅動程式直接從雲端下載編譯完成的渲染器檔案,消除第一次執行遊戲時編譯渲染器的等待時間。

上述功能皆預計隨Panther Lake的上市一併推出,能夠提升遊戲的流暢度與開啟的等待時間,以改善玩家的遊戲體驗。更多Panther Lake詳細解說請參考2025年度Intel Tech Tour.us活動系列報導

回到系列全文目錄

加入T客邦Facebook粉絲團
✇T客邦-Techbang

Intel Panther Lake處理器NPU詳解,效能小幅提升、尺寸驟降40%

Intel在2025年度Tech Tour.us活動中詳細說明Panther Lake處理器的架構,在看完內建顯示晶片後,我們接著深入瞭解全新的NPU 5神經處理器。Cc90af02ff14af2c7dbb75396f99b313

Intel在2025年度Tech Tour.us活動中詳細說明Panther Lake處理器的架構,在看完內建顯示晶片後,我們接著深入瞭解全新的NPU 5神經處理器。

NPU 5節省晶片空間

Lunar Lake所搭載的Intel NPU 4神經處理器具有6組神經運算引擎,能夠提供48 TOPS的AI運算效能。而Panther Lake搭載的Intel NPU 5神經處理器雖然效能僅微幅提升至50 TOPS,但大幅縮減40%占用晶片面積。

延伸閱讀:
Computex 2024:Intel於Technology Tour Taiwan發表Lunar Lake處理器,帶來1.5倍GPU、3倍NPU效能
Intel AI Playground動手玩:在本機套用第三方SDXL模型生成圖像、使用AI聊天機器人
AMD Tech Day 2024(三):XDNA 2 AI運算架構解析,Block FP16資料類型運算效率倍增

另一方面,NPU 5也原生支援INT8與FP8資料類型,能在犧牲些微精確度的代價之下,提高1倍運算吞吐量,並且降低一半單位運算量的功耗,同時節省記憶體使用量。

NPU 5最大的改變之處在於將真正在進行運算工作的MAC矩陣(Multiply Accumulate,乘積累加運算)放大至前代2倍,並將神經運算引擎數量由6組縮減至3組,能夠在提供相近效能輸出的前提下,節省前、後端管線在整體運算單元中所占用的空間,在加上製程精進的紅利,達到縮減40%占用晶片面積的效果。

回顧應用Lunar Lake的NPU 4,能夠提供48 TOPS的AI運算效能。

Panther Lake整合之NPU 5則著重於提高面積效率,並對最新的工作負載進行最佳化。

簡單地說NPU 5前代之MAC矩陣放大2倍,在單一神經運算引擎中塞入更多運算單元。

原本NPU 4需要6組神經運算引擎才達到的MAC數量,NPU 5使用3組神經運算引擎就達到,有助於縮小整體面積。

NPU 5總共具有12,000組MAC,並共用4.5 MB之草稿記憶體(Scratchpad RAM),以及256 KB L2快取記憶體。

NPU 5的面積效率較NPU 4提高40%,也就是說在相同效能下能降低40%晶片面積。

NPU 5的MAC矩陣每時脈週期能進行2, 048次FP16資料類型運算,或是4,096次FP8、INT8資料類型運算。

FP8資料類型也支援較精準的BF8(E4M3,4指數Exponent,3尾數Mantissa),或是範圍較廣的HF8(E5M2)等格式。較FP16能夠節省記憶體傳輸量,並提高2倍吞吐量,最多節省2倍電力,且犧牲的精準度相當有限。

在Stable Diffusion圖像生成測試中,FP8資料類型能較FP16在同效能前提節省50%電力。

神經運算引擎內的資料轉換器支援FP32、FP16、BF16、FP8、INT8、INT4等格式轉換。

激勵函數(Activation Function)功能可以精準支援線性函數,並透過查找表支援更廣汎的非線性函數。

與NPU 4相比,NPU 5在住同資料類型與運算項目的表現最高提升2.5倍。FP8與FP16對比則是效能提升1.9倍。

全機AI運算效能高達180 TOPS 

Panther Lake整體具有下列3種運算單元能夠進行AI運算

  1. 中央處理器(CPU):最高10 TOPS AI運算效能。適合輕量且需要低延遲的AI工作負載。
  2. 繪圖處理器(GPU):最高120 TOPS AI運算效能。適合遊戲或創作生程式AI,但是耗電量比較高。
  3. 神經處理器(NPU):最高50 TOPS AI運算效能。具有較加的電力效率,適合需要長時間、背景運作的AI助理類型應用。

獨立軟體開發商(ISV)能夠針對AI應用程式的特性,並考慮使用情境、多工狀態與電力消耗等條件,在OneAPI應用程式介面的協助下,在開發程式階段決定將AI運算負載分配到1個或多個運算單元,充分壓榨效能並兼顧電力消耗。

筆者認為此舉是設計過程中,將NPU的運算效能控制在符合Microsoft Copilot+ PC系統需求,以提供理想的AI應用程式使用體驗,同時控制處理器的生產成本,是權衡性價比之後做取的取捨。若特定程式的負載更吃重,則可借助AI運算效能最高達到120 TOPS的Panther Lake 12 Xe GPU內建顯示晶片,加速完成工作的時間。

NPU 5具有50 TOPS之AI運算效能,符合Microsoft Copilot+ PC之系統需求。雖然效能較NPU 4雖然沒有顯著提升,但是原生支援FP8資料類型,且面積效率大幅提升40%。

Panther Lake的CPU、GPU、NPU等3種運算單元能夠提供最高總合180 TOPS的平台 AI運算效能。

Panther Lake也將支援最新的XeSS 2多重畫格生成,最多能開啟4X畫格生成設定以大幅提升遊戲的FPS效能,此外Xe 3顯示架構也有其他改善遊戲體驗的新功能,筆者將於另一篇文章詳細介紹,請讀者參考全文目錄繼續閱讀。

回到系列全文目錄

加入T客邦Facebook粉絲團
✇T客邦-Techbang

Intel Panther Lake處理器GPU詳解,12組Xe 3核心帶來50%效能成長

Panther Lake處理器的Xe 3顯示架構內建顯示晶片與NPU 5神經處理器,帶來更出色的顯示、AI效能,以及高達180 TOPS的全機AI運算效能,筆者將在本文先介紹內建顯示晶片。Ab412e8fb757ad001626bd24c9da00c0

Intel在2025年度Tech Tour.us活動中詳細說明Panther Lake處理器的Xe 3顯示架構內建顯示晶片與NPU 5神經處理器,帶來更出色的顯示、AI效能,以及高達180 TOPS的全機AI運算效能,筆者將在本文先介紹內建顯示晶片。

全新Xe 3架構,維持「B」系列命名

回顧2024年推出的Lunar Lake與Arrow Lake處理器分別採用Xe 2與Xe顯示架構,Panther Lake處理器的內建顯示晶片則採用最新Xe 3顯示架構,並依處理器型號不同提供4核心或12核心配置選擇,能夠帶來超過50%的效能成長。不過比較特別的是它仍然被歸類於「B」系列的Battlemage產品線,未來可能應用於獨立顯示卡的Xe 3P顯示架構才會推進至「C」系列的Celestial產品線。

延伸閱讀:
Intel正式宣布高效能顯示卡品牌「Intel Arc」,2022年第一季推出
【COMPUTEX 2025】Intel發表Arc Pro B系列運算卡,還有雙GPU魔改卡與Battlematrix工作站

相較於Xe 2顯示架構的Render Slice統一由4組Xe核心組成,Xe 3顯示架構則有2或6組Xe核心的組態。

Panther Lake 4 Xe GPU具有2組由2組Xe核心組成的Render Slice,採用Intel 3製程節點。而Panther Lake 12 Xe GPU具有2組由6組Xe核心組成的Render Slice,但採用tsmc(台積電)N3E製程節點。

上述2種內建顯示晶片除了Xe核心數量差異之外,L2快取記憶體、後端管線等配置也有所不同,提供晶片設計的可擴充彈性,也為未來可能的獨立顯示卡鋪路。詳細情參考下列圖文說明。

Panther Lake將繪圖處理器(GPU,紫色)放置於獨立的繪圖處理器模塊,而神經處理器(NPU,淺藍色)則整合於運算模塊之內。

Xe 3架構的內建顯示晶片仍歸類於「B」系列的Battlemage產品線,未來推出的Xe 3P架構(可能應用於獨立顯示卡)才會推進至「C」系列的Celestial產品線。。

Xe 3顯示架構比起Xe 2有著更高的架構可擴充性,以及最佳化的效能表現。

回顧Xe 2顯示架構,Render Slice由4組Xe核心組成。

Xe 2顯示架構的一帶特色就是導入XMX引擎以提升AI運算效能。

Xe 3顯示架構之2種不同的Panther Lake內建顯示晶片具有不同架構配置。

Panther Lake 12 Xe GPU(左)與Panther Lake 4 Xe GPU(右)的裸晶此外從肉眼就可看出明顯差異。

Panther Lake 4 Xe GPU具有2組由2組Xe核心組成的Render Slice,搭載4 MB L2快取記憶體與2組像素後端管線,並且採用Intel 3製程節點。

Panther Lake 12 Xe GPU具有2組由6組Xe核心組成的Render Slice,搭載16 MB L2快取記憶體與4組像素後端管線,採用tsmc N3E製程節點。

內建顯示晶片效能提升50%

Xe 3架構的每組Xe核心具有8組512 bit向量引擎,以及8組2048 bit XMX(Xe Matrix Extension,Xe矩陣延伸指令集)引擎,搭配256 KB L1快取記憶體,並強化光線追蹤單元的運算效能。

受益於XMX引擎的矩陣運算功能,Xe 3架構也能加速AI應用程式的執行,考慮到Panther Lake 12 Xe GPU具有120 TOPS的AI運算效能,加上最高能夠支援容量達96 GB的記憶體LPDDR5-9600,讓它能與AMD Ryzen AI Max+ 395處理器相提並論(全平台126 TOPS AI運算效能)。

另一方面Intel也與Microsoft合作推出以DirectX 12為基礎的Cooperative Vetcor(協同向量)功能,能夠透過GPU渲染器加速矩陣運算,以達到提升AI應用程式效能的效果。

Panther Lake 12 Xe GPU的繪圖效能較Lunar Lake提升最多50%,而與Arrow Lake相比,在相同效能表現下功耗降低40%。至於AI運算部分,Panther Lake 12 Xe GPU能夠提供120 TOPS的INT8 / FP8資料類型AI運算效能,適合應用於如AI圖像生成等間歇、高強度的AI應用程式。

與8 MB容量相比,16 MB的L2快取記憶體能夠節省最多36% SoC互連的資料流量,有助於提升遊戲效能並節省電力消耗。

Xe 3顯示架構的各引擎以及Render Slice皆有所改進,以強化效能並提高利用效率。

Xe 3架構的每組Xe核心具有8組512 bit向量引擎,以及8組2048 bit XMX引擎,L1快取記憶體擴大至256 KB。

向量引擎利用效率最多增加25%執行緒吞吐量,並支援FP8資料類型逆量化(Dequantization)。

XMX引擎支援TF32(TensorFloat 32)、FP16、BF16、INT8、INT4、INT2等資料類型,並提供最高每時脈週期8,192次運算。FP32在反量化後具有每時脈週期2,048次運算效能。

光線追蹤單元的動態光線管理支援非同步光線追蹤運算(Async Ray Tracing)。

GFX功能部分,帶來2倍的各向異性過濾(Anisotropic Filtering,AF)與模板測試(Stencil Test Rate)效能。

與Xe 2架構相比,Xe 3架構在繪圖的各階段有不同的效能改善,以提升整體效能輸出。

Panther Lake的內建顯示效能可較Lunar Lake提升超過50%。

與行動版Arrow Lake相比,Panther Lake內建顯示的電力效率改善超過40%。

Cooperative Vetcor(協同向量),能夠透過GPU渲染器加速矩陣運算,以達到提升AI應用程式效能的效果。

Panther Lake的內建顯示晶片之效能與電力效率皆有大幅改善,Xe媒體引擎新增支援10 bit深度色彩取樣的AVC(H.264)與AV1,以及SONY XAVC-H/ HS / S等影片格式編、解碼硬體加速。

Panther Lake也將支援最新的XeSS 2多重畫格生成,最多能開啟4X畫格生成設定以大幅提升遊戲的FPS效能,此外Xe 3顯示架構也有其他改善遊戲體驗的新功能,筆者將於另一篇文章詳細介紹,請讀者參考全文目錄繼續閱讀。

回到系列全文目錄

加入T客邦Facebook粉絲團
✇T客邦-Techbang

Intel Panther Lake處理器架構解析,3種衍生型號最多可選16核搭12組Xe 3核心

Intel在2025年度Tech Tour.us活動上說明代號為Panther Lake的行動版處理器架構細節,它除了具有Cougar Cove與Darkmont等核心,還整合了多項最新技術。A62fba7dfc9ab3c9e424afb156282e1a

Intel在2025年度Tech Tour.us活動上說明代號為Panther Lake的行動版處理器架構細節,它除了具有Cougar Cove與Darkmont等核心,還整合了多項最新技術。

多種組態共用封裝

Panther Lake是Intel下一代行動版處理器的代號,它的設計理念為可擴展性,希望能夠兼顧有如Lunar Lake般驚奇的電池續航力,並提供優於Arrow Lake的效能表現,並透過高度彈性的核心組態,滿足高、中、低階等全面市場需求。

延伸閱讀:
Computex 2024:Intel於Technology Tour Taiwan發表Lunar Lake處理器,帶來1.5倍GPU、3倍NPU效能
Intel Lunar Lake效能實測: Asus Zenbook S 14效能微漲,AI、續航力翻倍!
CES2025:Intel發表Arrow Lake HX、H、U系列Core Ultra 200行動版處理器,Lunar Lake更新vPro功能,還有18A製程One More Thing!
MSI Titan 18 HX AI效能實測,Core Ultra 9 285HX+ RTX 5090 Laptop旗艦組合

Panther Lake的SoC(System on Chip,系統單晶片)由下列3種模塊構成:

  • 運算模塊(Compute Tile):內部包含P-Core、E-Core之效能模組與低功耗LP E-Core之效率模組,以及記憶體控制器、NPU、Xe媒體引擎等元件。採用Intel 18A製程節點
  • 繪圖處理器模塊(GPU Tile):內建顯示晶片。4核心版本採用Intel 3製程節點,12核心版本採用tsmc N3E製程節點
  • 平台控制模塊(Platform Control Tile):負責各類I/O功能。採用tsmc N6製程節點

,所有模塊透過Foveros 2.5D技術封裝為單一晶片,並透過第2代Scalable Fabric連接運算模塊與繪圖處理器模塊。

不同於Arrow Lake將LP E-Core與記憶體控制器放置於SoC模塊而與運算模塊分隔兩地,Panther Lake的記憶體控制器以及所有的P-Core、E-Core、LP E-Core都一律放置運算模塊,對於各核心之間的資料交換與記憶體存取延遲有極大的幫助。

Panther Lake也捨棄Lunar Lake將記憶體封裝於處理器的Memory on Package設計,並增設容量為8 MB的記憶體側快取(Memory Side Cache),除了可在快取命中時降低存取延遲,也可節省存取記憶體的電力消耗。容量部分最高支援128 GB DDR5-7200或96 GB LPDDR5-9600等記憶體,給予筆記型電腦廠商更大的選擇彈性以設計差異化的產品。

比較特別的是,Panther Lake不但支援On-Board設計的LPDDR5記憶體,也支援LPCAMM模組,提供On-Board形式以外的選擇。

在核心配置方面,Panther Lake提供8核心、16核心、16核心12Xe等3種選擇,且都採用相同的封裝與腳位。對於筆記型電腦廠商而言,有利於在不同型號的處理器之間共用主機板與散熱器的設計,對於物料與成本控管有較大的優勢。

上述3種配置都搭配NPU 5神經處理器,最高能提供處理器10 TOPS、繪圖處理器120 TOPS、神經處理器50 TOPS,全機共180 TOPS的AI運算效能。

Panther Lake的設計目標相當有野心,希望能夠兼顧有如Lunar Lake般驚奇的電池續航力,並提供優於Arrow Lake的效能表現。

Panther Lake提供更具彈性的處理器核心與記憶體配置,獨立的繪圖處理器模塊也有助於彈性配置不同Xe核心數的內建顯示晶片。

Panther Lake由運算模塊(Compute Tile)、繪圖處理器模塊(GPU Tile)、平台控制模塊(Platform Control Tile)構成,並透過Foveros 2.5D技術封裝為SoC(System on Chip,系統單晶片)。

運算模塊、繪圖處理器模塊透過第2代Scalable Fabric互相連接。

Panther Lake支援128 GB DDR5-7200或96 GB LPDDR5-9600等記憶體,不像Lunar Lake被Memory on Package設計綁死,給予筆記型電腦廠商更多選擇規格、物料的彈性。

LPDDR5除了有焊死在主機板上的On-Board,也提供LPCAMM2型式模組,讓升級與維修有更大彈性。

Panther Lake提供8核心、16核心、16核心12Xe等3種選擇,並都採用相同的封裝與腳位。

16核心12Xe(左)、8核心(右)等配置的裸晶尺寸相差甚大,肉眼就能輕易看出區別。

8核心版本為4組P-Core搭配4組低功耗LP E-Core,支援DDR5-6400或LPDDR5-6800等記憶體,提供PCIe Gen 4x8(連接獨立顯示卡)與 PCIe Gen 5x4(連接固態硬碟),並搭載4組Xe 3架構核心的內建顯示晶片與NPU5神經處理器。

16核心版本為4組P-Core、8組E-Core、4組低功耗LP E-Core,支援DDR5-7200或LPDDR5-8533等記憶體,PCIe部分改為PCIe Gen 4x8(連接獨立顯示卡)搭配 PCIe Gen 5x12(可切分後連接3組固態硬碟)。同樣搭載4組Xe 3架構核心的內建顯示晶片與NPU5神經處理器。

16核心12Xe核心版本同為4組P-Core、8組E-Core、4組低功耗LP E-Core,最高支援LPDDR5-9600等記憶體,並具有8 MB記憶體側快取,但不支援DDR5。PCIe部分為PCIe Gen 4x8與 PCIe Gen 5x4。搭載12組Xe 3架構核心的內建顯示晶片,具有最強的繪圖、遊戲、AI效能,神經處理器則同為NPU5。

3種Panther Lake配置對照表,8核心可視為基本款,16核心適合搭配獨立顯示晶片,16核心12Xe則具有最強的內建顯示效能。

Panther Lake平台組成說明

深入分析Panther Lake的運算模塊,P-Core採用Cougar Cove核心,具有256 KB L1快取記憶體與3 MB L2快取記憶體。E-Core採用Darkmont核心,具有96 KB L1快取記憶體,4組E-Core組成的叢集共用4 MB L2快取記憶體,所有P-Core與E-Core將共享最高18 MB L3快取記憶體。上述所元件組成效能模組。

低功耗LP E-Core同樣採用Darkmont核心,但是不具有L3快取記憶體,4組LP E-Core組成效率模組。

當處於閒置或低負載狀態時,系統能夠關閉效能模組以及所有P-Core與E-Core,僅保留效率模組運作,將所有運算負載交給低功耗LP E-Core,以節省電力消耗。

Panther Lake的各種類核心都不支援Hyper-Threading多執行緒功能。Intel表示從Meteor Lake開始,就為了追求在P-Core最高的單執行緒效能的同時降低電力消耗,並透過E-Core補足多工效能,取得更理想的單執行緒效能、多工效能、功耗平衡。

在內建顯示部分,Panther Lake則採用Xe 3架構,最多提供12組Xe核心選擇。神經處理器則搭載第5代NPU 5。

關於Cougar Cove、Darkmont、Xe 3、NPU 5等細節,筆者將另於專文解析。

在Xe媒體引擎部分,新增支援10 bit深度色彩取樣的AVC(H.264)與AV1,以及SONY XAVC-H / HS / S等影片格式編、解碼硬體加速,並維持VP9、HEVC(H.265)等格式編、解碼,以及VVC(H.266)解碼硬體加速。

在I/O與無線通訊部分,Panther Lake支援8組USB 2.0、2組USB 3.2 Gen2、4組Thunderbolt 4等端子,以及Wi-Fi 7 R2、藍牙6.0等功能,並可透過外掛晶片的方式支援Thunderbolt 5端子。

比較特別的是Intel強調Panther Lake搭載IPU 7.5影像處理器,能夠同時連接3組MIPI介面攝影機或Webcam,並支援紅外線攝影機(能夠應用於人臉等生物特徵辨識),具有1,600萬像素與120 FPS處理能力,並整合AI降噪、色溫調整、單幀逐行高動態範圍(Staggered HDR)等功能,除了有助於大幅提升視訊會議的畫質與視覺體驗,也能在自駕車、安全監控、自動化工業等需要電腦視覺(Computer Vision)的領域發揮所長,可以看出Intel規劃將Panther Lake應用於邊緣AI運算的策略。

Panther Lake的P-Core採用Cougar Cove核心,E-Core則採用Darkmont核心,2者都採用Intel 18A製程節點。

Panther Lake的P-Core與E-Core共享最高18 MB L3快取記憶體,LP E-Core則無L3快取記憶體。

Panther Lake的內建顯示晶片最多搭載12組Xe 3架構Xe核心,並搭配16 MB L2快取記憶體。

全新NPU 5能夠提供50 TOPS的INT8、FP8資料類型AI運算效能,滿足Microsoft Copilot+系統需求。

Xe媒體引擎新增支援10 bit深度色彩取樣的AVC(H.264)與AV1,以及SONY XAVC-H/ HS / S等影片格式編、解碼硬體加速。

Panther Lake也在無線通訊方面下足功夫,提供混合工作、遊戲、多人同時使用藍牙耳機、邊緣裝置連線等使用體驗。

Panther Lake支援Wi-Fi 7 R2、藍牙6.0、低功耗藍牙等無線通訊功能。

無線網路支援Wi-Fi 7 R2規範,支援6 GHz頻段以及高達320 MHz的通訊頻段寬度。

在藍牙耳機功能部分,最大的亮點就是支援廣播,能讓多位使用者同時使用藍牙耳機聆聽音樂。

Panther Lake也提供Intel Killer網路功能,並支援雙向QoS以及能偵測AI資料的AI-Aware QoS等流量管理功能。

IPU 7.5影像處理器能夠同時連接3組MIPI介面攝影機或Webcam,支援AI降噪、色溫調整、單幀逐行高動態範圍(Staggered HDR)等功能,運作功耗低至1.5 W。

武漢肺炎疫情改變眾人的生活與工作型態,也讓視訊聊天與會議功能的普及率明顯提升。

自駕車、安全監控、自動化工業等邊緣AI運算的應用也仰賴清晰的攝影畫面。

IPU 7.5內部的影像處理器(Image Signal Processor)提供自動曝光、自動白平衡、自動對焦、訊號處理、降噪、調色等功能。

左方為攝影機拍攝的原始訊號,右方為經過IPU 7.5處理並最佳化的畫面,可以看到落差相當顯著。

總結來說,Panther Lake的單、多執行緒效能分別較Lunar Lake提高10%、50%,內建顯示效能也提升50%以上。SoC功耗較Lunar Lake節省10%,比Arrow Lake節省40%,可以期待筆記型電腦的實際續航力表現。

Panther Lake提供最高16組處理器核心、12組內建顯示Xe核心的組態,並支援DDR5以及LPDDR5記憶體。

由於Panther Lake的處理器核心、內建顯示核心、Threaded Director資源管理、電力管理等環節都有許多變動,所以筆者將於後文詳細說明,請讀者參考全文目錄繼續閱讀。

回到系列全文目錄

加入T客邦Facebook粉絲團
❌