阅读疯子

阅读视图

发现新文章,点击刷新页面。

Jetson Orin Nano Super開發套件動手玩,單板電腦也能跑AI聊天機器人

NVIDIA先前推出AI運算效能大幅提升的Jetson Orin Nano Super開發套件,強調能將AI應用程式導入邊緣運算的能力,我們就來動手架設AI聊天機器人。5b792298c586e1b75cb03bd844613c58

NVIDIA先前推出AI運算效能大幅提升的Jetson Orin Nano Super開發套件,強調能將AI應用程式導入邊緣運算的能力,我們就來動手架設AI聊天機器人。

升級Super版解放20 W TDP

NVIDIA在2024年聖誕節前夕推出Jetson Orin Nano Super開發套件,除了將價格砍半之外,規格部分將原本TDP上限的15 W提高至20 W,處理器(CPU)、繪圖處理器(GPU)的時脈分別由1.5 GHz、625 MHz提高至1.7 GHz、1020 MHz,記憶體頻寬也由68 GB/s提高至102 GB/s,讓系統最高AI運算能力由原本的40 TOPS提高至67 TOPS,成長幅度超過50%。

延伸閱讀:
NVIDIA推出加強版的Jetson Orin Nano Super:性能達 67 TOPS,價格約台幣8200元
Jetson Orin Nano開發套件動手玩(一):規格介紹與開箱
Jetson Orin Nano開發套件動手玩(二):效能實測

根據NVIDIA官方提供的資料,「Super版」Jetson Orin Nano Super開發套件在多款AI模型推論運算的效能表現,比原始版本高出28% ~ 104%不等,雖然TDP有所提升,但20 W的功耗仍相當低,適合應用於小型邊緣運算裝置,並在這些裝置本機執行AI應用程式,能夠賦予智慧音箱、機器人、自走車等裝置更多元的AI功能。

如果讀者手上有原始版本Jetson Orin Nano開發套件,則可參考NVIDIA官方網站的說明,安裝JetPack 6.1作業系統並透過指令開啟「MAXN電源模式」,解放20 W TDP並獲得更高的效能。

相關連結:Jetson Orin Nano開發套件升級為「Super版」之官方說明

Jetson Orin Nano Super開發套件基本上與先前推出的原始版本硬體相同,原始版本也可以透過軟體、韌體更新升級至「Super版」。

原始版與「Super版」(右)Jetson Orin Nano開發套件之規格對照。

「Super版」在執行大型語言模型AI推論運算的效能為原始版本的1.28~1.63倍

執行視覺語言模型AI推論運算的效能則達1.36~2.04倍。

執行視覺變換模型(Vision Transformer)AI推論運算的效能則達1.43~1.69倍。

▲youjiang yu YouTube頻道所進行的大型語言模型AI推論運算展示,可以看到不同TDP設定下,生成文字的速度差異。

實戰聊天機器人

筆者這次收到的測試樣品為「Super版」Jetson Orin Nano Super開發套件,透過OllamaOpen-webui執行Llama 3.2B大型語言模型,並搭配我自己寫的文章作為RAG(Retrieval Augmented Generation,檢索增強生成)之參考之資料。

RAG的好處在於能夠快速客製化聊天機器人的「大腦」,而不需要花費大量運算效能與時間重新訓練大型語言模型。使用者只需將參考資料、文件等檔案輸入RAG資料庫,就能讓模型在AI推論運算過程中參閱,並利用這些資料做出更準確的回應,適合將最新的資訊或企業、專屬應用情境的補充資料導入聊天機器人,而不需在使用過程中仰賴雲端服務,對邊緣裝置來說相當重要。

從下方的展示也可以看出,Jetson Orin Nano Super開發套件能在消費20 W電力的情況下,提供流暢的聊天機器人體驗,很適合應用於小型裝置的開發。開發者可以先利用開發套件打造試作機,並在實際製作正式版本或量產時改為使用Orin Nano Super或Orin NX Super等運算模組(SoM),以利縮小裝置的尺寸。

在開始之前,先確認已切換至TDP為20 W的「MAXN電源模式」。

Ollama搭配Open-webui能夠在Jetson Orin Nano Super開發套件架設AI聊天機器人,並透過網頁介面輕鬆操作。

我們可以直接在Open-webui介面中下載Llama 3.2B大型語言模型。

如果詢問比較舊的問題,而大型語言模型的訓練資料有包含相關資訊,它就能做出回應。

▲透過影片看到Llama 3.2B的運作相當流暢,但……也不是所有問題都能答對。

接下來看到在沒有使用RAG的情況下,詢問Llama 3.2B所得到的回應就會是訓練當時比較舊的資訊。

筆者透過RAG功能將最新的資訊導入Ollama的資料庫。

並在執行環境將模型設定為Llama 3.2B加上PCADV資料庫。

如此一來就能將最新資訊快速整合至既有模型,並提高回答的準確度。

Jetson Orin Nano開發套件原本就有不錯的「繪圖效能」,在「Super版」解放系統TDP限制之後,GPU的時脈也獲得顯著提升,這也意味著……,它執行遊戲的能力也跟著獲得改善,讓人不禁想要試試它的潛力如何。

筆者預計會找時間試試在Jetson Orin Nano Super開發套件上跑些有趣的程式,如果有進展的話,日後再來與各位讀者分享成果。

加入T客邦Facebook粉絲團

MD版月下夜想曲2024聖誕節展示ROM來了,這次居然只是「小禮」

跟過往幾年一樣,開發者Pigsy又在聖誕節發布最新的展示ROM檔案,雖然內容相當陽春,但他預告將在2025年農曆新年推出「大禮」D399814bd4ce5227961b6b7f4315acc5

跟過往幾年一樣,開發者Pigsy又在聖誕節發布最新的展示ROM檔案,雖然內容相當陽春,但他預告將在2025年農曆新年推出「大禮」

這次僅有畫面展示

Pigsy在最新的Mega Drive版月下夜想曲開發日誌影片中,分享了開發近度與未來工作規劃,並提供2個ROM供玩家嘗鮮,並預告將在2025年農曆新年期間提供包含最新進度的可遊玩體驗版遊戲。

延伸閱讀:
MD版月下夜想曲夏季更新:新增寬螢幕模式,人物、關卡選擇畫面曝光
MD版月下夜想曲系列文章
惡魔城經典回顧系列文章

Pigsy這次提供的ROM內容為將原本以Famicom為平台的《惡魔城傳說》移植至Mega Drive主機,以及將部分Game Boy Advance平台的《惡魔城 曉月圓舞曲》內容加入Mega Drive版月下夜想的進度。

這2個ROM都只具有圖像展示的功能,啟動遊戲後可以選擇4:3或16:9的顯示比例,然後選擇角色、關卡後,玩家可以操作角色在舞台間走動,並按下Start鍵進入下個區域。

▲Pigsy透過開發日誌影片分享開發近度與未來工作規劃,讀者可以至影片的說明下載展示版ROM。

▲Pigsy也在先前的開發日誌影片中提到將Game Boy Advance平台的《惡魔城 曉月圓舞曲》內容整合至Mega Drive版月下夜想曲。

Mega Drive版月下夜想曲帶來了新的標題圖片。

▲Mega Drive版月下夜想曲可以使用來自《惡魔城 曉月圓舞曲》的主角來須蒼真,玩家可以自由在舞台間走動,並按下Start鍵進入下個區域。

▲Mega Drive版惡魔城傳說則讓玩家操作主角拉爾夫。

Pigsy除了預告將在2025年農曆新年推出內容更豐富的展示版ROM,未來也會更頻繁更新可遊玩的展示版,並收集玩家回饋建議,以提升遊戲品質。

加入T客邦Facebook粉絲團

Linamp 音樂播放器 DIY 套件開箱!經典 Winamp 介面神還原:零件採購與組裝

筆者先前寫了介紹Linamp的文章後,最終也是忍不住手滑買了DIY套件,自己做出這款介面相當銷魂的音樂播放器9cb422ed861fae8157671b14c78ba004

筆者先前寫了介紹Linamp的文章後,最終也是忍不住手滑買了DIY套件,自己做出這款介面相當銷魂的音樂播放器

購買「數位版」Linamp

「掃雷組」是先前紙本電腦王雜誌就存在的專欄,內容為編輯們自己購買3C產品的心得,現在轉為不定期的方式出刊,這次的目標為筆者先前介紹的Linamp音樂播放器

延伸閱讀:
Linamp專案將經典Winamp播放軟體實體化,「數位版」DIY套件搶先開跑
掃雷組Linamp音樂播放器動手玩(上):零件採購與組裝(本文)
掃雷組Linamp音樂播放器動手玩(下):安裝軟體與音樂播放(工作中)

與一般產品不同的是,Linamp並非直接以播放器或套件的形式銷售,而是在購買後提供「教學講義電子檔」、3D列印圖檔,以及將作業系統、播放軟體打包好的磁碟映像檔,使用者可以參考講義購買所需的零件,然後跟著教學步驟組裝,最後將映像檔燒錄至microSD記憶卡,就可以開始使用。

需要注意的是,Linamp的軟體並不支援由Raspberry Pi的3.5mm耳機端子或HDMI端子輸出音訊,原作者建議搭配USB DAC(或USB音效卡)使用,經測試後也可使用Raspberry Pi GPIO HAT之的I2S端子輸出音訊。

考量到原本Linamp套件為收費商品,故系列文章便不透露筆者使用的零件相關資訊,僅著重於組裝與使用過程。

先上人權圖,就怪自己腦波弱,寫一寫文章就被自己勸敗跑去買了Linamp套件。

Linamp的DIY套件並沒有任何實體物品,內容為教學講義電子檔、3D列印圖檔、相關軟體磁碟映像檔。

講義以圖文方式詳細說明購買零件與DIY製作的教學。

此外部分章節也輔以影片說明動手實作的流程。

自行購買實體零件與組裝

由於筆者沒有3D印表機,在商請神人朋友幫我列印前面板的時候,他看了一下圖檔,說有個比原作者選用螢幕更好的替代方案,且螢幕價格也較為便宜,於是筆者就改用朋友建議的方案,並非參考講義進行採購。

另一方面,神人朋友也一時技癢,把原本前面板上緣文字、圖案全部為白色的設計,改為白色文字搭配黃色圖案,並使用多色3D印表機進行列印,讓整體更接近原始的Winamp播放軟體,提高外觀還原度。

筆者延用現有的Raspberry Pi 3與USB DAC,並額外購買開關線與電源端子轉向轉接頭,如此一來便能方便地透過實體按鍵開、關機,而不用透過螺絲起子短路Raspberry Pi GPIO腳針,也能將連接電源線的方向轉為向下,方便理線。

接下來筆者就以圖文說明方式簡單介紹組裝流程。

筆者請朋友幫忙列印Linamp前面板。替代的「淘寶牌觸控螢幕」為HDMI影音介面,並透過USB傳輸觸控訊號,支援Raspberry Pi 3與4,此外也購買杜邦端子開關線與Micro USB、USB Type-C電源端子的轉向轉接頭。

由於音樂播放器的運算資源需求較低,因此筆者使用Raspberry Pi 3,搭配螢幕付的HDMI、USB轉接板連接主機與螢幕。

透過上述2種轉接板連接Raspberry Pi 3與螢幕,就能達到影像與觸控訊號的傳輸。

把螢幕付的銅柱裝上,剛好可以當作支架使用。

接下來就是要將Linamp前面板裝到螢幕上。

結果悲劇了。因為前面板邊框的厚度讓支架無法接觸桌面。一開始筆者試著以雙面膠固定前面板與螢幕,但是因為接觸面積太小,所以無法黏的很牢靠。

接著就發揮「土砲戰隊」以及「生活智障王」的精神克服困難。想說前面板上有2個小孔,剛好把棉花棒插進去就可以固定螢幕,然後隨手捏2塊魔術黏土。噹啦!完美~~~~

從側面看,固定的效果相當理想,螢幕可以與前面板貼合,觸控操作時也相當穩固。

最後接上電源與轉彎頭,讓電線轉向機身下方。然後把開關線接好並利用銅柱固定,組裝工作就大功告成了。

雖然背面是透天厝的風格,但從正面看還是很漂亮啦,而且機身尺寸筆原始方案更短,擺在桌上比較不占空間。

筆者將在下篇文章中展示Linamp的操作過程,此外也會展示專為音樂播放設計的Volumio,以及透過超寬螢幕執行「那個東西」,請讀者參考上方延伸閱讀連結。

加入T客邦Facebook粉絲團

Intel發布Arrow Lake更新檔,修正Core Ultra 200S處理器30%效能損失問題

代號為Arrow Lake的Intel Core Ultra 200S系列處理器在推出時效能表現不如預期,而Intel也透過Windows Update更新檔來修正這些問題。Bd86ecdc72bd8dbe8c8b808b482f5be8

代號為Arrow Lake的Intel Core Ultra 200S系列處理器在推出時效能表現不如預期,而Intel也透過Windows Update更新檔來修正這些問題。

修正效能低落問題

Intel在官方部落格指出,許多不同媒體的Core Ultra 200S系列處理器效能測試結果落差甚大,且與內部測試不一致,於是團隊於2024年10月26日至11月8日間展開調查,並在4~6週期間分析成因與擬定修正計劃。

延伸閱讀:Intel Arrow Lake S效能實測:首波K版Core Ultra 9、7、5同場較勁

在調查之後,Intel表示可以將問題分為下列5大類,其中4類已經透過更新檔修正,並大幅改善效能。

  1. 缺少效能和電源管理套件(Performance & Power Management,PPM)
  2. APO(Application Performance Optimizer)最佳化無法生效
  3. 使用Easy Anti-Cheat防作弊服務造成當機
  4. BIOS / UEFI效能範本配置錯誤
  5. 新版BIOS / UEFI之效能最佳化

使用者可以更新至最新版本BIOS / UEFI,並將Windows 11更新至26100.2314版以上,就可以修正前4項的問題,第5項則需等待日後更新。

Intel也說明,PPM的功能為在Windows作業系統中調整處理器的時脈調節、核心暫停運作(Core Parking)、C-State省電模式等等,若PPM出了問題則會導致效能低落、虛耗電源等負面影響。

而Core Ultra 200S系列處理器則遇到核心資源調度異常、單執行緒效能異常、間歇性記憶體延遲異常等,估計造成6~30%的效能折損。

Core Ultra 200S系列處理器的5大問題現在已解決前4項,第5項預計在2025年1月修正。

APO為Raptor Lake Refresh(第14代Core i處理器)之新功能,能夠最佳化動態調配P-Core與E-Core資源。

Intel預告將在2025年1月CES 2025舉辦時推出最佳化BIOS / UEFI更新檔(即上述問題的第5項),但實際情況仍需依主機板廠商推出更新檔的時間為準。

加入T客邦Facebook粉絲團

Jetson Orin Nano開發套件動手玩(一):規格介紹與開箱

NVIDIA於GTC 2023春季場發表Jetson Orin Nano開發套件,提高入門級AI裝置的效能標竿,讓我們先看看它的規格分析。F5e6cc5c3a7831bb00c0f8c1e4d04f3e

NVIDIA於GTC 2023春季場發表Jetson Orin Nano開發套件,而昨天老黃不但推出加強版的Jetson Orin Nano Super價格還降價了,還提高入門級AI裝置的效能標竿。讓我們先看看先前的Jetson Orin Nano的規格分析。

入門級AI效能新基準

Jetson Orin Nano 8GB運算模組能在15W功耗模式下,提供40TOPS的INT8資料類型AI運算效能,相較於Jetson Xavier NX僅有21TOPS的效能高出1倍左右。而與Jetson Nano的INT16資料類型效能只有0.5TOPS相比,2者差距更為達到80倍之譜,此外Jetson Orin Nano 8的FP32資料類型CUDA核心效能也達到Jetson Nano的5倍,6組Arm Cortex-A78AE處理器核心也有近7倍處理器效能。

另一方面Jetson Orin Nano 8GB運算模組也能切換至7W功耗模式,帶來更具彈性的應用方式,。整體而言,Jetson Orin Nano最高能帶來50倍於Jetson Nano的電力效率。

受益於Jetson Orin Nano平台的效能提升,並可支援更多主流AI電腦視覺模型,開發者可以利用Jetson Orin Nano開發套件打造功能更多元的入門級AI機器人、無人機和相機等應用。

  1. Jetson Orin Nano平台支援之視覺模型
  2. NVIDIA PeopleNet v2.3:精簡人員檢測
  3. NVIDIA PeopleNet v2.5:最高準確度人員檢測
  4. NVIDIA Action Recognition Net:2D和3D人員姿勢辨識
  5. NVIDIA LPRNet:車牌辨識
  6. NVIDIA DashCamNet、BodyPoseNet:人員姿勢預測
  7. ResNet-50 (224×224):圖像辨識

NVIDIA規劃Jetson Nano、Jetson Orin Nano、Jetson AGX Orin等3種不同等級的開發套件。

根據NVIDIA官方提供的參考資料,Jetson Orin Nano 8GB在特定條件可以提供40倍於Jetson Nano的AI效能,以及50倍電力效率。

Jetson Orin Nano在電腦視覺領域可以提供30倍於Jetson Nano的效能,並透過軟體最佳化將差距拉到45倍。

豐富I/O功能

Jetson Orin Nano開發套件的I/O功能與Jetson Xavier NX開發套件比較接近,比Jetson Nano開發套件豐富許多,不但能支援microSD記憶卡,也能安裝M.2固態硬碟,以滿足吞吐量更大的運算需求。

Jetson Orin Nano開發套件規格特性一覽
運算模組部分:Jetson Orin Nano 8GB運算模組
處理器:6組Arm Cortex-A78AE v8.2 64-bit核心(1.5MB L2 + 4MB L3)
GPU:1024組NVIDIA Ampere架構CUDA核心+ 32組Tensor核心
記憶體:8GB 128-bit LPDDR5(頻寬=68 GB/s)
儲存媒體:M.2 NVMe固態硬碟、microSD記憶卡
消耗電力:7~15W
母板部分:NVIDIA Reference Carrier Board
攝影機端子:2組MIPI CSI-2 22-pin Camera Connectors
M.2:Key M PCIe Gen 3x4、M.2 Key M PCIe Gen3x2、M.2 Key E PCIe (x1) / USB 2.0 / UART / I2S / I2C
USB:4組USB 3.2 Gen2、USB Type-C(Debug、Device Mode專用)
網路:GbE乙太網路
顯示:DisplayPort 1.2(支援MST多重串流傳輸)
microSD讀卡機:支援UHS-1 SDR104模式
其它端子:40-Pin擴充端子(支援UART、SPI、I2S、I2C、GPIO)、12-Pin按鈕端子、4-Pin風扇端子、DC電源輸入端子
尺寸:100 x 79 x 21mm(包含底座、運算模組與散熱器)

Jetson Orin Nano開發套件將運算模組安裝於母板並搭配主動式散熱方案,外觀與Jetson Xavier NX開發套件比較接近。

Jetson Orin Nano提供2組MIPI CSI-2攝影機端子,方便影像辨識應用。

由於它的TDP可達15W,因此還是採用具有風扇的主動式散熱。

機身右側提供40-Pin擴充端子,方便連接各種外部裝置。

I/O背板區域提供4組USB 3.2 Gen2,以及Debug用USB Type-C、GbE乙太網路、DisplayPort 1.2、DC電源輸入端子各1組。

機身底部則有3組M.2插槽。

筆者將於下篇文章對Jetson Orin Nano開發套件進行效能實測,如果沒有意外的話,也計劃進行「咳咳」的測試,敬請期待我們的後續報導。

系列文章
NVIDIA推出Jetson Orin Nano開發套件,大幅提升AI入門裝置效能
Jetson Orin Nano開發套件動手玩(一):規格介紹與開箱(本文)
Jetson Orin Nano開發套件動手玩(二):效能實測

加入T客邦Facebook粉絲團

老黃刀法出鞘!NVIDIA推出價格砍半的Jetson Orin Nano Super開發套件

NVIDIA推出加強版的Jetson Orin Nano Super開發套件,不但AI運算效能較原始版本提升67.5%,價格也打對折下殺至美金249元。8a5ee75f6952959986acebe515ca47f8

NVIDIA推出加強版的Jetson Orin Nano Super開發套件,不但AI運算效能較原始版本提升67.5%,價格也打對折下殺至美金249元。

聖誕節打對折!

NVIDIA於GTC 2023春季展發表Jetson Orin Nano開發套件,筆者當時也進行開箱介紹與實測https://www.techbang.com/posts/105172-jetson-orin-nano-development-kit。

延伸閱讀:
NVIDIA推出Jetson Orin Nano開發套件,大幅提升AI入門裝置效能
Jetson Orin Nano開發套件動手玩(一):規格介紹與開箱
Jetson Orin Nano開發套件動手玩(二):效能實測

過了大約1年半之後,NVIDIA推出加強版的Jetson Orin Nano Super開發套件,並將價格由美金499元下調至249元,它由Orin Nano 8GB SoM系統化模組與擴充母板構成,SoM搭載6組最高時脈為1.7 GHz的Arm Cortex-A78AE處理器核心,以及1024組最高時脈為1020 MHz的Ampere架構CUDA核心。

「Super版」最大的改變為將TDP提高至20 W,硬體規格與原始版比較,主要差異為處理器、CUDA核心之時脈與記憶體頻寬提高,說穿了它就是超頻版本。值得注意的是,原始版也能透過更新韌體與作業系統的方式,解放TDP限制。

「Super版」除了將最高AI運算能力由原本的40 TOPS提高至67 TOPS,也將記憶體頻寬由68 GB/s提高至102 GB/s,帶來更出色的效能,也更適合應用於在邊緣運算導入生成式AI、機器人等專案。

此外NVIDIA也同時推出Super版Orin Nano與Orin NX SoM,提供更強的AI運算效能。

NVIDIA在2024年聖誕假期推出Jetson Orin Nano Super開發套件。

Jetson Orin Nano Super開發套件的效能較原始版大幅提升,價格則是下殺一半。

將Jetson Orin Nano在多種AI模型的效能標準化為1x,Jetson Orin Nano Super最高有2.04x的表現。

NVIDIA也同時推出Super版Orin Nano與Orin NX SoM。

Jetson Orin Nano Super開發套件規格一覽,綠字部分為Super版強化部分。

Orin Nano Super與Orin NX Super SoM規格一覽,綠字部分為Super版強化部分。

Jetson Orin Nano Super開發套件現已上市,可透過NVIDIA全球經銷夥伴購買。

加入T客邦Facebook粉絲團

Intel Arc B580效能實測,中堅價位新卡搶先報到

Intel推出至針對1440p遊戲應用規劃的Arc B580顯示卡,並透過XeSS 2升頻功能提升遊戲的FPS效能,就讓我們一起來看看它的表現。B89f9548c8edc1d40e67c10da85b1e40

Intel推出至針對1440p遊戲應用規劃的Arc B580顯示卡,並透過XeSS 2升頻功能提升遊戲的FPS效能,就讓我們一起來看看它的表現。

搶先登陸中階市場

Intel的第2代Arc顯示卡首波將推出Arc B580、B570等價為為美金249與219元的產品,在AMD Radeon RX 8000系列以及NVIDIA GeForce RTX 50系列尚未發表的情況下,率先搶占2024 / 25賽季的中階市場。

延伸閱讀:Intel Arc Battlemage系列顯示卡架構說明,Xe2繪圖架構搭配XeSS 2 AI升頻
Intel Arc B580效能實測,中堅價位新卡搶先報到(本文)
Intel也有效能禁藥,Arc B580搭配XeSS 2升頻、畫格生成效能實測(工作中)

筆者已經在前文介紹過Arc Battlemage系列顯示卡架構,本文將重點放在Arc B580的效能測試,並分析XeSS 2升頻功能所帶來的效能助益。

Arc B580採用BMG-G21繪圖處理器,具有20組Xe核心,並搭載12 GB頻寬達456 GB/s的GDDR6記憶體,TDP為190 W,使用單組PCIe 8-Pin電源。

Arc B580、B570之規格簡表。

Intel Arc B580 Limited Edition的包裝以藍、紫色之漩渦為視覺設計主題。

Arc B580 Limited Edition之TDP僅190 W,採用雙風扇、雙槽設計。

從背面可以看到顯示卡尾端為穿透式散熱設計。

風扇可以直接將冷空氣吹送穿透散熱片,強化整體散熱效果。

電源部分需連接1組8-Pin PCIe電源端子。

I/O部分提供3組DisplayPort 2.1(最高支援UHBR 13.5)與1組HDMI 2.1。

Arc B580的影音輸出端子規格一覽。

測試環境與條件

本次測試過程除了手動開啟EXPO功能,讓記憶體自動超頻至DDR5-6000之外,其餘BIOS / UEFI的設定皆維持預設值,Resizable BAR為開啟狀態。

所有成績除了都是進行2輪測試,在確定沒有極端值後取平均,遊戲效能使用遊戲內建的測試模式,而《絕對武力2》為手動操作進行與電腦BOT於Dust 2地圖之對戰,搭配NVIDIA FrameView記錄FPS成績。

遊戲部分在1080p、2K、4K解析度搭配最高畫質設定,若有設定範本則套用最高範本,若無則將所有畫質相關項目調至最高,關閉VRS或動態解析度等設定,並僅進行開、關光線追蹤功能的調整。

至於對照組部分,則使用先前測試專題之Intel Arc A750與AMD Radeon RX 7600 / RX 7700XT以及NVIDIA GeForce RTX 4060 / RTX 4060 Ti 8GB / RTX 4070等顯示卡,但是它們皆搭配AMD Ryzen 7 7700X處理器與ASRock X670E Taichi主機板。考量到這些顯示卡大多落在中階區間,因此效能瓶頸大多在顯示卡本身,處理器造成的影響較小,對照組成績仍有一定參考價值。

另外筆者也加入Arc B580與Core Ultra 155H / 258V等行動版處理器之內建繪圖處理器(iGPU)之AI效能測試,在最後的《黑神話:悟空》、《絕對武力2》等2的項目則以NVIDIA GeForce RTX 4090顯示卡作為對照。至於XeSS 2的測試則會在下篇文章分析。

測試平台:
處理器:AMD Ryzen 7 9700X(105 W cTDP模式)
散熱器:MSI MEG Coreliquid S360
主機板:GIGABYTE X870E AORUS MASTER
記憶體:G.Skill Trident Z5 Neo RGB 16GBx2(@DDR5-6000)
顯示卡:Intel Arc B580 Limited Edition
儲存裝置:Solidigm P44 Pro 1TB
電源供應器:MSI MEG Ai1300P PCIE5
軟體環境:Windows 11專業版23H2(Build 22361.4460),Intel Graphics Software 32.0.101.6249

測試平台之CPU-Z資訊,使用AMD Ryzen 7 9700X處理器搭配GIGABYTE X870E AORUS主機板MASTER,並開啟105 W cTDP模式。

唯GPU-Z的部分使用Intel提供的32.0.101.6252版驅動程式查看規格資訊,可看到使用PCIe Gen 4x8匯流排並開啟Resizable BAR。

(下頁還有效能測試)

測試軟體分析

在效能測試前半段,我們先來瞭解Arc B580在3DMark與Procyon等測試軟體的表現如何。

數據圖表中的測試平台標記如下:
RX 7600:Ryzen 7 7700X、X670E晶片組、DDR5-6000、Radeon RX 7600
RX 7700 XT:Ryzen 7 7700X、X670E晶片組、DDR5-6000、Radeon RX 7700 XT
RTX 4060:Ryzen 7 7700X、X670E晶片組、DDR5-6000、GeForce RTX 4060
RTX 4060 Ti 8GB:Ryzen 7 7700X、X670E晶片組、DDR5-6000、GeForce RTX 4060 Ti 8GB
RTX 4070:Ryzen 7 7700X、X670E晶片組、DDR5-6000、GeForce RTX 4070
Arc A750:Ryzen 7 7700X、X670E晶片組、DDR5-6000、Arc A750
Arc B580:Ryzen 7 9700X(105 W cTDP)、X870E晶片組、DDR5-6000、Arc B580

3DMark Fire Strik採用Direct X 11繪圖API搭配1080p解析度(1920 x 1080),由於Arc B580使用Ryzen 7 9700X處理器,所以物理分數較高。觀察圖像分數可以看到Arc B580以25.67%的幅度領先於RTX 4060,甚至超過RTX 4060 Ti 8GB約2.71%。

Fire Strike Extreme將解析度提升至2K(2560 x 1440),在繪圖負載提高之後,Arc B580在圖像分數領先RTX 4060的幅度縮小至18.53%。

Fire Strike Ultra進一步將解析度提升至4K(3840 x 2160),Arc B580又將領先幅度擴大至33.60%。

3DMark Time Spy採用Direct X 12搭配2K解析度,Arc B580的處理器分數也因為使用Ryzen 7 9700X而特別凸出,至於圖像分數則領先RTX 4060約40%。

Time Spy Extreme將解析度提升至4K,Arc B580領先幅度擴大至43.24%。

Speed Way是採用DirectX 12 Ultimate繪API與DirectX Raytracing tier 1.1光線追蹤技術,具有全域照明與反射等效果,並透過Mesh Shaders進行效能最佳化,可以反映最新AAA大作遊戲的效能表現。Arc B580遇到光線追蹤就被RTX 4060超車,落後約3.59%。

3DMark Port Royal採用DirectX Raytracing(DXR)光線追蹤繪圖技術搭配2K解析度,是考驗顯示卡光線追蹤效能的競技場。這邊Arc B580反而能領先RTX 4060約29.66%。

但是看到同樣採用DXR技術的3DMark DirextX光線追蹤功能測試,Arc B580的表現落後RTX 4060約12.65%。

Arc B580使用PCIe Gen 4x8匯流排,在PCI Express功能測試中的頻寬表現為14.38 GB/s。

在Procyon AI電腦視覺測試中,以搭載Lunar Lake世代Core Ultra 258V處理器的Asus Zenbook S 14為主要對照。Arc B580的表現並無與Core Ultra 258V內建顯示晶片之繪圖處理器拉開明顯差距。

Procyon AI圖像生成部分,一樣與Core Ultra 258V進行對照,可以看到Arc B580的表現相當突出。

若參考Procyon AI圖像生成每張圖片所花費的時間,可以看到Arc B580在SD 1.5中大約4秒左右就可生成1張圖像,而SDXL則為23.44秒。

遊戲效能測試

接下來我們繼續分析Arc B580在實際遊戲的效能表現,看看它是否仍有「跑分快樂、遊戲翻車」的老問題。

《古墓奇兵:暗影》在關閉光線追蹤時,Arc B580與RTX 4060的表現相差不大,差距落在正5.05%到負11.78%之間。

《古墓奇兵:暗影》開啟光線追蹤後,Arc B580能夠領先RTX 4060約0.76%至28.83%不等,在2K解析度仍有超過65幀的平均FPS表現。先前Arc a750因無法執行測試,故無成績。

《看門狗:自由軍團》關閉光線追蹤時,Arc B580無法在2K解析度提供高於60幀的平均FPS,且到4K解析度才能領先RTX 4060。

《看門狗:自由軍團》開啟光線追蹤後,Arc B580能在2K解析度提供略高於30幀的平均FPS,勉強符合最低遊戲門檻。

《戰慄深隧:流亡》關閉光線追蹤時,Arc B580在1080p、2K解析度的表現不如RTX 4060,到4K解析度才因較高的顯示記憶體而扳回一城。

《戰慄深隧:流亡》開啟光線追蹤後,RTX 4060提早在2K解析度就碰到顯示卡效能瓶頸,讓Arc B580能夠超車。

《極地戰嚎6》由於繪圖負擔較低,對處理器的效能相當敏感,在較強處理器的助陣下Arc B580有較為亮眼的表現,但也讓對照組失去參考價值。

《極地戰嚎6》開啟光線追蹤後呈現相近的狀況,但也證明Arc B580能滿足2K解析度的遊戲需求。

《刺客任務III》Dubai(杜拜)測試項目包含多種場景與NPC角色,整體負擔較低,Arc B580的表現大約落在RTX 4060與RTX 4060 Ti 8GB之間。

Dubai開啟光線追蹤後由於繪圖負荷提升,Arc B580被RTX 4060超車。

《刺客任務III》Dartmoor(達特穆爾)測試項目則包含許多槍枝射擊與爆炸效果,充滿物理與粒子模擬,對處理器的要求比較高。儘管如此,Arc B580在1080p與4K解析度仍落後於RTX 4060,僅在4K解析度領先約10.37%。

Dartmoor開啟光線追蹤後,Arc B580就被RTX 4060甩開,在2K解析度的落後幅度達到29.11%。

《電馭叛客2077》閉光線追蹤時,Arc B580在3種解析度的表現都落後於RTX 4060。

《電馭叛客2077》開啟光線追蹤後,Arc B580反而能夠超越RTX 4060,但是就算在1080p解析度也無法達到平均FPS 60幀的門檻。

《絕對武力2》部分因遊戲版本更新而無法與上列對照組比較,筆者僅列出以GeForce RTX 4090重新測試的成績(但因為價格落差太大,也不適合直接比較效能)。可以看到Arc B580能在2K解析度提供超過120幀的平均FPS,99%百分位(1% Low)也超過100幀,能夠滿足電競應用的需求。

《黑神話:悟空》則是新一代效能殺手,Arc B580基本上無法滿足遊戲需求,需透過XeSS升頻技術彌補效能缺口。

填補中階市場空缺

目前低階顯示卡的市場已經被處理器內建顯示取代,目前桌上型處理器中顯示效能最高的就是AMD Ryzen 7 8700G,然而它大約只能滿足1080p解析度、中低畫質的遊戲需求,若玩家有1080p或2K解析度,搭配最高畫質加上光線追蹤的需求,就需添購中階獨立顯示卡。至於以4K遊戲應用的高階與旗艦等級的顯示卡,則有更多廠牌的產品可供選擇。

考慮到截稿當下,Ryzen 7 8700G的市場價格為新台幣9,450元,大約等於Arc B580美金249元(未稅價,約合新台幣8,160元,台灣價格尚未公布),若讀者已有現成的電腦的話,那麼單獨採購Arc B580也是個不錯的升級選擇,可以獲得較佳的遊戲體驗。

不過比較可惜的是,Arc B580僅搭載容量為12 GB的顯示記憶體,對於AI應用程式來說可能略顯不足,以筆者個人的使用經驗來說,使用SDXL或是Pony Diffusion模型生成1080p到2K解析度圖像時往往會占用14 GB顯示記憶體,若讀者想要使用這些功能的話,還是建議選擇NVIDIA GeForce RTX 4060 Ti 16GB以上的顯示卡。

最後預告一下,筆者也會針對XeSS 2的升頻與畫格生成功能進行測試,請讀者保持關注。

加入T客邦Facebook粉絲團

Intel Arc Battlemage系列顯示卡架構說明,Xe2繪圖架構搭配XeSS 2 AI升頻

Intel發表搭載Xe2繪圖架構的Arc Battlemage系列顯示卡,在效能測試解禁前夕,先讓我們來看看它的架構細節。47ca8ff4b6cf348f94b0eb6172fc2472

Intel發表搭載Xe2繪圖架構的Arc Battlemage系列顯示卡,在效能測試解禁前夕,先讓我們來看看它的架構細節。

第2代Arc登場

Intel在最初發表Arc顯示卡產品線時,就預告第1至4代的產品代號分別為Alchemist(鍊金術師)、Battlemage(戰鬥法師)、Celestial(天界人)、Druid(德魯伊)等充滿奇幻角色風格的名稱,如今也順利走到第2世代,首波將推出Arc B580、Arc B570等2款產品。

延伸閱讀:Intel Arc A750顯示卡效能實測,驅動更新、價格下殺是否值得進場?

Arc Battlemage系列顯示卡(以下簡稱B系列顯示卡)採用Xe2繪圖架構,支援SIMD16資料架構改善運算效率,並透過Xe矩陣延伸單元(Xe Matrix eXtensions,以下簡稱XMX)大幅提升AI運算效能。

Intel在測試說明文件中提到,Xe2的開發目標包括提高資源使用率、改善工作負載分配、無縫的軟硬體交握,以改善整體效率,根據官方提供的數據,能夠提升Xe核心效能最高達70%,並改善50%電力效率。

以Arc B580為例,它具有5組繪圖切片(Render Slice)以及1組媒體引擎,每組切片內部具有4組Xe核心與光線追蹤單元(Ray Tracing Unit,以下簡稱RTU),並有共用的L2快取記憶體。

上述Xe核心為B系列顯示卡的基礎運算單元,它由8組Xe向量引擎(Xe Vector Engine,以下簡稱XVE)構成,透過更寬的SIMD16寬度算術邏輯單元以強化效率與相容性,並搭載256 KB共用L1快取記憶體,以改善資料存取效率。而每組XVE所搭配的XMX能夠提供每週期2048次FP16或4096次INT8運算,並支援TF32、BF16、INT4、INT2等資料類型,在INT8資料類型的AI運算較能較傳統MAC(Multiply–accumulate,乘積累加運算)運算提高16倍之譜。

Xe2架構也整合第2代RTU,每組RTU具有3組遍歷管線(Traversal Pipeline,計算光線路徑)與18組接觸偵測單元(Box Intersection,偵測光線是否與物件接觸),較前代Xe-HPG提升50%,每運算週期能夠進行2次多邊型接觸偵測(Triangle Intersection,偵測光線是否與繪製的多邊型接觸),效能較前代提升100%,而搭載的BVH(Bounding Volume Hierarchies)快取記憶體容量也提升至16KB,為前代的2倍。

此外Xe2架構也支援DXR光線追蹤(DirectX Raytracing)、可變速率著色(Variable Rate Shading)、網格著色器(Mesh Shader)、取樣器回饋(Sampler Feedback)等多項DirectX 12 Ultimate功能,並進行效最佳化,以提供更完整的遊戲功能。

不過需要注意的是,Xe2架構的媒體引擎與Lunar Lake處理器內建的規格並不相同,因此不支援H.266(VVC)之加速,仍可H.264(AVC)、H.265(HEVC)、VP9、AV1 等格式之編解碼加速,以及JPEG、MPEG-2之解碼加速。另一方面雖然Arc B580、Arc B570等2款顯示卡都是採用PCIe x16的插槽,但僅使用PCIe Gen 4x8匯流排。參考其他廠商之中皆產品設計,這也是相當常見的規劃。

Intel發表Xe2架構的Arc Battlemage系列顯示卡,首波將推出Arc B580、Arc B570等2款產品。

2者分別將於2024年12月13日與2025年1月16日上市,其中只有Arc B580會推出等同公板卡的Intel Limited Edition。

Arc B580採用BMG-G21繪圖處理器,具有5組繪圖切片(Render Slice)以及1組媒體引擎,並搭載18 MB L2快取記憶體。

媒體引擎內部具有2組多格式轉碼器(Multi-Format Transcoder,MFX),支援H.264、H.265、VP9、AV1 等格式之編解碼加速,以及JPEG、MPEG-2之解碼加速。

每組切片內部具有4組Xe核心與光線追蹤單元,所有切片使有共用的L2快取記憶體。。

每組Xe核心則具有8組Xe向量引擎與Xe矩陣延伸單元。

Xe核心的算術邏輯單元原生支援SIMD16寬度,並支援SIMD32寬度,Xe矩陣延伸單元支援TF32、FP16、BF16、INT8、INT4、INT2等資料類型。

光線追蹤單元的各項單元為前代產品的1.5至2倍。

第2代Xe核心效能與前代相比最高提升達70%,並改善50%電力效率。。

細部分析Xe2架構的多項繪圖功能有20%到1150%不等的增益。

Arc B580、Arc B570的規格一覽。雖然表格未列出,但需要注意的是,它們僅使用PCIe Gen 4x8匯流排。

這2款顯示卡皆以1440p解析度遊戲應用為目標,瞄準普及性日益升高的1440p螢幕。

Arc B580的訂價為美金249元,光柵繪圖(左)與光線追蹤(右)效能表現較價位接近的NVIDIA GeForce RTX 4060、AMD Radeon RX 7600出色。

Arc B580的多款遊戲效能較前代Arc A750平均高出24%。

與GeForce RTX 4060相比則平均高出10%。

AI功能迎頭趕上

Intel這次也推出XeSS 2(Xe Super Sampling 2)超級採樣功能,除了既有的XeSS Super Resolution畫面升頻之外,也加入XeSS Frame Generation畫格生成以及XeSS Low Latency低延遲等功能。

畫面升頻、畫格生成功能的概念與NVIDIA DLSSAMD FSR等技術類似,前者會降低遊戲過程3D繪製畫面的解析度,並透過AI運算將其放大後再輸出,藉由降低繪圖負載以提升FPS並降低遊戲延遲,後者則是透過AI方式生成額外畫格,透過「補幀」的方式提升FSP與遊戲視覺流暢度,但對遊戲的延遲並無幫助。

至於XeSS Low Latency則與NVIDIA Flex、AMD Radeon Anti-Lag相近,都是透過改善遊戲API與資源調度的方式,縮短由玩家輸入指令到最終反應到螢幕上的延遲時間。

B系列顯示卡當然也具備執行AI功能的能力,支援PyTorch、ONNX、TensorFlow等框架與OpenVINO、ONNX、Web NN等執行環境,使用者可以自行安裝各種程式與模型,或是透過Intel提供的AI Playground軟體,體驗生成圖像(支援Stable Diffusion 1.5SDXL等模型)、圖片編輯、聊天機器人等AI功能。

XeSS 2包含畫面升頻、畫格生成、低延遲等功能。

XeSS Super Resolution畫面升頻功能會降低遊戲畫面繪製的解析度,並參考動態向量與歷史畫格等資訊,搭配AI推論放大畫面後再輸出至螢幕。

XeSS Frame Generation畫格生成則是參考動態向量、深度資料(Depth Map)等資訊,搭配AI推論生成全新的額外畫格。

畫面升頻與畫格生成可以同時使用,帶來與NVIDIA DLSS、AMD FSR等技術相近的遊戲效能提升功能。

根據Intel提供的數據,XeSS 2能在平衡模式下,將《F1 24》、1440p解析度、Ultra畫質的FPS效能推升至原始的3.2倍,若使用最高效能模式則可達到3.9倍。

遊戲延遲的部分,則是指玩家輸入指令後送達處理器運算、繪圖佇列,然後進入繪圖處理器繪製畫面,最後顯示於螢幕所經過的時間。

XeSS Low Latency能夠改善這段處理流程並縮短延遲。圖中上半部為一般流程,下半部為XeSS Low Latency流程,可以到主要省下繪圖佇列的等待時間。

上述3項XeSS 2功能可以在Arc A系列與B系列顯示卡 / 顯示晶片以及代號為Lunar Lake的Core Ultra 200V系列處理器使用。Core Ultra 1系列處理器(Meteor Lake)與Core Ultra 200S系列處理器(Arrow Lake-S)則不支援畫格生成。Tiger Lake、Alder Lake、Raptor Lake等第11~14代Core i處理器則只支援升頻功能。

Intel也提供完整的AI方案,能夠支援PyTorch、ONNX、TensorFlow等框架與OpenVINO、ONNX、Web NN等執行環境,並透過B系列顯示卡運算。

Intel提供的AI Playground軟體能夠讓使用者輕鬆使用生成圖像、圖片編輯、聊天機器人等AI功能。

根據Intel提供的數據,Arc B580在多項大型語言模型的每秒輸出字詞(Token)數量表現優於NVIDIA GeForce RTX 4060。

筆者也將製作Arc B580的測試專題,預計於2024年12月12日晚間10點新聞解禁時刊登。

加入T客邦Facebook粉絲團

Raspberry Pi 500與Raspberry Pi Monitor登場,裝起來就是筆電!

Raspberry Pi基金會推出Raspberry Pi 500鍵盤型電腦與Raspberry Pi Monitor攜帶型螢幕,以滿足更多使用情境需求。0981d2dad65fc04b29f015e433d06561

Raspberry Pi基金會推出Raspberry Pi 500鍵盤型電腦與Raspberry Pi Monitor攜帶型螢幕,以滿足更多使用情境需求。

Pi 5世代鍵盤登場

先前的Raspberry Pi 400Raspberry Pi 4為基礎,

將外型由原本的單板電腦,轉變為內建主機板的鍵盤,因此使用者只要將它接上滑鼠與顯示器,就能開始使用。

延伸閱讀:
文書機更方便啦!官方推出內建ARM晶片的Raspberry Pi 400鍵盤,接螢幕就可當電腦
Raspberry Pi 5終於來了!效能更高、內建PCIe匯流排還有實體電源鍵

而Raspberry Pi 500顧名思義就是以Raspberry Pi 5為基礎,它同樣採用Broadcom BCM2712 SoC,具有時脈高達2.4GHz的4核心64bit Arm Cortex-A76處理器,搭配 VideoCore VII繪圖處理器,記憶體部分僅提供8GB LPDDR4X-4267單一規格,不像Raspberry Pi 5提供2、4、8GB等選項

在I/O功能部分,Raspberry Pi 500具有USB 3.2 Gen1(支援同時5Gbps運作)、Micro HDMI(支援同時4K60p)端子各2組,以及USB 2.0、40-Pin GPIO與microSD與讀卡機各1組,並提供雙頻Wi-Fi 5與藍牙5.0等無線通功能。

Raspberry Pi Monitor則是專為Raspberry Pi設計的攜帶型螢幕,採用與官方外殼相同的配色,搭載可視尺寸與解析度為15.6吋、1920 x 1080的IPS類型面板,並內建1.2 W立體聲喇叭與VESA鎖孔,但官方指出色彩覆蓋率與可視角度只有45%與80度。

Raspberry Pi Monitor建議搭配5V3A的USB Type-C電源供應器,也可以透過隨附的USB Type-A轉Type-C線由Raspberry Pi機身供電,但後者會讓螢幕的量度與音量分別被限制在60%與50%(但還是夠亮、夠大聲)。

Raspberry Pi基金會推出官方版本Raspberry Pi 500鍵盤型電腦與Raspberry Pi Monitor外接式螢幕。

Raspberry Pi 500可以視為將Raspberry Pi 5主機板塞到鍵盤內的產品。

Raspberry Pi 500外觀以白色為基調,I/O端子放在鍵盤頂部。

I/O端子具有USB 2.0、USB 3.2 Gen1、microSD與讀卡機、電源、Micro HDMI、40-Pin GPIO。

Raspberry Pi Monitor為15.6吋、1920 x 1080的攜帶型螢幕,採用經典紅白配色。

這2款產品現已開賣,Raspberry Pi 500售價為美金90元(約合新台幣2,945元),加上滑鼠、27 W電源供應器、2 M micro HDMI對HDMI纜線的組合包售價為美金120元(約合新台幣3,930元),Raspberry Pi Monitor則為美金100元(約合新台幣3,275元),同時前代Raspberry Pi 400售價下調至美金60元(約合新台幣1,965元)。

加入T客邦Facebook粉絲團

3DMark更新DirectStorage測試,分析固態硬碟存取效能

UL宣佈將透過更新在3DMark加入DirectStorage測試項目,讓玩家透過量化數據瞭解DirectStorage帶來的遊戲效能改善。6cf769966c1de3ecbfb21acc7564a302

UL宣佈將透過更新在3DMark加入DirectStorage測試項目,讓玩家透過量化數據瞭解DirectStorage帶來的遊戲效能改善。

比較不同設定存取效能

DirectStorage是由Microsoft推出的DirectX家族API,能夠強化NVMe通訊協定的固態硬碟I/O效能,並使用GDeflate壓縮檔案格式透過繪圖處理器(GPU)平行運算的特色加速解壓縮,能縮短遊戲載入資料的時間,並快速讀取更多如角色服裝、風景等貼圖材質,讓遊戲畫面更加生動。

延伸閱讀:
Microsoft說明DirectStorage特色,看懂GeForce 30系列RTX IO技術有何優勢
3DMark Steel Nomad免費更新,成為新一代重量級非光線追蹤測試項目

UL表示在實際遊戲中準確測量DirectStorage的效能表現並非易事,遊戲引擎往往會在讀取遊戲檔案的同時執行繪製幾何圖形等其他任務,因此DirectStorage測試項目的設計排除其他工作負債的影響,將重點放在模擬將系統資源完全投入DirectStorage,以測得接近理論值的最佳表現,讓使用者觀查啟用DirectStorage所能帶來的最大潛在效能增益。

3DMark透過更新加入DirectStorage測試項目,能夠測試並比較開、關DirectStorage功能的檔案讀取效能。

DirectStorage測試項目能夠測試關閉、開啟、開啟並搭配GDeflate壓縮等3種不同情境的存取效能,並進行比較。

3DMark也透過這次更新為Speed Way、Wild Life、Wild Life Extreme等測試項目中提供新的音樂,並且能在在設定中切換。

使用者可以透過SteamEpic Games等平台或是直接於UL官方網站購買3DMark,如果先前已購買儲存測試DLC,則可免費更新DirectStorage測試項目。

加入T客邦Facebook粉絲團

Intel說明Xeon 6處理器與Gaudi 3加速器優勢,雙路處理器給你滿滿192條PCIe Gen 5通道

Intel在資料中心暨AI解決方案媒體說明會中提到多項Xeon 6處理器與Gaudi 3加速器的特色,並帶來實際應用範例。A35eea7af72961d731a16f7e4596049a

Intel在資料中心暨AI解決方案媒體說明會中提到多項Xeon 6處理器與Gaudi 3加速器的特色,並帶來實際應用範例。

開放軟、硬體環境強化競爭優勢

Intel亞太暨日本區總經理莊秉翰在說明會開頭便提到執行長Pat Gelsinger退休一事,回顧他致力於讓Intel重新返回技術製造的領導地位(可參考民視新聞片段)。

延伸閱讀:
Intel CEO嗆聲摩爾定律活得很好,18A節點製程Panther Lake處理器下週試產
Intel Vision 24:Intel與合作夥伴共建AI開放平台,搭配RAG技術強化企業私有LLM應用

接著莊秉翰說明,Intel在AI應用領域提供系統先決的完整堆疊方案,透過搭載P-core的Xeon 6處理器和Gaudi 3 AI加速器,以及Intel強大的x86架構與開放生態系,提供企業建構最佳化TCO(總體擁有成本)與最佳電力效率的AI系統。

莊秉翰也提到,搭載P-core的Xeon 6處理器與競爭對手AMD EPYC相比,AI推論效能最高相差5.5倍,高效能運算(HPC)則最高相差2.1倍。至於與NVIDIA H100相比,Gaudi 3 AI加速器的LLaMA 2 70B大語言模型推論吞吐量高出競爭對手19%,而成本效益則約為2倍。

Intel亞太暨日本區總經理莊秉翰於說明會指出Intel在AI應用領域的優勢。

系統先決的完整堆疊方案包含可擴充性、開放生態系、資安、總體擁有成本等優勢。

Intel提供搭載E-Core或是P-Core的Xeon 6處理器以及,Gaudi 3 AI加速器等多種運算單元滿足不同AI應用需求。

搭載P-core的Xeon 6處理器在AI推論、高效能運算的效能最高可達AMD EPYC的5.5倍、2.1倍。

Gaudi 3 AI加速器具有加速卡、通用基板、PCIe擴充卡等型式可供選擇。

Gaudi 3 AI加速器的LLaMA 2 70B大語言模型推論吞吐量高出NVIDIA H100 19%,而成本效益則約為2倍。

Xeon 6處理器提供更多PCIe通道

Intel業務暨行銷事業群商用業務總監鄭智成也接著說明Xeon 6處理器的特點,在記憶體部分支援12通道、DDR5-6400,較前代8通道、DDR5-5600的整體頻寬高出70%,此外還支援傳輸速度達8800 MT/s的MRDIMM(Multiplexed Rank DIMM),提升資料吞吐量。

Xeon 6處理器也支援CXL 2.0與Type 1、Type 2、Type 3等不同應用型態。舉例來說,透Flat2LM技術能將容量為768 GB的DDR5-6400記憶體組成的DRAM區域,與由768 GB DDR5-6400記憶體搭配768 GB DDR4-3200記憶體組成的Flat2LM區域合併為總量達2304 GB的記憶體池,雖然在執行線上分析處理(Online Analytical Processing,OLAP)工作負載時會損失3%的效能,但是可以大幅縮減1/3記憶體建置成本,整體效益相當可觀。

鄭智成在會中強調,Xeon 6處理器的多路併聯透過傳輸速度達24 GT/s的6組UPI 2.0通道交換資料,例如在使用2組具有96條PCIe Gen 5通道的Xeon 6處理器時,系統整體可以使用192條PCIe Gen 5通道。相較之下競爭對手的多路處理器仰賴PCIe交換資料,因此使用2組具有128條PCIe Gen 5通道的處理器時,處理器之間使用64條通道相互溝通,造成系統整體可用PCIe Gen 5通道僅有128條,進而降低安裝擴充卡的能力。

鄭智成也以實際應用情境為例,提到國內某金融企業先前宣佈斥資新台幣3,000萬元建置AI運算伺服器,以滿足AI模型訓練的需求,但是其成本之高,可能不是中小企業可以負擔。

不過若是以現有的開源大型語言模型(LLM)搭配檢索增強生成(Retrieval Augmented Generation,以下簡稱RAG)技術,將企業私有的資訊送入系統進行向量化處理,就能在不重新訓練或是微調模型的情況下,讓模型能夠回答針對企業相關的問題,並透過搭載Xeon 6處理器之伺服器完成AI推論運算,如此一來建置成本可以縮減至新台幣100萬元左右,相當具有優勢。

Intel業務暨行銷事業群商用業務總監鄭智成在會中分析Xeon 6處理器的優勢。

Xeon 6處理器特色一覽,其中搭載E-Core的型號最高具有288組核心,而搭載P-Core的型號最高具有128組核心。

搭載P-Core的Xeon 6處理器效能較前代產品提高最多至3.08倍(淺藍色),而電力效率介於1.43~2.16倍之間(深藍色)。

在不同應用情境下,Xeon 6處理器的電力效率可達較前代產品的1.9倍。

Xeon 6 6900P處理器特色簡表,其中在AMX進階矩陣延伸指令集除了延續支援FP8、BF16等資料格式外,也加入支援FP16。

MRDIMM(Multiplexed Rank DIMM)透過類似「雙通道」的方式提升資料吞吐量,使用MRDIMM-8800在多項運算表現的效能最高可較DDR5-6400提升32%。

CXL 2.0有助於建立更具成本效益的記憶體池,Xeon 6處理器支援Type 1、Type 2、Type 3等不同應用型態。

舉例來說CXL 2.0能在縮減1/3記憶體建置成本的前提下,維持97%的線上分析處理效能。

Xeon 6處理器較前代產品提供2倍核心數,單核心平均效能表現也高出20%。

在以處理器進行AI推論運算的效能表現圖表中,灰色基準線為AMD EPYC 9654(96核心)之成績,深藍色為前代Xeon 8592+(64核心)。而淺藍色的Xeon 6970P(96核心)表現最高能達到對手的5.5倍。

Intel也推出由32組Gaudi 3 AI加速器節點組成的運算叢集方案(共256組Gaudi 3),以滿足更大規模的AI運算需求。

鄭智成在現場展示透過RAG在不重新訓練大型語言模型的前提下,透過輸入文件的方式「教導」模型如Xeon 6特色資訊。

Intel也在現場展示透過Xeon 6處理器進行AI推論運算,圖為執行X光分析、醫療大型語言模型,以及多模態文字搜尋圖像等範例。

此外還有Llava-llama 3影像助理、LDM3D文字生成3D圖像、RAG等範例。

莊秉翰在會中表示:「隨著AI運算需求日益成長,帶動資料中心和基礎設施大規模轉型,可擴充性、成本、能源效率和安全性成為企業當前關鍵考量因素。因應市場需求攀升,英特爾推出搭載P-core的Xeon 6和Gaudi 3 AI加速器,透過英特爾強大的x86架構與開放生態系,使其能夠支援企業建構具備最佳化總體擁有成本(TCO)及每瓦最佳效能的AI系統,以更佳的效率和成本效益滿足客戶複雜的工作負載。」

加入T客邦Facebook粉絲團

Intel發表Arc B580、B570顯示卡,12月12日上市美金219元起跳

Intel發表代號為Battlemage的第2代Arc顯示卡,首波產品為高階款的Arc B580,而次階款Arc B570將於2025年1月登場。A0639dfbbfbf08d59aa8eed28ba84765

Intel發表代號為Battlemage的第2代Arc顯示卡,首波產品為高階款的Arc B580,而次階款Arc B570將於2025年1月登場。

第2代Arc來了

Intel於今日發表Arc B580、Arc B570等顯示卡,並解除Arc B580的外觀的保密條款,讓我們可以先一睹其面貌。

延伸閱讀:Intel Arc A750顯示卡效能實測,驅動更新、價格下殺是否值得進場?

Arc B580與B750採用Xe2繪圖架構,分別具有20、18組的Xe核心,前者搭載通道寬度為192 bit的12 GB顯示記憶體,後則則為160 bit、10 GB,2者都支援AV1、HEVC(H.265)、AVC(H.264)、VP9、XAVC-H等格式之硬體編解碼加速,且都支援畫面升頻、畫格生成、低延遲等XeSS 2 AI功能。

等同於公板卡的Intel Arc B580 Limited Edition採用雙風扇、雙槽設計,並具有類似GeForce RTX 30系列開始導入的穿透式散熱設計,搭載1組8-Pin PCIe電源端子。

Arc B580、Arc B570規格簡表。

Intel Arc B580 Limited Edition之TDP僅190 W,採用雙風扇、雙槽設計。

從背面可以看到顯示卡尾端為穿透式散熱設計。

風扇可以直接將冷空氣吹送穿透散熱片,強化整體散熱效果。

電源部分需連接1組8-Pin PCIe電源端子。

I/O部分提供3組DisplayPort 2.1(最高支援UHBR 13.5)與1組HDMI 2.1。

Arc B580的預定上市日期為2024年12月13日,預定售價為美金249元(約合新台幣 8,170 元),而Arc B570則預定於2025年1月16日上市,預定售價為美金219元(約合新台幣7,185元)。

筆者也預計於12月12日晚間效能解禁時帶來測試專題報導,請讀者保持關注。

加入T客邦Facebook粉絲團

GPD Pocket 4掌上型電腦,8.8吋翻轉螢幕搭配Ryzen AI 9 HX 370

GPD Pocket 4是款搭載AMD Ryzen AI 9 HX 370處理器的掌上型電腦,翻轉螢幕的螢幕提供筆電、平板等多種使用模式。E1ee60874573ef23b2aeea723bc89ce0

GPD Pocket 4是款搭載AMD Ryzen AI 9 HX 370處理器的掌上型電腦,翻轉螢幕的螢幕提供筆電、平板等多種使用模式。

軟骨功迷你筆電

Pocket 4襲承前代Pocket 3的多項設計,同樣採用可翻轉式的螢幕設計,並提供模組化擴充槽,使用者不但可以依據不同使用情境讓電腦「變身」為筆記型、平板電腦,也可以更換不同擴充配件,以滿足行動網路、KVM等特殊需求。

延伸閱讀:GPD Pocket 3超迷你8吋翻轉筆電,模組擴充槽還可連接HDMI輸入

Pocket 4具有8.8吋、解析度為2560 x 1600的觸控螢幕,並提供AMD Ryzen AI 9 HX 395、Ryzen AI 9 HX 370、Ryzen 7 8840U等處理器選擇。

Ryzen AI 9 HX 370為例,具有4組Zen 5與8組Zen 5c處理器核心,總共為12核24緒配置,2種核心的最高Turbo時脈分別為5.1 GHz、3.3 GHz,並整合16組運算單元(CUs)、最高時脈達2.9 GHz的Radeon 890M內建顯示晶片,同時也內建AI運算效能達50 TOPS的神經處理器(NPU),並可以20~28 W cTDP(可調整式熱設計功耗)模式運作,在運算與繪圖、遊戲等應用都提供出色的效能表現。

Pocket 4採用LPDDR5x-7500記憶體,提供16、32、64 GB等容量選擇,並支援PCIe Gen 4x4匯流排、NVMe 1.4通訊協定的M.2280固態硬碟,提供1、2 TB容量選擇,使用者也可以更換容量更大的固態硬碟,但需注意的是受機身內部空間限制,僅能安裝單面顆粒的固態硬碟。

Pocket 4是款搭載8.8吋翻轉螢幕的掌上型電腦,具有QWERTY鍵盤與觸控板、觸控螢幕。

其尺寸為20.68 x 14.45 x 2.22公分,重量為770公克。

其翻轉螢幕能提供多種擺放與使用模式。

使用者也可以將螢幕翻轉之後做為平板電腦使用。

擴充功能不馬虎

Pocket 4提供USB4、全功能USB Type-C 3.2 Gen2(支援資料、影音、充電)、USB 3.2 Gen2、USB 2.0、HDMI 2.1、3.5mm耳機麥克風復合、2.5GbE乙太網路等端子各1組,並支援Wi-Fi 6E、藍牙5.3等無線通訊功能。

此外它也具有可以抽換的模組化擴充槽,出廠預設的配置為microSD讀卡機,使用者也可另購其他模組。4G LTE通訊模組讓電腦能夠連接行動網路,RS-232模組則是提供RS-232端子方便連接周邊設備。

比較特別的是KVM模組,它具有1組HDMI輸入與USB端子,功能為與另一台電腦連接後,就可以在Pocket 4的螢幕上看到另一台電腦的畫面,並透過Pocket 4的鍵盤、滑鼠進行操作。

Pocket 4提供豐富的I/O功能,除了具有HDMI 2.1影音與2.5GbE乙太網路端子與指紋辨識功能外,還有模組化擴充槽。

模組化擴充槽預設的配置為microSD讀卡機。

使用者也可以安裝4G LTE通訊模組以連接行動網路。

RS-232模組則提供連接條碼機、示波器等周邊機器的能力。

KVM模組可以讓Pocket 4顯示另一台電腦的畫面,並透過Pocket 4的鍵盤、滑鼠操作。

搭配GPD G1外接顯示卡擴充底座則可添加更多I/O與3螢幕輸出等功能。

Pocket 4的預定上市日期為2025年1月,搭載Ryzen AI 9 HX 370處理器、64 GB記憶體、2 TB固態硬碟版本的預定售價為港幣10,390元(約合新台幣43,930元)。

加入T客邦Facebook粉絲團

Raspberry Pi Pico 2 W升級登場,加入Wi-Fi與藍牙功能

Raspberry Pi基金會繼8月推出Raspberry Pi Pico 2後,又推出加入Wi-Fi無線網路與藍牙等通訊功能的Raspberry Pi Pico 2 W。0a15660c0ed6d40e77699c3e1647ef40

Raspberry Pi基金會繼8月推出Raspberry Pi Pico 2後,又推出加入Wi-Fi無線網路與藍牙等通訊功能的Raspberry Pi Pico 2 W。

無線通訊更方便

Raspberry Pi Pico 2 W是款能夠用來製作各類裝置的簡易型微控制器開發板,它以先前推出的Raspberry Pi Pico 2為基礎,同樣以RP2350系列微控制器作為硬體中樞, 並加入Infineon CYW43439無線網路晶片,提供2.4 GHz頻段的Wi-Fi 4無線網路(IEEE802.11n)與藍牙5.4等無線通訊功能,讓創客不需額外安裝無線網路就能建立通訊,方便制作能夠遙控或傳輸資料的裝置。

延伸閱讀:Raspberry Pi Pico 2規格分析,開機過程可切換Arm、RISC-V架構

Raspberry Pi基金會在官方部落格回顧2021推出的初代Raspberry Pi Pico與對應的RP2040微控制器,提供2組Arm Cortex-M0+處理器核心與264KB SRAM,並支援多種高階語言與PIO(可程式化輸入輸出)子系統,成為社群玩家與專業工程師尋求性價比的首選。而RP2350微控制器則在此基礎上提供速度更快的處理器並支援浮點運算,以及容量更大的記憶體與OTP儲存媒體,不但電力效率有所改善,也支援TrustZone安全性功能,提供更多元的應用可能性。

Raspberry Pi Pico 2 W是加入無線通訊的加強版,與Raspberry Pi Pico 2相比在下方多出無線網路晶片。

Raspberry Pi Pico 2 W同樣以RP2350系列微控制器作為硬體中樞。

創客可以用這張尺寸小巧的開發板製作各種裝置。

Raspberry Pi Pico 2 W現已上市日期為,售價為美金7元(約合新台幣,元),比Raspberry Pi Pico 2高出2元。Raspberry Pi基金會也預告2025年將有更多關於Pico 2的消息,請大家保持期待。

加入T客邦Facebook粉絲團

Raspberry Pi Compute Module 5運算模組來了!價格美金45元起

Raspberry Pi基金會發表以「Pi5」為基礎的Compute Module 5運算模組,具有遠高於前代產品的效能,並維持產品相同尺寸。4e6afb7c0b2b1399ead7f004f120a571

Raspberry Pi基金會發表以「Pi5」為基礎的Compute Module 5運算模組,具有遠高於前代產品的效能,並維持產品相同尺寸。

提供多種記憶體、無線網路搭配組合

Raspberry Pi基金會表示,Raspberry Pi Compute Module運算模組系列產品在小巧的尺寸中整合各項核心功能,讓使用者更容易設計、客製化嵌入式裝置,除了 Raspberry Pi 2之外,後續每代產品都有衍生的運算,而現在也迎來了Raspberry Pi 5的模組化版本。

延伸閱讀:
Raspberry Pi運算模組4登場,尺寸與連接端子迎來大幅改變
Raspberry Pi 5終於來了!效能更高、內建PCIe匯流排還有實體電源鍵

Raspberry Pi Compute Module 5(以下簡稱CM5)與Raspberry Pi 5 Model B一樣搭載Broadcom BCM2712 SoC,具有時脈高達2.4GHz的4核心64bit Arm Cortex-A76處理器,每個核心擁有專屬512KB L2快取記憶體,整組處理器共享2MB L3快取記憶體。在記憶體與儲存部分提供1 / 2 / 4 / 8 GB LPDDR4-4267(具ECC錯誤校正功能)等選擇,儲存媒體則為0 / 16 / 32 / 64 GB eMMC,並可選擇是否具有Wi-Fi無線網路與藍牙5.0功能。

Raspberry Pi Compute Module 5運算模組的核心功能與「Pi5」相同,但是捨去正常尺寸的I/O端子以縮減尺寸。

CM5運算模組右上角有「實體」規格標示,可以一眼看出搭載的記憶體與eMMC儲存媒體容量。

官方母板、機殼一同登場

CM5的尺寸、機構位於與前代CM4同為5.5 x 4公分,並且同樣透過背面的高密度垂直連接端子(High-Density Perpendicular Connectors)提供下列I/O功能。

Raspberry Pi Compute Module 5運算模組I/O功能一覽
GbE乙太網路實體層(PHY)
1組PCIe Gen 2x1
1組USB 2.0 x1
2組USB 3.2 Gen 1
2組HDMI 2.0(支援4K60p雙螢幕輸出)
2組4通道MIPI(支援DSI影像與CSI-2攝影機)
最多30組GPIO(支援1.8或3.3 V電壓,包含最多5組UART、5組I2C、5組SPI、1組SDIO、1組DPI、1組I2S、4組PWM通道、3組GPCLK輸出)

Raspberry Pi基金會同時推出對應CM5的擴充母板(IO Board)與機殼,擴充母板尺寸為16 x 9公分,提供標準40-pin GPIO,USB 3.2 Gen 1、標準尺寸HDMI 2.0、MIPI DSI/CSI-2軟排線端子各2組,以及GeE RJ-45乙太網路(支援PoE)、M.2 2280插槽、microSD讀卡機、4-pin風扇端子、RTC電池座、USB Type-C電源輸等端子各1組,並提供實體開關電源按鍵。

官方版本外殼(IO Case)採用金屬材質,可以把CM5與擴充母板變成完整的封裝工業級電腦,機殼內建的風扇可以連接到擴充母板風扇端子,強化散熱效果。

此外Raspberry Pi基金會也推出CM5專用鋁質散熱片,能夠加強對SoC、記憶體、eMMC、無線網路晶片的散熱。而天線套件則與CM4相同,可以將無線通訊的天線拉至機殼外部,以強化收訊品質。

Raspberry Pi基金會也為CM5推出多種周邊配件。

擴充母板的尺寸為16 x 9公分,提供多種I/O端子。

CM5透過背面的高密度垂直連接端子連接至擴充母板就可使用各種I/O功能,使用者也可以根據使用與尺寸需求,自行設計不同的擴充母板。

外殼與擴充母板的I/O相互搭配,並具有1組散熱風扇。

鋁質散熱片能夠加強對SoC、記憶體、eMMC、無線網路晶片的散熱。

天線套件則可強化收訊品質。

Raspberry Pi Compute Module 5運算模組現已發售,價格由美金45元(約合新台幣1,475起,4 GB 記憶體、32 GB eMMC、具無線網路與藍牙功能的版本參考價格為美金70元(約合新台幣2,300元)。

加入T客邦Facebook粉絲團

NVIDIA總部解密,以《星際爭霸戰》命名的Endeavor、Voyager大樓

筆者在GTC 2024春季場時趁機參訪了NVIDIA位於美國加州聖塔克拉拉的總部,讓我們一起去看看最新落成的Endeavor、Voyager等2棟大樓。Ceeb509350dc2673f797ef8542f15173

筆者在GTC 2024春季場時趁機參訪了NVIDIA位於美國加州聖塔克拉拉的總部,讓我們一起去看看最新落成的Endeavor、Voyager等2棟大樓。

採用RTX先模擬、再興建

由於筆者是在GTC 2024春季場期間前往NVIDIA總部,所以當時也有許多員工戒展期邀請家屬前來參觀,以致現場人潮較多。NVIDIA官方為維護相關人員隱私,故參觀流程中禁止攝影,僅開放於少數定點拍照,所以本文的圖片數量會較為貧乏,也請讀者海涵。

延伸閱讀:GTC 2024春季場系列報導

NVIDIA總部的Endeavor與Voyager等2棟大樓分別落成於2017年與2021年,其中Endeavor透過橫跨San Tomas快速道路的天橋連接至總部舊大樓區。

新建的Endeavor與Voyager分別以科幻影集《星際爭霸戰》的奮進號、旅行者號太空船命名,而其字首發音也分別與NVIDIA的「N」、「VI」諧音,所以導覽人員也打趣地說,位於印度預計完工的下一棟大樓將要以「D」進行命名。

Endeavor與Voyager都導入綠建築的概念,考慮自然採光與通風等要素,以節省能源消耗,而在這個過程當然會透過NVIDIA的3D繪圖技術進行模擬,在設計階段就能精確模擬完工後的狀態,並在實際動工前就修正潛在的問題。

而導覽人員不忘宣傳自家的RTX技術,在設計Endeavor時還RTX尚未問世,雖然還是可以進行光線追蹤運算,但效能表現比較低落,而到了設計Voyager的時候,則可透過RTX的硬體光線追蹤運算與DLSS加速模擬渲染,大幅提升工作效率。

NVIDIA位於美國加州聖塔克拉拉總部的空拍照。圖中左下方為Endeavor,右上方為Voyager。(圖片來源:NVIDIA)

Endeavor與Voyager透過有Nest(鳥巢)之稱天幕遮蔽的廣場相連,也有天橋前往舊園區。(圖片來源:NVIDIA)

從Google地圖可以看到Endeavor外型偏向三角型,而Voyager較接近六角型。(圖片來源:Google)

筆者趁著GTC 2024春季場期間前往NVIDIA總部參觀。

搭車前往的訪客須在接送點下車,再走過天橋進入Endeavor,或是沿無障礙坡道進入Voyager。

Endeavor與Voyager中間有個廣場,上方稱為Nest的天幕設有太陽能發電板。

三角型VS四邊型

以Voyager為例,其設計概念為山谷,除了具有沿襲自Endeavor同時也是NVIDIA官方視覺圖像常見的三角型元素之外,也加入了更多四邊型元素,這2種幾合圖型元素分別象徵山與谷。

Voyager建築內部採挑高設計,並在建立了有如中央山脈的4層房間,除了有辦公室、研究室之外,也有員工餐廳、飲料吧、舞台等設施,並提供許多開放式的會議空間。

如同飄降於山峰的雨水匯集後經由山谷流向三角洲,NVIDIA相信開放空間能匯集員工,不但能讓同事相互打招呼、噓寒問暖,也有助於討論工作事項、激發更多創意。

值得注意的是,雖然Endeavor與Voyager內部相當寬氅,但是並沒有回音,主要的原因是在設計過程中就考慮到這個問題,因此在天花板與牆面鋪設了厚達30公分的隔音與隔熱材料,除了能消除回音之外,也能節省空調所消耗的能源。

新落成的Voyager以山谷為設計概念。(圖片來源:NVIDIA)

Voyager內部挑高相當宏偉,並以4層樓的「山峰」。

從Voyager的「稜線」往前看,可以看到建築內部有許多三角型的元素。

然後往後看,則可看到許多四邊型的元素。

說到員工餐廳,大家應該會覺得NVIDIA應該會有免費提供讓人稱羨的員工餐,但導覽人員卻說公司只提供3種免費的東西「空氣、椅子、咖啡」。

由於公司發現提供免費的餐點會造成員工比較不愛惜食物,常常會發生拿太多吃不完而丟棄的情況,這時承包商為了降低成本,就會發生餐飲品質降低的情況。於是公司決定酌收些許費用,反而讓大家只拿取適量的食物,減少食物浪費,承包商也能將相同的成本花費在提升品質,而不是提供更多份量。

接下來或許我們會在某場發表會中,看到NVIDIA分享如何透過AI提升員工餐服務品質的案例吧。

加入T客邦Facebook粉絲團

AAEON UP 710S超迷你單板電腦,信用卡尺寸搭載x86架構Intel Alder Lake-N處理器

AAEON UP 710S是款尺寸有如Raspberry Pi,但是卻搭載x86架構處理器的單板電腦,最高可選擇Intel Processor N200。7cdd1092e93882cab89d78a739cf8fef

AAEON UP 710S是款尺寸有如Raspberry Pi,但是卻搭載x86架構處理器的單板電腦,最高可選擇Intel Processor N200。

超迷你x86電腦

UP 710S的尺寸為8.5 x 5.6公分,機身最厚處為2.513公分,整體尺寸與Raspberry Pi 5 Model B差不多,但是它卻不是採用Arm架構處理器,而是x86架構的Intel Alder Lake-N處理器。

延伸閱讀:Aaeon推出GENE-EHL7單板電腦,搭載Elkhart Lake世代Intel Atom、Celeron系列處理器

UP 710S提供Intel Processor N200 / N100 / N97 / N50等4種處理器選擇,最高階的Intel Processor N200採用4核4緒配置,最高Turbo時脈達3.7 GHz,並整合32組執行單元(EUs)、最高時脈達750 MHz的UHD Graphics內建顯示晶片,TDP為6 W。

UP 710S最高可選8 GB LPDDR5記憶體以及128 GB eMMC儲存媒體,但不支援SATA、M.2 NVMe、microSD記憶卡等儲存媒體,主機板背面提供1組可以安裝無線網路卡的M.2 2230 E-Key插槽,並提供3組USB 3.2 Gen 2端子,以及HDMI 1.4b、GbE乙太網路端子各1組,可透過Wafer排線擴充2組USB 2.0端子,以及I2C、PWM、SPI、GPIO、RS-232/422/485等端子。

UP 710S是款x86架構單板電腦,尺寸為8.5 x 5.6公分,與Raspberry Pi 5 Model B接近。

主機板正面具有處理器、各種連接端子,以及12V電源輸入端子台。

主機板背面則有M.2 2230 E-Key插槽,能夠加裝無線網路卡。

主機板側面提供3組USB 3.2 Gen 2端子,以及HDMI 1.4b、GbE乙太網路端子各1組。

UP 710S取消了先前UP Board系列產品的40-pin HAT擴充腳針,改以透過Wafer排線擴充GPIO、I2C、SPI、COM等端子。

AAEON尚未公布UP 710S的上市日期與售價,但根據經驗日後應該可以透過Aaeon eShop網路商店以零售型式購買。

加入T客邦Facebook粉絲團

NVIDIA公布MLPerf Training 4.1測試成績,DGX B200系統GPU效能提升最高達2.2倍

NVIDIA在最新公布的MLPerf Training 4.1測試成績中揭露,Blackwell系列GPU之效能表現最高可達前代產品之2.2倍,並強調自家提供的完整AI解決方案。7b02732e626ce750fb64c1448b6d6487

NVIDIA在最新公布的MLPerf Training 4.1測試成績中揭露,Blackwell系列GPU之效能表現最高可達前代產品之2.2倍,並強調自家提供的完整AI解決方案。

GPU單位效能再創新高

MLPerf是由學術界、研究實驗室和業界人士共同組成組織旨在打造公正且能夠反映實際應用情境的AI運算測試基準。最新MLPerf Training 4.1 AI模型訓練效能測試的內容包含Stable Diffusion v2文字生成圖像、GPT-3 175B與Llama 2 70B大型語言模型、R-GAT圖像神經網路、BERT自然語言處理、RetianNet物件偵測的模型訓練與微調。

延伸閱讀:NVIDIA公布MLPerf 4.1推論測試結果,首見Blackwell與FP4成績

舉例來說,更新軟體核心(Kernel)改善矩陣相乘的效能並改善GPU(繪圖處理器)中Tensor核心的運算效率,就能達到提高許多深度學習(Deep Learning)的運算效能。透過這種方式,NVIDIA將H100的單GPU訓練效能提高了30%,

另一種提高效能表現的方式,就是改善多GPU叢集的連接與網路環境。透過NVLink、NVSwitch、Quantum-2 InfiniBand網路等高速連接技術組成的11,616組Hopper GPU運算叢集,能在GPT-3 175B訓練測試提高了3倍以上效能。

而最「簡單有效」的解決方案,當然還是升級至新一代GPU。NVIDIA表示採用Blackwell平台的Nyx超級電腦在Llama 2 70B大型語言模型微調的每GPU效能表現為前代H100的2.2倍,而GPT-3 175B預訓練則為2倍,且提交了所有測試項目之成績。

NVIDIA也將自己定位為資料中心平台公司,在累積多年的開發成果後,能夠提供完整的軟、硬體堆疊,在硬體方面小至晶片、大至機櫃甚至資料中心,軟體部分則從最基礎的晶片、系統、叢集軟體與驅動程式,到運算API與函數庫,都有對應的技術與產品,能夠解決企業的加速運算與AI運算需求。

MLPerf Training 4.1訓練測試包含Stable Diffusion v2文字生成圖像、GPT-3 175B與Llama 2 70B大型語言模型、R-GAT圖像神經網路、BERT自然語言處理、RetianNet物件偵測的模型訓練與微調。

既有的Hooper GPU在NVSwitch交換器的協助下較先前首次提交MLPerf Training 4.1訓練測試成績成長30%,且最高可串接11,616組GPU,是目前效能最佳的解決方案。

Hooper GPU搭配NVSwitch交換器也對AI推論有所幫助,能提高Llama 3.1效能90%,或是讓生成第1組字詞(Time to First Token)的速度提升至3倍。

Blackwell GPU的MLPerf Training 4.1訓練測試成績最高可達到前代產品的2.2倍。

在軟、硬體最佳化整合的助益下,HGX B200的大型語言預訓練效能可達HGX A100的12倍,或是HGX H100的2倍。

NVIDIA的AI運算解決方案包含完整的軟、硬體堆疊,包含各種晶片、連接、機櫃、散熱等硬體,以及晶片、系統、叢集、API、函數庫等不同層級的軟體。

NVIDIA的「1年節奏」(One Year Rhythm)包含晶片設計與生產、資料中心驗證、快速布署,協助客戶加速導入AI轉型。

NVIDIA計劃於2024年推出Blackwell運算平台,並於2025年更新至Blackwell Ultra加強版,2026年則會推出Rubin運算平台。

另一方面,NVIDIA也重申「1年節奏」(One Year Rhythm)的產品更新規劃,包含晶片、機櫃、資料中心等不同層級的組合,讓企業能夠根據自身需求選擇最新的解決方案。

加入T客邦Facebook粉絲團

再次香爆!OneXPlayer推出OneXFly F1 Pro EVA貳號機聯名版掌上型電腦與外接顯示晶片

OneXPlayer OneXFly F1 Pro是款搭載AMD Ryzen AI 9 HX 370處理器的掌上型主機型式電腦,並推出以動畫《新世紀福音戰士7a8078538278931f5494cd3f00084d17

OneXPlayer OneXFly F1 Pro是款搭載AMD Ryzen AI 9 HX 370處理器的掌上型遊戲機型式電腦,並推出以動畫《新世紀福音戰士》貳號機為主題的聯名限定版。

香爆聯名再一發

Asus在2023年推出了動畫《新世紀福音戰士》劇中主角明日香及她所駕駛的「汎用人型決戰兵器貳號機」為主題的主機板、機殼等零組件。到了2024年OneXPlayer則推出相同主題的OneXFly F1 Pro EVA貳號機聯名版掌上型遊戲機型式電腦,以及搭載AMD Radeon RX 7800M顯示晶片的外接式擴充底座。

延伸閱讀:
[掃雷組] Asus ROG x Evangelion聯名系列襲來:香爆警戒,開香!
AMD Ryzen AI 9 HX 370效能實測:Asus TUF Gaming A16內顯、AI效能大躍進,還有獨顯火力支援

既然是與明日香與貳號機為主題的聯名款,自然需要採用紅色機身,並在機身加入相關相關圖案,除此之外位於Windows 11作業系統中的OneXPlayer專屬快捷選單也同樣加入《新世紀福音戰士》視覺元素,讓玩家在調整設定時能夠沉浸於劇中的世界觀。

OneXPlayer OneXFly F1 Pro EVA聯名版掌上型遊戲機型式電腦採用明日香與貳號機作為主題。

除了電腦之外,還有對應的AMD Radeon RX 7800M外接顯示晶片擴充底座。

機身採用鮮明的紅、橘配色,正面具有貳號機與「Emergency六角」圖案,背面則有明日香圖案與散熱進氣口。

機身頂部具有RB、RT、LB、LT以及額外2個自定按鍵,還有電源、音量鍵,並具有散熱出風口。

系統的快捷選單也融入《新世紀福音戰士》視覺元素,不確定是否僅提供簡體中文介面。(身為狂熱粉絲需要批評一下,沒有還原劇中超級電腦「MAGI」的介面風格相當可惜)

搭載最強內顯還可外接顯示晶片

OneXFly F1 Pro EVA聯名版搭載Ryzen AI 9 HX 370處理器,具有4組Zen 5與8組Zen 5c處理器核心,總共為12核24緒配置,最高Turbo時脈分別為5.1 GHz、3.3 GHz,並搭配具有16組運算單元(CUs)、RDNA 3.5架構的Radeon 890M內建顯示晶片。

需要注意的是雖然Ryzen AI 9 HX 370處理器的cTDP(可配置熱設計功耗)最高可達54 W,但從下方的快捷選單圖片中看出,可設定的功耗最高僅為30 W,應為權衡散熱與續航力的限制,但可能會造成效能無法完全展現的副作用。

聯名版擴充底座具有USB Type-C與OCuLink介面(但電腦主機只有USB4),整合Radeon RX 7800M顯示晶片,並提供2組DisplayPort、1組HDMI影音輸出端子,以及2組USB與microSD讀卡機、RJ-45乙太網路端子各1組,連接後可以為主機充電,同時提供更強的遊戲效能並擴充連接能力。

OneXFly F1 Pro搭載Ryzen AI 9 HX 370處理器、解西度達1080p、144p的7吋顯示器。

從快捷選單可以看到cTDP的調整上限為30 W。

其機身正面按鍵採用薄膜機構,RB、LB採用微動開關,RT、LT則採用霍爾感應器。

內建的喇叭經Harman認證,可以確保較佳音效體驗。

聯名擴充底座整合Radeon RX 7800M顯示晶片,並提供豐富I/O端子。

OneXFly F1 Pro規格表,出廠預載Windows 11作業系統。

OneXFly F1 Pro EVA貳號機聯名版現已開始預購,預計於2024年11月30日上市,32GB記憶體搭配2TB固態硬碟版本售價為人民幣9999元(約合新台幣45,365元)。

加入T客邦Facebook粉絲團

《決勝時刻:黑色行動6》搭配AMD FSR 3.1效能禁藥實測,預告將推出AI基礎的下代技術

AMD在FSR 3.1強化畫質呈現,並讓FSR畫格生成能與其他顯示卡廠商之升頻技術併用,也預告將在2025年推出以機器學習為基礎的下代FSR技術。5433c51302664e46c34147e3cc648dd1

AMD在FSR 3.1強化畫質呈現,並讓FSR畫格生成能與其他顯示卡廠商之升頻技術併用,也預告將在2025年推出以機器學習為基礎的下代FSR技術。

本文使用之《決勝時刻:黑色行動6》序號由AMD提供

FSR 3.1技術分析

AMD在GPUOpen部落格更新了FSR 3.1的技術介紹,提到新版技術改善了畫面細節、殘影等效果,並支援Vulkan繪圖API,此外的一大改便是拆分升頻與畫格生成的運作流程,以改善畫質並讓其他廠商的升頻技術能與FSR畫格生成混搭用。

延伸閱讀:
AMD FSR 3真的來了!首波支援《魔咒之地》及《亙古魔戰》,還有全遊戲都可用的AFMF
AMD AFMF 2畫格生成效能禁藥再升級,疊加FSR 3猛上加猛效能實測!

FSR 3.0的運作過成會先套用升頻並同時產生動態向量(Motion Vector)、深度(Depth)等資料之後,再進行畫格生成。雖然這樣可以提高整體效能與品質,但缺點就是需要將2個流程綁定在一起。

FSR 3.1則會在升頻之前產生動態向量與深度等資料,如此一來便能讓FSR畫格生成搭配其他升頻技術協同運作。由於FSR除了支援AMD自家Radeon RX 5000系列之後的顯示卡之外,也支援NVIDIA GeForce RTX 20系列之後的顯示卡,因此讓不支援DLSS 3畫格生成的GeForce RTX 20、30系列,也能使用DLSS 2升頻混搭FSR 3.1畫格生成,帶來更流暢的視覺體驗。

AMD運算與顯示卡事業部的資深副總裁暨總經理Jack Huynh也在Ryzen 7 9800X3D的介紹影片中提到(3:27處),AMD與Activision共同在《決勝時刻:黑色行動6》遊戲中導入FSR 3.1,並持續合作開發以機器學習(Machine Learning)為基礎的下代FSR技術。

FSR 3.1除了改善畫質之外,最大的改變在於可以將升頻與畫格生成功能解耦,讓它們分別獨立運作。

FSR 3.1推出時支援6款遊戲,剛推出的《決勝時刻:黑色行動6》也加入支援。

▲AMD運算與顯示卡事業部的資深副總裁暨總經理Jack Huynh在影片3:27處提到,AMD與Activision共同在《決勝時刻:黑色行動6》遊戲中導入FSR 3.1,並持續合作開發以機器學習為基礎的下代FSR技術。

FSR 3.1效能實測

接下來筆者使用《決勝時刻:黑色行動6》來測試FSR3.1的效果,過程使用遊戲內建的效能測試工具以4K解析度、最高畫質進行2輪測試,在確定沒有極端值後取平均,並附上使用AverMedia GC553G2擷取盒以4K、60p解析度錄製展示影片作為畫質參考。

測試平台:
處理器:AMD Ryzen 7 9800X3D
散熱器:MSI MEG Coreliquid S360
主機板:GIGABYTE X870E AORUS MASTER
記憶體:G.Skill Trident Z5 Neo RGB 16GBx2(@DDR5-6000)
顯示卡:AMD Radeon RX 7800 XT
儲存裝置:Samsung 990 Pro 1TB
電源供應器:MSI MEG Ai1300P PCIE5
軟體環境:Windows 11專業版23H2(Build 22361.4391),Adrenalin 24.10.1

《決勝時刻:黑色行動6》支援FSR 3.1技術,並可選擇升頻強度與是否開啟畫格生成功能。

▲《決勝時刻:黑色行動6》4K解析度、最高畫質的畫面展示。

▲《決勝時刻:黑色行動6》開啟FSR升頻(平衡)功能的畫面展示。

▲《決勝時刻:黑色行動6》開啟FSR升頻(平衡)加上畫格生成功能的畫面展示。

開啟FSR升頻(平衡)大約可以帶來9.33%的效能增益,搭配畫格生成可以帶來總共70.67%增益。

從上述測試數據可以看到,《決勝時刻:黑色行動6》在Radeon RX 7800 XT原本就能在4K解析度、最高畫質提供平均FSP超過60幀的效能表現,加上FSR升頻即可達到82幀,提供較低的操作延遲。

若玩家想要追求更低的延遲,則建議進一步提高FSR升頻的強度,透過犧升部分畫質的條件提升FPS並降低延遲。需要注意的是,透過畫格生成提升的FSP並不會降低操作延遲,所以對於《決勝時刻:黑色行動6》這類遊戲並無競技優勢,但玩家仍可感受更流暢的視覺體驗。

加入T客邦Facebook粉絲團
❌