T客邦 August 09, 2023
NVIDIA於SIGGRAPH 2023電腦圖像大會宣布多項消息,並發表搭載141GB HBM3e的GH200 Grace Hopper Superchip,以及多款專業運算卡。936caafefe14211e7a30923931358d0b

NVIDIA於SIGGRAPH 2023電腦圖像大會宣布多項消息,並發表搭載141GB HBM3e的GH200 Grace Hopper Superchip,以及RTX 5000、RTX 4500、RTX 4000等專業運算卡。

協助開發者訓練大型模型

NVIDIA與美國機器學習公司Hugging Face宣布合作提供生成式AI運算服務,協助開發者訓練大型語言模型(LLM)和各式AI相關應用程式、模型。

Hugging Face將在未來幾個月內推出名為「訓練叢集即服務」(Training Cluster as a Service)的新服務,讓開發者能在Hugging Face平台上利用NVIDIA DGX Cloud AI 超級運算服務訓練和調整AI模型,有助推動大型語言模型、聊天機器人、搜尋和摘要等應用程式,以簡化企業建立全新自訂生成式AI模型的過程。

受益於整合DGX Cloud,開發者只需在Hugging Face平台點擊幾下滑鼠,就能利用NVIDIA多節點AI超級運算平台,每個DGX Cloud執行個體都搭載8組H100或A100 GPU,合計GPU記憶體容量高達640GB,搭配高效能、低延遲的NVIDIA網路結構,確保工作負

此外NVIDIA也宣布推出NVIDIA AI Workbench,讓開發者在桌上型電腦或工作站建立整合易用的工作空間,以利快速建立、測試和自訂預先訓練生成式AI大型語言模型,然後再部署至資料中心、公有雲或 NVIDIA DGX Cloud。

開發者只需在Hugging Face平台點擊幾下滑鼠,就能利用NVIDIA DGX Cloud超級運算平台訓練AI模型。 ▲ 開發者只需在Hugging Face平台點擊幾下滑鼠,就能利用NVIDIA DGX Cloud超級運算平台訓練AI模型。

擴大OpenUSD生態系統

NVIDIA先前也透過AOUSD聯盟推廣OUSD格式3D描述檔案,這次則是宣布推出Omniverse平台重大升級。

Omniverse是用於連接、描述和模擬各種基於OpenUSD的3D工具及應用程式的軟體平台,這次更新加快了建立虛擬世界與工業數位化的先進工作流程,Cesium、Convai、Move AI、SideFX Houdini、Wonder Dynamics等開發環境已可透過 OpenUSD連接到Omniverse平台,為開發者與企業提供嶄新的基礎應用程式及服務,利用OpenUSD框架和生成式AI改善並加速3D開發工作流程。

圖庫公司Shutterstock也宣布推出基於NVIDIA Picasso生成式AI的服務,透過完全授權、保留使用版權的資料所開訓練的AI模型,讓使用者只需輸入簡單的文字或圖片提示,就能快速產生360度、8K解析度、高動態範圍成像(HDRi)的環境貼圖。

過去建立3D場景需要購買昂貴的360度攝影機,從頭開始建立背景和環境貼圖,或者要從可能無法精確匹配的現有貼圖資源中挑選。而現在使用者只需提供文字或圖片提示,Picasso的360 HDRi服務就能速生成全景圖像,使用者還可以自訂貼圖、快速反覆調整修改各種想法,直到出現滿意的結果,大幅簡化產生3D場景的工作流程。

另一方面,Autodesk也利用Picasso的基礎模型所開發出的生成式人工智慧內容創作服務,與3D開發軟體Maya整合,讓使用者免去處理繁瑣的工作,盡情發揮天馬行空的創意。

Omniverse整合OpenUSD格式與多種生成式AI服務,簡化3D開發流程。 ▲ Omniverse整合OpenUSD格式與多種生成式AI服務,簡化3D開發流程。

全新硬體助陣

NVIDIA這次推出最「大樣」的產品是強化版的GH200 Grace Hopper Superchip,它以先前發表的Grace Hopper Superchip為基礎,但將原本最高搭載96GB HBM3的GPU記憶體擴展至141GB HMB3e,不但提供更高的頻寬與傳輸速度,容量也有所提升,對於AI運算來說有相當大的幫助。

NVIDIA也推出RTX 5000、RTX 4500、RTX 4000等專業運算卡,它們採用最新Ada Lovelace架構,搭載單精度浮點運算效能達前代產品2倍的全新CUDA核心,以及第3代光線追蹤核心與第4代Tensor核心,大幅提升光線追蹤與AI運算效能,並擴展對FP8資料格式的支援度。

新推出的運算卡也搭載容量更大的GPU記憶體,3款產品分別搭載32GB、24 GB、20GB GDDR6記憶體,均支援ECC(修正錯誤代碼),可對大型3D模型、渲染影像、模擬和AI進行無錯誤運算。

NVIDIA也與BOXX、Dell、HP、Lenovo等製造商合作推出新款RTX工作站,最多可安裝4張RTX 6000運算卡,達到總合5,828TFLOPS的AI運算效能與192GB GPU記憶體。另可視需求在系統內部署NVIDIA AI Enterprise或Omniverse Enterprise,以處理各種生成式AI和圖形密集型工作負載。

NVIDIA也推出搭載新款L40S GPU的OVX伺服器,每組OVX伺服器最多可安裝8組L40S GPU,張量(Tensor)運算超過1.45 PFLOPS。

L40S也是Ada Lovelace世代架構,配備48GB GPU記憶體,具有18,176組CUDA核心,單精度浮點運算(FP32)效能幾乎是A100 GPU的5倍,此外還有142組第三代RT核心,提供212TFLOPS的光線追蹤運算效能,以支援實時渲染、產品設計和創作3D內容、影片處理和工業數位化等專業視覺化工作流程。

NVIDIA創辦人兼執行長黃仁勳於SIGGRAPH 2023展示GH200 Grace Hopper Superchip。 ▲ NVIDIA創辦人兼執行長黃仁勳於SIGGRAPH 2023展示GH200 Grace Hopper Superchip。

GH200 Grace Hopper Superchip最大的特色就是載141GB HMB3e GPU記憶體。 ▲ GH200 Grace Hopper Superchip最大的特色就是搭載141GB HMB3e GPU記憶體。

RTX 5000運算卡產品定位低於現有的RTX 6000,FP32運算效能為65.3 TFLOPS,記憶體容量由48GB下降為32GB,價格也由美金6,800元下降為4,000元。 ▲ RTX 5000運算卡產品定位低於現有的RTX 6000,FP32運算效能為65.3 TFLOPS,記憶體容量由48GB下降為32GB,價格也由美金6,800元下降為4,000元。

RTX 4500運算卡載24GB記憶體,FP32運算效能為39.6 TFLOPS,價格為美金2,250元。 ▲ RTX 4500運算卡搭載24GB記憶體,FP32運算效能為39.6 TFLOPS,價格為美金2,250元。

RTX 4000運算卡載20GB記憶體,FP32運算效能為26.7 TFLOPS,價格則為美金1,250元。 ▲ RTX 4000運算卡搭載20GB記憶體,FP32運算效能為26.7 TFLOPS,價格則為美金1,250元。

新款RTX工作站最多可安裝4張RTX 6000運算卡。 ▲ 新款RTX工作站最多可安裝4張RTX 6000運算卡。

L40S的非Tensor核心峰值FP32運算效能可達91.6 TFLOPS。 ▲ L40S的非Tensor核心峰值FP32運算效能可達91.6 TFLOPS。

對更多NVIDIA在SIGGRAPH 2023所發表的資訊有興趣的讀者,可以前往NVIDIA特設網站,或觀看主題演講重播

加入T客邦Facebook粉絲團 固定链接 'NVIDIA於SIGGRAPH 2023宣布多項生成式AI、3D開發消息,同時發表GH200 Grace Hopper Superchip與多款專業運算卡' 提交: August 9, 2023, 5:00pm CST