GH200 Grace芯片搭載全球首款HBM3e處理器,可通過英偉達的NVLink技術連接其他GH200芯片,計劃明年二季度投產。
今日,Nvidia 首席執行官黃仁勛在洛杉磯舉行的SIGGRAPH 2023計算機圖形會議上發表演講,宣布了一系列新技術。這些技術亮點包括下一代GH200 Grace Hopper Superchip 平臺、NVIDIA DGX Cloud AI 超級計算登陸 Hugging Face、NVIDIA AI Workbench(一種新的統一工具包,可在 NVIDIA AI 平臺上引入簡化的模型調整和部署)以及具有生成式 AI 和 OpenUSD 的 NVIDIA Omniverse 重大升級等。
?
?NVIDIA 推出革命性 GH200 Grace Hopper超級芯
用于人工智能和高性能計算的革命性 GH200 Grace Hopper 超級芯片的亮相,是這場會議最大的亮點。
NVIDIA 今天宣布推出下一代 NVIDIA GH200 Grace Hopper 平臺,該平臺基于配備全球首款 HBM3e 處理器的全新 Grace Hopper 超級芯片,專為加速計算和生成式 AI 時代而打造。
該新平臺旨在處理世界上最復雜的生成式人工智能工作負載,涵蓋大型語言模型、推薦系統和矢量數據庫,將提供多種配置。
與當前一代產品相比,雙配置的內存容量增加了 3.5 倍,帶寬增加了 3 倍,包括一臺具有 144 個 Arm Neoverse 核心、8 petaflops 的 AI 性能和 282GB 最新 HBM3e 內存技術的服務器。
NVIDIA 創始人兼首席執行官黃仁勛表示:“為了滿足生成式 AI 不斷增長的需求,數據中心需要具有特殊需求的加速計算平臺。新的 GH200 Grace Hopper Superchip 平臺提供了卓越的內存技術和帶寬,以提高吞吐量、連接 GPU 以不妥協地聚合性能的能力,以及可以在整個數據中心輕松部署的服務器設計。”
新平臺使用Grace Hopper Superchip,它可以通過NVIDIA NVLink 與額外的Superchip連接,使它們能夠共同部署用于生成AI的巨型模型。這種高速、一致的技術使 GPU 能夠完全訪問 CPU 內存,在雙配置時提供組合的 1.2TB 快速內存。
HBM3e 內存比當前 HBM3 快 50%,提供總共 10TB/秒的組合帶寬,使新平臺能夠運行比之前版本大 3.5 倍的模型,同時通過快 3 倍的內存帶寬提高性能。
對 Grace Hopper 的需求不斷增長
領先的制造商已經提供基于之前發布的 Grace Hopper Superchip 的系統。為了推動該技術的廣泛采用,采用 HBM3e 的下一代 Grace Hopper Superchip 平臺與今年早些時候在 COMPUTEX 上推出的NVIDIA MGX服務器規范完全兼容。借助 MGX,任何系統制造商都可以快速且經濟高效地將 Grace Hopper 添加到 100 多種服務器版本中。領先的系統制造商預計將在 2024 年第二季度交付基于該平臺的系統。
?NVIDIA DGX Cloud AI 超級計算登陸 Hugging Face
NVIDIA 的 DGX Cloud AI 超級計算現在可通過 Hugging Face供那些想要訓練和微調在 Hugging Face 市場上找到的生成式 AI 模型的人們使用。希望將生成式人工智能用于高度具體工作的組織通常需要根據自己的數據對其進行訓練,這是一個可能需要大量帶寬的過程。
DGX Cloud 在 Hugging Face 頁面上的外觀示例 來源:NVIDIA
“Hugging Face 和 NVIDIA 之間的關系非常自然,Hugging Face 是找到所有起點的最佳場所,而 NVIDIA DGX Cloud 則是使用這些模型進行生成式 AI 工作的最佳場所,”Manuvir Das 說道。
DGX Cloud 包括 NVIDIA Networking(高性能、低延遲結構)和 8 個 NVIDIA H100 或 A100 80GB Tensor Core GPU,每個節點總共有 640GB GPU 內存。
Hugging Face 中的 DGX Cloud AI 培訓將產生額外費用,但 NVIDIA 并未詳細說明費用是多少。這項共同努力將在未來幾個月內開始實施。
Hugging Face 聯合創始人兼首席執行官 Clément Delangue 在 NVIDIA 新聞稿中表示:“世界各地的人們正在利用生成式 AI 工具建立新的聯系和發現,而我們仍處于這一技術轉變的早期階段。?”?“我們的合作將把 NVIDIA 最先進的 AI超級計算引入 Hugging Face,讓企業能夠通過開源將 AI 命運掌握在自己手中。”
?AI企業4.0揭曉
NVIDIA 的 AI Enterprise 是一套用于構建生成式 AI 解決方案的 AI 和數據分析軟件,很快將轉向 4.0 版本。該版本的主要變化是添加了 NeMo,這是一個用于生成 AI 管理、訓練定制、推理、護欄等的自定義工具平臺。NeMo 帶來了一個云原生框架,用于構建和部署使用大型語言模型的企業應用程序。
機器學習提供商 ClearML、Domino Data Lab、Run:AI 和 Weights & Biases 已與 NVIDIA 合作,將其服務與 AI Enterprise 4.0 集成。
?
該圖顯示了 AI Enterprise 4.0 產品及其支持的生成式 AI 模型 來源:NVIDIA
AI Enterprise 4.0 與 NVIDIA AI Workbench 配合使用,后者是一個工作區,旨在讓組織能夠更輕松、更簡單地在 PC 或家庭工作站上啟動 AI 應用程序。借助 AI Workbench,項目可以在 PC、數據中心、公共云和 NVIDIA DGX 云之間輕松移動。此外,英偉達同時宣布了一系列推動生成式AI 發展的新技術。
?NVIDIA AI Workbench 加速全球企業采用定制生成式 AI
?
新的開發者工具包在 NVIDIA AI 平臺上引入了簡化的模型調整和部署 — 從 PC 和工作站到企業數據中心、公共云和 NVIDIA DGX 云?來源:nvidia
NVIDIA 今天宣布推出NVIDIA AI Workbench,這是一個易于使用的統一工具包,允許開發人員在 PC 上快速創建、測試和自定義預訓練的生成式 AI 模型工作站,然后將其擴展到幾乎任何數據中心、公共云或NVIDIA DGX 云。
AI Workbench 消除了企業 AI 項目入門的復雜性。通過在本地系統上運行的簡化界面進行訪問,它允許開發人員使用自定義數據從 Hugging Face、GitHub 和NVIDIA NGC 等流行存儲庫自定義模型。然后可以在多個平臺上輕松共享模型。
NVIDIA 企業計算副總裁 Manuvir Das 表示:“世界各地的企業都在競相尋找合適的基礎設施并構建生成式 AI 模型和應用程序。”“NVIDIA AI Workbench 為跨組織團隊創建基于 AI 的應用程序提供了一條簡化的路徑,這些應用程序在現代商業中日益變得至關重要。”
人工智能開發人員的新時代
雖然現在有數十萬個預訓練模型可用,但使用許多開源工具定制它們可能需要在多個在線存儲庫中尋找正確的框架、工具和容器,并采用正確的技能來定制針對特定用例的模型。
借助 NVIDIA AI Workbench,開發人員只需點擊幾下即可自定義和運行生成式 AI。它使他們能夠將開源存儲庫和 NVIDIA AI 平臺中的所有必要的企業級模型、框架、軟件開發套件和庫整合到一個統一的開發人員工具包中。
領先的 AI 基礎設施提供商(包括 Dell Technologies、Hewlett Packard Enterprise、HP Inc.、Lambda、Lenovo 和 Supermicro)正在采用 AI Workbench,因為它能夠增強其最新一代支持多 GPU 的桌面工作站、高端移動工作站和虛擬工作站。
擁有基于 Windows 或 Linux 的 NVIDIA RTX PC 或工作站的開發人員還能夠在本地 RTX 系統上啟動、測試和微調企業級生成式 AI 項目,并輕松訪問數據中心和云計算資源,以根據需要進行擴展。
全新 NVIDIA AI Enterprise 4.0 軟件推進 AI 部署
為了進一步加速生成式 AI 的采用,NVIDIA 發布了最新版本的企業軟件平臺NVIDIA AI Enterprise 4.0。它為企業提供采用生成式人工智能所需的工具,同時還提供可靠生產部署所需的安全性和 API 穩定性。
NVIDIA AI Enterprise 中新支持的有助于簡化生成式 AI 部署的軟件和工具包括:
lNVIDIA NeMo ,一個用于構建、定制和部署大型語言模型的云原生框架。借助 NeMo,NVIDIA AI Enterprise 為創建和自定義 LLM 應用程序提供端到端支持。
lNVIDIA Triton 管理服務,有助于自動化和優化生產部署。它允許企業在 Kubernetes 中自動部署多個NVIDIA Triton 推理服務器實例,并進行模型編排,以實現可擴展 AI 的高效運行。
lNVIDIA Base Command Manager Essentials集群管理軟件,可幫助企業在數據中心、多云和混合云環境中最大限度地提高 AI 服務器的性能和利用率。
NVIDIA AI Enterprise 軟件可讓用戶跨云、數據中心和邊緣構建和運行支持 NVIDIA AI 的解決方案,經認證可在主流 NVIDIA 認證系統、NVIDIA DGX 系統、所有主要云平臺和新發布的 NVIDIA RTX 上運行工作站。
領先的軟件公司ServiceNow?和Snowflake以及提供戴爾生成式 AI 解決方案的基礎設施提供商戴爾科技集團 (Dell Technologies ) 最近宣布,他們正在與 NVIDIA 合作,在其平臺上啟用新的生成式 AI 解決方案和服務。NVIDIA AI Enterprise 4.0 和 NVIDIA NeMo 的集成為客戶提供生產就緒的生成式 AI 基礎。
NVIDIA AI Enterprise 4.0 將集成到合作伙伴市場,包括Google Cloud和Microsoft Azure,以及通過 NVIDIA 云合作伙伴 Oracle Cloud Infrastructure。
此外,包括 Azure 機器學習、ClearML、Domino Data Lab、Run:AI 和 Weights & Biases 在內的 MLOps 提供商正在增加與 NVIDIA AI 平臺的無縫集成,以簡化生產級生成式 AI 模型的開發。
廣泛的合作伙伴支持
“戴爾科技集團和 NVIDIA 致力于幫助企業構建專門構建的人工智能模型,以獲得生成式人工智能的巨大機遇。借助 NVIDIA AI Workbench,開發人員可以利用完整的戴爾生成式 AI 解決方案組合在 PC、工作站和數據中心基礎設施上定制模型。”——Meghana Patwardhan,戴爾科技集團商業客戶端產品副總裁。
“大多數企業沒有專業知識、預算和數據中心資源來管理高度復雜的人工智能軟件和系統。我們期待 NVIDIA AI Workbench 通過在 HPE GreenLake 邊緣到云平臺上進行一鍵式訓練和部署來簡化生成式 AI 項目創建。”——Evan Sparks,HPE 人工智能首席產品官。
“作為最苛刻的數據科學和人工智能模型提供所需性能和效率的工作站市場領導者,我們與 NVIDIA 有著悠久的合作歷史。惠普正在采用下一代高性能系統,結合 NVIDIA RTX Ada Generation GPU 和 NVIDIA AI Workbench,為我們的企業客戶帶來生成式 AI 的力量,并幫助在云端和本地之間移動 AI 工作負載。”—— Jim Nottingham,惠普公司高級計算解決方案高級副總裁。
“聯想和 NVIDIA 正在幫助客戶克服部署復雜性,更輕松地實施生成式 AI,從而向市場提供變革性的服務和產品。NVIDIA AI Workbench 和 Lenovo AI-ready 產品組合使開發人員能夠利用其智能設備的強大功能并跨邊緣到云基礎設施進行擴展。”——Rob Herman,聯想工作站與客戶端 AI 副總裁兼總經理。
“VMware 和 NVIDIA 的長期合作伙伴關系通過提供針對 AI 工作負載優化的端到端企業平臺,幫助每個企業釋放 AI 的力量。我們共同努力,讓生成式人工智能在企業中更容易使用和實施。借助 AI Workbench,NVIDIA 為開發人員提供了一套強大的工具,幫助企業加速新一代 AI 的采用。借助新的 NVIDIA AI Workbench,開發團隊可以將 AI 工作負載從桌面無縫轉移到生產環境。”—— VMware AI 實驗室副總裁 Chris Wolf。
?NVIDIA Omniverse 開啟通往 OpenUSD 廣闊世界的門戶
?
NVIDIA 正在通過NVIDIA Omniverse 以及新的技術組合和云應用程序編程接口 (API)(包括 ChatUSD 和 RunUSD)推進 OpenUSD 的開發,OpenUSD 是一個 3D 框架,可實現軟件工具和數據類型之間的互操作性,以構建虛擬世界。以及新的NVIDIA OpenUSD 開發者計劃。
這些對 OpenUSD 的投資擴大了 NVIDIA與 Pixar、Adobe、Apple 和 Autodesk 共同創立的OpenUSD 聯盟 (AOUSD)的規模,該組織上周宣布將標準化 OpenUSD 規范。
NVIDIA 創始人兼首席執行官黃仁勛表示:“正如 HTML 引發了 2D 互聯網的重大計算革命一樣,OpenUSD 將引發協作 3D 和工業數字化時代。通過 NVIDIA Omniverse 和生成式 AI 的開發,NVIDIA 將全力支持 OpenUSD 的進步和采用。”
OpenUSD 走向云端NVIDIA 宣布推出四個由 NVIDIA 構建的新Omniverse Cloud API,供開發人員更無縫地實施和部署 OpenUSD 管線和應用程序。
ChatUSD :為開發人員提供的大型語言模型 (LLM) 副駕駛,可以回答美元知識問題或生成 Python-USD 代碼腳本。ChatUSD 使用 USD 函數和 NVIDIA 的 Python-USD 代碼片段進行了微調。
RunUSD :?一種云 API,通過檢查上傳文件與 OpenUSD 版本版本的兼容性,并使用 Omniverse Cloud 生成渲染,將 OpenUSD 文件轉換為完全路徑跟蹤的渲染圖像。目前, NVIDIA OpenUSD 開發者計劃中的開發者可以使用該 API 的演示。
DeepSearch:一種 LLM 代理,可通過未標記資產的海量數據庫進行快速語義搜索。
USD-GDN Publisher:一項一鍵式服務,使企業和軟件制造商能夠從基于 Omniverse 的應用程序(例如USD Composer )向 Omniverse 云圖形交付網絡(GDN)發布高保真、基于 OpenUSD 的體驗,以及實時流式傳輸到網絡瀏覽器和移動設備。
不斷發展的 OpenUSD 功能
OpenUSD 的發明是為了更好地連接電影和動畫管線。工業應用(例如構建可互操作的制造設計管線、創建物理精確的工廠實時數字孿生,或訓練和驗證自動駕駛車輛)對 3D 框架有不同的要求。
為了支持這些高度復雜的工業和感知 AI 工作負載,NVIDIA 正在開發 NVIDIA Omniverse(用于開發應用程序的 OpenUSD 原生軟件平臺)以及包括地理空間數據模型、指標組裝和模擬就緒(或 SimReady)在內的技術(OpenUSD規范) 。
OpenUSD 的地理空間數據模型允許用戶為工廠、倉庫、城市甚至地球的真實數字孿生開發模擬和計算。對于極端規模的項目,它會考慮行星的曲率以確保模擬在物理上準確。
工業應用程序結合了來自許多工具和來源的數據集,每個工具和來源都以不同的單位表示。NVIDIA 正在為 OpenUSD 開發一個指標組件,使用戶能夠完全準確地組合不同的數據集。
NVIDIA 還在開發新 SimReady 3D 模型的結構。這些將包括真實的材料和物理特性,這對于準確訓練自主機器人和車輛至關重要。例如,負責分揀包裹的自主機器人需要在 3D 包裹上進行模擬訓練,使其像在現實世界中一樣移動并對物理接觸做出反應。
通過NVIDIA OpenUSD 開發者計劃,盡早訪問 OpenUSD 服務、資源和工具。其中包括由 NVIDIA 設計師和藝術家構建的兩個全新的完全可分發的 OpenUSD 示例場景 - 稱為 Da Vinci's Workshop 和 Riverfront Tower。
?生成式 AI 和 OpenUSD 的主要 Omniverse 升級
Omniverse 是一個 OpenUSD 原生軟件平臺,用于跨 3D 工具和應用程序進行連接、描述和模擬,其更新加速了虛擬世界和工業數字化高級工作流程的創建。Cesium、Convai、Move AI、SideFX Houdini 和 Wonder Dynamics 現已通過 OpenUSD 連接到 Omniverse。
該平臺更新的主要亮點包括Omniverse Kit(用于開發本機 OpenUSD 應用程序和擴展的引擎)以及 NVIDIA Omniverse Audio2Face 基礎應用程序和空間計算功能的改進。
NVIDIA Omniverse 和模擬技術副總裁 Rev Lebaredian 表示:“工業企業正在競相實現工作流程數字化,從而增加了對支持 OpenUSD 的互聯、可互操作的 3D 軟件生態系統的需求。”“最新的 Omniverse 更新讓開發人員可以通過 OpenUSD 利用生成式 AI 來增強他們的工具,并且允許企業構建更大、更復雜的世界規模模擬,作為其工業應用的數字測試場。”
Omniverse Kit 的主要改進包括:
第一,新的模塊化應用程序構建。新的 Omniverse Kit 擴展注冊表是用于訪問、共享和管理 Omniverse 擴展的中央存儲庫,可讓開發人員輕松打開和關閉應用程序中的功能,從而比以往更輕松地從 600 多個核心 Omniverse 構建自定義應用程序NVIDIA 提供的擴展。
第二。新的開發人員模板和資源。新的應用程序和體驗模板為開始使用 OpenUSD 和 Omniverse 的開發人員提供了一個主要的優勢,只需最少的編碼。
第三,提升效率和用戶體驗。新的渲染優化充分利用 NVIDIA RTX GPU 中的 NVIDIA Ada Lovelace 架構增強功能,DLSS 3技術完全集成到 Omniverse RTX 渲染器中,新的 AI 降噪器可實現大規模數據的實時 4K 路徑跟蹤。
第四,本機 RTX 支持的空間集成。新的擴展現實 (XR) 開發人員工具可讓用戶將空間計算選項本機構建到基于 Omniverse 的應用程序中,從而使用戶能夠靈活地體驗自己喜歡的 3D 項目和虛擬世界。
這些平臺更新在 Omniverse 基礎應用程序中展示,這些應用程序是完全可定制的參考應用程序,創建者、企業和開發人員可以復制、擴展或增強。升級的應用程序包括:
Omniverse USD Composer,允許 3D 用戶組裝基于 OpenUSD 的大型場景;Omniverse Audio2Face,提供對生成式 AI 應用程序編程接口的訪問,這些接口僅從音頻文件創建逼真的面部動畫和手勢,現在包括多語言支持和新的女性基本模型。
OpenUSD 擴展了 Omniverse 生態系統
NVIDIA 還宣布為開發者和公司提供廣泛的框架、資源和服務,以加速通用場景描述(即 OpenUSD)的采用。
此外,該公司還宣布了由 NVIDIA 構建的新Omniverse Cloud API,供開發人員更無縫地實施和部署 OpenUSD 管線和應用程序。例如,ChatUSD 是開發者的大型語言模型副駕駛,可以回答問題或生成 Python-USD 代碼腳本。
OpenUSD 支持的新 Omniverse 連接現已推出,為工業企業打破復雜生產管線中的數據孤島提供了更多機會。
Adobe 和 NVIDIA 擴大了在 Adobe Substance 3D、生成式 AI 和 OpenUSD 計劃方面的合作,宣布計劃將 Adobe Firefly(Adobe 的創意生成式 AI 模型系列)作為 Omniverse 中的 API 提供,使開發人員和創作者能夠增強他們的設計流程。
Wonder Dynamics 通過其 AI 平臺 Wonder Studio 與 Omniverse 連接,提供新的 OpenUSD 導出支持,該平臺可自動將計算機生成的角色制作動畫、照明并將其組合成真人場景。新的 OpenUSD 導出支持將使藝術家能夠生成并導出完整的 3D 場景 - 全部來自單個攝像機視頻。
Luma AI 的 USDZ 格式的現實捕捉模型可以輕松導入到 Omniverse。化身公司 Convai 和角色引擎公司 Inworld AI 的工具已連接到 Omniverse。借助 Convai 等人工智能工具,創作者可以在數字孿生環境中添加角色,這些角色可以提供有關環境和物體的相關信息,成為導游或虛擬機器人。Move AI 通過 Move One 應用程序實現單攝像頭動作捕捉,該應用程序可用于生成 3D 角色動畫,然后將其導出到 OpenUSD 并在 Omniverse 中使用。
Omniverse 用戶現在可以構建與其他基于 OpenUSD 的空間計算平臺(例如 ARKit 和 RealityKit)兼容的內容、體驗和應用程序。此外,對 Khronos Group 的OpenXR開放標準的新支持將 Omniverse 的使用擴展到HTC VIVE、Magic Leap和Varjo等制造商的更多應用。
SideFX Houdini 用戶現在還可以將 Houdini 數字資產直接加載到 Omniverse 視口中,使基于 Houdini 的連接工作流程更加無縫。Omniverse 的 Cesium 擴展名為 Cesium for Omniverse,支持 3D Tiles,這是一種在虛擬世界中傳輸海量地理空間數據集的開放標準,包括 OpenUSD 支持的數據集。CGI.Backgrounds 現在在 USD Composer 中提供了幾張超高清 HDRi 地圖。Cadence DataCenter Design Software現在可通過 Omniverse 獲取,幫助用戶在其數字孿生的完整環境中查看計算流體動力學仿真。借助 Cadence 數據中心擴展,用戶可以在實施之前規劃、測試和驗證設計和操作注意事項。Blackshark.AI世界數字孿生平臺現已接入Omniverse。
使用 Omniverse 進行數字化的客戶
正在使用 Omniverse 執行各種任務,從模擬機器人到訓練 AI 模型和改進動畫。
波士頓動力人工智能研究所正在使用 Omniverse 來模擬機器人及其交互,以實現新型機器人和控制系統的設計。大陸集團是汽車和自主系統工業化領域的領先公司之一,正在其移動機器人業務中使用 Omniverse 大規模生成物理精確的合成數據,以訓練計算機視覺 AI 模型并執行系統集成測試。
沃爾沃汽車已將其數字孿生轉變為基于 OpenUSD,使用 Omniverse 創建沉浸式可視化效果,幫助客戶做出在線購買決策。
Marks Design 是一家品牌設計和體驗機構,正在使用 Omniverse 和 OpenUSD 來簡化協作并改進其動畫、可視化和渲染工作流程。
新的 Omniverse 系統和合作伙伴
NVIDIA 正在與全球系統制造商合作,為數百萬設計師、建筑師和工程師帶來針對 Omniverse 進行優化配置的 RTX 工作站。新系統配備多達四個 NVIDIA RTX 6000 Ada Generation GPU,與NVIDIA Omniverse Enterprise軟件捆綁在一起,可加速 OpenUSD 世界構建、生成式 AI 增強型協作設計和其他工業數字化應用。
Omniverse 用戶還可以利用新的NVIDIA L40S GPU,這是一款功能強大的通用數據中心 GPU,可加速圖形密集型工作負載。
可用性
最新的 Omniverse 版本現已提供測試版,可供免費下載,并將很快在 Omniverse Enterprise 中推出。
?NVIDIA 與全球數據中心系統制造商共同推動生成式 AI 和工業數字化
?
NVIDIA 今天宣布推出NVIDIA OVX 服務器,配備全新 NVIDIA ?L40S GPU,這是一款功能強大的通用數據中心處理器,旨在加速計算最密集、最復雜的應用程序,包括使用NVIDIA Omniverse ?平臺進行人工智能訓練和推理、3D 設計和可視化、視頻處理和工業數字化。
新的 GPU 為生成式 AI 提供加速計算工作負載,這正在改變跨行業的工作流程和服務,包括文本、圖像和視頻生成、聊天機器人、游戲開發、產品設計和醫療保健。
NVIDIA 專業可視化副總裁 Bob Pette 表示:“隨著生成式 AI 改變每個行業,企業越來越多地在數據中心尋求大規模計算資源。配備 NVIDIA L40S GPU 的 OVX 系統可加速人工智能、圖形和視頻處理工作負載,并滿足不斷增長的復雜和多樣化應用程序的苛刻性能要求。”
人工智能和圖形的強大性能
NVIDIA OVX 系統將為每臺服務器啟用多達 8 個 NVIDIA L40S GPU,每個 GPU 配備 48GB 內存。L40S 基于 NVIDIA Ada Lovelace GPU 架構,包括第四代張量核心和 FP8 Transformer 引擎,可提供超過 1.45 petaflops 的張量處理能力。對于具有數十億個參數和多種數據模式(例如文本和視頻)的復雜 AI 工作負載,與 NVIDIA A100 Tensor Core GPU 相比,L40S 的生成式 AI 推理性能提高了 1.2 倍,訓練性能提高了 1.7 倍。
為了支持實時渲染、產品設計和 3D 內容創建等高保真專業可視化工作流程,NVIDIA L40S GPU 包含 142 個第三代 RT 核心,可提供 212 teraflops 的光線追蹤性能。這使得創意專業人士能夠創造身臨其境的視覺體驗和逼真的內容。
對于工程和科學模擬等計算要求較高的工作流程,NVIDIA L40S 包含 18,176 個 CUDA內核,其單精度浮點 (FP32) 性能是 NVIDIA A100 GPU 的近 5 倍,可加速復雜計算和數據密集型分析。
早期采用
CoreWeave 是最早提供 L40S 實例的云服務提供商之一,它專門從事大規模、GPU 加速的工作負載。
CoreWeave 首席技術官 Brian Venturo 表示:“隨著生成式 AI 的爆炸式增長,我們各行各業的客戶都在尋求強大的計算產品和規模,以適應從交互式視頻到 AI 設計和自動化的任何工作負載的復雜性。”“NVIDIA L40S GPU 將進一步擴展我們廣泛的 NVIDIA 解決方案組合,使 CoreWeave 成為第一家提供這些新資源的專業云提供商,以實現快速、高效且經濟高效的加速計算,為下一波生成型 AI 應用提供動力。”
增強 AI 的軟件
部署 L40S GPU 的企業可以從NVIDIA AI Enterprise軟件中受益,該軟件今天宣布了一項重大更新。該軟件為 100 多個框架、預訓練模型、工具包和軟件提供生產就緒的企業支持和安全性,包括用于模擬的NVIDIA Modulus 、用于數據科學的NVIDIA RAPIDS 和用于生產 AI 的NVIDIA Triton推理服務器。
Omniverse 擴展
NVIDIA 還宣布了Omniverse平臺的重大更新,引入了功能和平臺增強功能,使開發人員能夠利用生成式 AI 的力量加速和推進 OpenUSD 管線和工業數字化應用程序。為 Omniverse Cloud 提供支持的下一代NVIDIA OVX系統將采用 L40S GPU,以提供增強生成式 AI 管線和 Omniverse 工作負載所需的 AI 和圖形性能。
供貨情況
NVIDIA L40S 將于今年秋季開始供貨。華碩、戴爾科技、技嘉、HPE、聯想、QCT 和 Supermicro 等全球系統制造商很快將提供包含 NVIDIA L40S GPU 的 OVX 系統。這些服務器將幫助世界各地的專業人士推進人工智能的發展,并為各行業的用戶帶來智能聊天機器人、搜索和摘要工具等生成式人工智能應用程序。
?NVIDIA 與全球工作站制造商推出強大的系統
NVIDIA 和全球制造商今天宣布推出功能強大的全新 NVIDIA RTX工作站,專為生成式 AI 和數字化時代的開發和內容創作而設計。
這些系統(包括來自 BOXX、Dell Technologies、HP 和 Lenovo 的系統)基于NVIDIA RTX 6000 Ada Generation GPU,并采用NVIDIA AI Enterprise和NVIDIA Omniverse Enterprise軟件。
另外,NVIDIA 還發布了三款全新桌面工作站 Ada Generation GPU—— NVIDIA RTX 5000、RTX 4500和RTX 4000——?為全球專業人士提供最新的 AI、圖形和實時渲染技術。
NVIDIA 專業可視化副總裁 Bob Pette 表示:“很少有工作負載像生成式 AI 和數字化應用程序那樣具有挑戰性,它們需要全棧計算方法。”“專業人士現在可以使用最新的 NVIDIA RTX 工作站在桌面上解決這些問題,使他們能夠在生成式 AI 的新時代構建廣闊的數字化世界。”
新款RTX工作站提供多達四個NVIDIA RTX 6000 Ada GPU,每個GPU配備48GB內存,單個桌面工作站可提供高達5,828 TFLOPS的AI性能和192GB GPU內存。根據用戶需求,系統可以配置 NVIDIA AI Enterprise 或 Omniverse Enterprise,以支持各種要求嚴苛的生成式 AI 和圖形密集型工作負載。
今天單獨發布的NVIDIA AI Enterprise 4.0現在包括NVIDIA NeMo (用于構建和定制生成式 AI 基礎模型的端到端框架)、用于數據科學的NVIDIA RAPIDS ?庫,以及用于構建和定制生成 AI 的框架、預訓練模型和工具。構建常見的企業人工智能用例,包括推薦器、虛擬助理和網絡安全解決方案。
Omniverse Enterprise 是一個工業數字化平臺,使團隊能夠開發可互操作的 3D 工作流程和OpenUSD應用程序。作為 OpenUSD 原生平臺,Omniverse 使全球分布的團隊能夠協作處理來自數百個 3D 應用程序的完整設計保真度數據集。
工作站用戶還可以利用即將推出搶先體驗的全新NVIDIA AI Workbench,它為開發人員提供了一個統一且易于使用的工具包,只需單擊幾下即可創建、微調和運行生成式 AI 模型。任何技能水平的用戶都可以在 PC 或工作站上快速創建、測試和自定義預訓練的生成式 AI 模型,然后將其擴展到幾乎任何數據中心、公共云或 NVIDIA DGX 云。
下一代 RTX 技術
全新 NVIDIA RTX 5000、RTX 4500 和 RTX 4000 桌面 GPU 采用最新的 NVIDIA Ada Lovelace 架構技術,包括:
NVIDIA CUDA內核:與上一代相比,單精度浮點吞吐量高達 2 倍。
第三代 RT 核心:吞吐量高達上一代的 2 倍,能夠同時運行具有著色或降噪功能的光線追蹤。
第四代 Tensor Core:AI 訓練性能比上一代快 2 倍,并擴展了對 FP8 數據格式的支持。
DLSS 3:借助 AI 的力量,將實時圖形的真實感和交互性提升到新的水平。
更大的GPU顯存:RTX 4000提供20GB GDDR6顯存;RTX 4500 提供 24GB GDDR6 顯存;RTX 5000 擁有 32GB GDDR6 內存,全部支持錯誤代碼校正,可通過大型 3D 模型、渲染圖像、模擬和 AI 數據集進行無錯誤計算。
擴展現實功能:支持高分辨率增強現實和虛擬現實設備,以提供創建令人驚嘆的 AR、VR 和混合現實內容所需的高性能圖形。
系統制造商將于秋季開始提供配備多達四個 RTX 6000 Ada GPU、NVIDIA AI Enterprise 和 NVIDIA Omniverse Enterprise 的RTX工作站。
全新 NVIDIA RTX 5000 GPU 現已上市,并從即日起由 HP 以及Leadtek、PNY 和 Ryoyo Electro 等全球分銷合作伙伴發貨。NVIDIA RTX 4500 和 RTX 4000 GPU 將于秋季由 BOXX、Dell Technologies、HP 和 Lenovo 以及全球分銷合作伙伴發售。
?電動汽車制造商利用 NVIDIA 進行配置、營銷和生成人工智能
黃仁勛宣布,比亞迪和梅賽德斯-奔馳的豪華電動汽車品牌合資企業騰勢 (DENZA) 已與營銷和傳播巨頭 WPP 和 NVIDIA Omniverse Cloud 合作構建和部署其下一代汽車配置器。
WPP 正在使用Omniverse Cloud(一個用于開發、部署和管理工業數字化應用程序的平臺)來幫助統一汽車制造商高度復雜的設計和營銷渠道。
Omniverse Cloud 使 WPP 能夠通過通用場景描述 (OpenUSD)集成來自電動汽車制造商首選計算機輔助設計工具的全保真設計數據,從而構建DENZA N7 模型的單一、物理精確、實時數字孿生。
OpenUSD 是一個 3D 框架,可實現軟件工具和數據類型之間的互操作性,以構建虛擬世界。
新的統一資產管道的實施打破了專有數據孤島,增強了數據可訪問性,并促進了組織大型設計團隊和利益相關者的協作、迭代審查。它使 WPP 能夠在設計過程的早期開展發布活動,從而加快迭代速度并降低成本。
使用 Omniverse Cloud 統一資產管道
使用 Omniverse Cloud,WPP 團隊可以連接他們自己的支持 OpenUSD 的設計和內容創建工具(例如 Autodesk Maya 和 Adobe Substance 3D Painter),為 DENZA N7 開發新的配置器。借助 Omniverse 中的統一資產管道,WPP 的美術團隊可以實時迭代和編輯 DENZA N7 完整工程數據集的路徑跟蹤視圖,確保虛擬汽車準確地代表實體汽車。
傳統的汽車配置器需要預渲染數十萬張圖像來表示所有可能的選項和變體。OpenUSD 使 WPP 能夠創建汽車的數字雙胞胎,其中在一項資產中包含所有可能的變體,不需要預渲染圖像。
與此同時,WPP 的環境藝術家創建完全交互式的實時 3D 虛擬場景。這些可以從掃描現實世界環境開始,例如WPP 用機器狗捕獲的圖像,或者利用 Shutterstock 等提供商的生成人工智能工具來立即生成 360 度 HDRi 背景,以最大限度地提高個性化機會。
Shutterstock 正在使用 NVIDIA Picasso(一家構建生成式 AI 視覺模型的代工廠)來開發各種生成式 AI 服務,以加速 3D 工作流程。在 SIGGRAPH 上,Shutterstock 宣布首次提供這些新服務 – 360 HDRi – 創建逼真的 HDR 環境地圖來重新照亮場景。借助此功能,藝術家可以快速創建滿足其需求的自定義環境。
一鍵發布到 GDN
3D 體驗完成后,只需單擊一下,WPP 就可以將其發布到圖形交付網絡 (GDN) (?NVIDIA Omniverse Cloud的一部分)?。GDN 是一個數據中心網絡,旨在為幾乎所有網絡設備提供實時、高保真 3D 內容,從而在經銷商展廳以及消費者的移動設備上實現交互式體驗。
這消除了手動打包、部署、托管和管理體驗本身的繁瑣過程。如果需要更新,就像初始部署一樣,WPP 只需單擊一下即可發布更新。??
審核編輯:劉清
評論
查看更多