AI的“iPhone 時刻”之后,英偉達新“核彈”為ChatGPT提速10倍
·英偉達在推理方面的全新GPU推理平臺包括:4種配置(L4 Tensor Core GPU、L40 GPU、H100 NVL GPU、Grace Hopper超級芯片)、一個體系架構、一個軟件棧,分別用于加速AI視頻、圖像生成、大型語言模型部署和推薦系統。
“加速計算并非易事,2012年,計算機視覺模型AlexNet動用了GeForce GTX 580,每秒可處理262 PetaFLOPS。該模型引發了AI技術的爆炸。”“十年之后,Transformer出現了,GPT3動用了323 ZettaFLOPS的算力,是AlexNet的100萬倍,創造了ChatGPT這個震驚全世界的AI。嶄新的計算平臺出現了,AI的‘iPhone時刻’已經來臨。”
當地時間3月21日,英偉達首席執行官黃仁勛將OpenAI的ChatGPT稱為人工智能的“iPhone時刻”,并在該公司的春季GTC大會上宣布了專為其設計的推理GPU(圖形處理器)。
除此之外,英偉達還發布了AI超級計算服務DGX Cloud、突破性的光刻計算庫cuLitho、加速企業創建大模型和生成式AI的云服務NVIDIA AI Foundations等,以及與Quantum Machines合作推出了全球首個GPU加速量子計算系統。
ChatGPT專用GPU
其中最主要的是H100 NVL,它將英偉達的兩個H100 GPU拼接在一起,以部署像 ChatGPT這樣的大型語言模型(LLM)。“當前唯一可以實際處理ChatGPT的GPU是英偉達HGX A100。與前者相比,現在一臺搭載四對H100和雙NVLINK的標準服務器速度能快10倍,可以將大語言模型的處理成本降低一個數量級。”黃仁勛說。
H100 NVL將英偉達的兩個 H100 GPU 拼接在一起,以部署像 ChatGPT 這樣的大型語言模型 (LLM)。
H100不是新的GPU,英偉達在一年前的GTC上展示了其Hopper架構,并在各種任務中加速AI推理(推理是機器學習程序部署的第二階段,此時運行經過訓練的程序以通過預測來回答問題)。英偉達表示,H100 NVL附帶94GB內存,與上一代產品相比,H100的綜合技術創新可以將大型語言模型的速度提高30倍。
據黃仁勛透露,H100 NVL預計將在今年下半年上市。
第二款芯片是用于AI Video的L4,在視頻解碼和轉碼、視頻內容審核、視頻通話功能上做了優化。英偉達稱其可以提供比CPU高120倍的AI視頻性能,同時能效提高99%。也就是說,一臺8GPU L4服務器,將取代一百多臺用于處理AI視頻的雙插槽CPU服務器。
用于AI Video的L4芯片,在視頻解碼和轉碼、視頻內容審核、視頻通話功能上做了優化。
“谷歌是第一家提供L4視頻芯片的云提供商,目前處于私人預覽版。L4將集成到谷歌的Vertex AI模型商店中。”黃仁勛說。除了谷歌的產品外,L4還在30多家計算機制造商的系統中提供,其中包括研華、華碩、源訊、思科、戴爾科技、富士通、技嘉、惠普企業、聯想、QCT和超微。
同時,英偉達還針對Omniverse、圖形渲染以及文本轉圖像/視頻等生成式AI推出了L40芯片。其性能是英偉達最受歡迎的云推理GPU T4的10倍。另外,英偉達還推出了全新的超級芯片GraceHopper,適用于推薦系統和大型語言模型的AI數據庫,圖推薦模型、向量數據庫和圖神經網絡的理想選擇,通過900GB/s的高速一致性芯片到芯片接口連接英偉達Grace CPU和Hopper GPU。
4種配置(L4 Tensor Core GPU、L40 GPU、H100 NVL GPU、Grace Hopper超級芯片)、一個體系架構、一個軟件棧,分別用于加速AI視頻、圖像生成、大型語言模型部署和推薦系統。
總體而言,英偉達在推理方面的全新GPU推理平臺包括:4種配置(L4 Tensor Core GPU、L40 GPU、H100 NVL GPU、Grace Hopper超級芯片)、一個體系架構、一個軟件棧,分別用于加速AI視頻、圖像生成、大型語言模型部署和推薦系統。
月租云端AI算力
在黃仁勛的主題演講中,多次提到了ChatGPT的創建者OpenAI。黃仁勛于2016年向該公司交付了附有自己簽名和贈語的全球第一臺DGX。這臺集成了8塊通過NVLink共享算力的H100組成的超級計算機,為OpenAI奠定了創造ChatGPT的重要算力基礎。
“自OpenAI使用DGX以后,《財富》100強企業中有一半安裝了DGX AI超級計算機。DGX已成為AI領域的必備工具。”黃仁勛說。
在GTC大會上,英偉達推出云端人工智能DGX Cloud。DGX Cloud提供了專用的 NVIDIA DGX AI超級計算集群,用戶能夠按月租用這些計算資源,并使用簡單的網絡瀏覽器訪問。從而消除在本地獲取、部署和管理基礎設施的成本,大大增加了AI的便捷性。
“如今通過一個瀏覽器,就能將DGX AI超級計算機即時地接入每家公司。”黃仁勛憧憬道。
每個DGX Cloud實例都具有8個H100或A100 80GB Tensor Core GPU,每個節點共有640GB GPU內存。
據介紹,每個DGX Cloud實例都具有8個H100或A100 80GB Tensor Core GPU,每個節點共有640GB GPU內存。使用NVIDIA Networking構建的高性能、低延遲結構確保工作負載可以跨互連系統集群擴展,允許多個實例充當一個巨大的GPU,以滿足高級AI訓練的性能要求。
據黃仁勛介紹,每個實例的月租價格為36999美元起。
在演講中,黃仁勛宣布,英偉達將與云服務提供商合作托管DGX云基礎設施。目前英偉達已經與甲骨文達成合作,甲骨文的OCI RDMA Supercluster已經提供了一個可擴展到超過32000個GPU的超級集群。微軟云服務Azure預計下個季度開始托管DGX Cloud,很快谷歌云也將加入托管的行列。
挑戰物理極限,光刻提速40倍
除了芯片,黃仁勛還談到了一個名為cuLitho的計算光刻庫,它將部署在芯片制造中。光刻計算庫cuLitho可將計算光刻加速40倍以上,使得2nm及更先進芯片的生產成為可能。
光刻計算庫cuLitho可將計算光刻加速40倍以上,使得2nm及更先進芯片的生產成為可能。
全球最大晶圓廠臺積電、全球光刻機霸主阿斯麥、全球最大EDA巨頭新思科技均參與合作并引入這項技術。該計劃旨在加快制造光掩模的任務,光掩模是用以將集成電路以及其他各種電路通過光刻技術印制在晶圓上的圖形母板,相當于書籍印刷的母板。
計算光刻模擬了光通過光學元件并與光刻膠相互作用時的行為,應用逆物理算法來預測掩膜板上的圖案,以便在晶圓上生成最終圖案。
光刻是芯片制造過程中最復雜、最昂貴、最關鍵的環節,其成本約占整個硅片加工成本的1/3甚至更多。計算光刻模擬了光通過光學元件并與光刻膠相互作用時的行為,應用逆物理算法來預測掩膜板上的圖案,以便在晶圓上生成最終圖案。
計算光刻是提高光刻分辨率、推動芯片制造達到2nm及更先進節點的關鍵手段。
“計算光刻是芯片設計和制造領域中最大的計算工作負載,每年消耗數百億CPU小時。大型數據中心24X7全天候運行,以便創建用于光刻系統的掩膜板。這些數據中心是芯片制造商每年投資近2000億美元的資本支出的一部分。”而黃仁勛說,cuLitho能夠將計算光刻的速度提高到原來的40倍。
也就是說英偉達H100 GPU需要89塊掩膜板,在CPU上運行時,處理單個掩膜板需要兩周時間,而在GPU上運行cuLitho只需8小時。
據介紹,臺積電可通過在500個DGX H100系統上使用cuLitho加速,將功率從35MW降至5MW,替代此前用于計算光刻的40000臺CPU服務器。 使用cuLitho的晶圓廠,每天可以生產35倍多的光掩膜,僅使用當前配置電力的1/9。
黃仁勛說,該軟件正被集成到全球最大的代工芯片制造商臺積電的設計系統中,臺積電將于6月開始對cuLitho進行生產資格認證。它還將被集成到Synopsys的設計軟件中,Synopsys是少數幾家使用軟件工具制造新芯片底板的公司之一。
新思科技董事長兼首席執行官Aart de Geus稱,在英偉達的cuLitho平臺上運行新思科技的光學鄰近校正(OPC)軟件,將性能從幾周加速到幾天。
臺積電首席執行官魏哲家則夸贊它為臺積電在芯片制造中廣泛地部署光刻解決方案開辟了新的可能性,為半導體規模化做出重要貢獻。阿斯麥首席執行官Peter Wennink稱阿斯麥計劃將對GPU的支持集成到其所有的計算光刻軟件產品中。
其他更新
英偉達還推出了全新云服務及代工廠NVIDIA AI Foundations,這個云服務包括語言、視覺和生物學模型制作服務。
其中,NeMo是用于構建定制的語言文本轉文本生成式模型。
NeMo是用于構建定制的語言文本轉文本生成式模型。
Picasso是視覺語言模型構建服務,具有文生圖、文本轉視頻、文本轉3D功能,可為產品設計、數字孿生、角色創建等使用自然文本提示的應用快速創建和定制視覺內容。只要向Picasso發送文本提示和元數據的API調用,Picasso就會用DGX Cloud上的模型把生成的素材發送回應用。
Picasso是視覺語言模型構建服務。
而把這些素材導入NVIDIA Omniverse,就可以構建逼真的元宇宙應用,和數字孿生仿真。
BioNeMo是生命科學服務,提供AI模型訓練和推理,加速藥物研發中最耗時和成本最高的階段,可加速新蛋白質和治療方法的創建以及基因組學、化學、生物學和分子動力學研究。
直接在瀏覽器上或通過API,均可訪問這些運行在NVIDIA DGX Cloud上的云服務。NeMo、BioNeMo云服務已開放早期訪問,Picasso云服務正在私人預覽中。
英偉達與Quantum Machines合作推出了一個量子控制鏈路,它可將英偉達GPU連接到量子計算機,以極快的速度進行糾錯。
面向量子計算,要從量子噪聲和退相干中恢復數據,需要對大量量子比特進行糾錯。對此,英偉達與Quantum Machines合作推出了一個量子控制鏈路,它可將英偉達GPU連接到量子計算機,以極快的速度進行糾錯。
面向元宇宙領域,英偉達推出了第三代OVX計算系統和新一代工作站,為基于NVIDIA Omniverse Enterprise的大規模數字孿生提供動力。
面向元宇宙領域,英偉達推出了第三代OVX計算系統和新一代工作站,為基于NVIDIA Omniverse Enterprise的大規模數字孿生提供動力。微軟和英偉達正在將工業元宇宙引入Microsoft 365應用程序(如Teams)和Azure云。
微軟也是Omniverse Cloud的首批云合作伙伴之一。英偉達的云服務預計將于今年下半年在Microsoft Azure上推出。Omniverse還將連接到Azure IoT,以便將來自 Azure Digital Twins的真實世界傳感器數據傳輸到Omniverse模型。
Omniverse Cloud還瞄準了汽車行業,寶馬、梅賽德斯奔馳、沃爾沃、豐田和比亞迪等幾家大公司已經在使用Omniverse執行各種任務。
此外,英偉達與三菱聯合發布了將用于加速藥物研發的日本第一臺生成式AI超級計算機Tokyo1。通過在Tokyo1上使用NVIDIA BioNeMo軟件,研究人員能運行高達數十億參數的先進AI模型,包括蛋白質結構預測、小分子生成、姿態估計等。
- 寧波市燃氣灶維修(寧波萬家樂燃氣灶維修)12-04
- 1電視頻道沒了怎么恢復(快速解決方法)
- 2海信42k11p怎么折開(海信42K11P:全方位展示超清畫質)
- 3Fardior燃氣灶售后維修電話號碼查詢(Fardior燃氣灶售后維修電話查詢)
- 4艾木歐防盜門沒電打不開怎么辦(艾木歐防盜門沒電無法啟動?解決方法總結)
- 5ENS指紋鎖售后熱線(ENS指紋鎖售后熱線-專業解決您的問題)
- 6打電話顯示關機是什么原因(如何解決手機無法接通問題)。
- 7v500hk1 cs5故障維修(v500hk1 cs5故障維修指南)
- 8創維液晶電視的遙控器怎么調試(創維電視遙控器調試指南)
- 9林內空氣能售后服務官網熱線(林內空氣能售后服務官網熱線)
- 10朝友精工保險柜24小時售后電話(朝友精工保險柜24小時售后電話 - 完善24小時保
-
貼片代碼怎么看(深入解讀貼片代碼:洞悉世界編碼秘密)
2025-06-07
-
怎么拆彩電顯像管管座(拆解彩電顯像管管座技巧——30字以內)
2025-06-07
-
壁掛爐一天多少方氣(壁掛爐每天消耗幾方氣能?)
2025-06-07
-
海歌壁掛爐官網(海歌壁掛爐:讓溫暖環繞你)
2025-06-07
-
德能空氣能故障代碼e5(空調故障代碼E5的原因與解決方法)
2025-06-07


