8 月 23 日消息,Hot Chips 大會(huì)將于 8 月 24~26 日舉行,英偉達(dá)宣布推出 NVIDIA Spectrum-XGS Ethernet 技術(shù),即日起作為 NVIDIA Spectrum-X 以太網(wǎng)平臺(tái)的一部分提供。
這是一項(xiàng)面向分布式數(shù)據(jù)中心的跨域互聯(lián)技術(shù),旨在將多個(gè)不同區(qū)域的獨(dú)立數(shù)據(jù)中心連接到一起,打造成一個(gè)具備千億級(jí)計(jì)算能力的 AI 超級(jí)工廠。

英偉達(dá)介紹稱,隨著 AI 需求的快速增長(zhǎng),單一數(shù)據(jù)中心在電力和容量上逐漸觸及極限。傳統(tǒng)以太網(wǎng)在延遲、抖動(dòng)和性能一致性方面的局限,使得數(shù)據(jù)中心無(wú)法輕易突破單一設(shè)施的邊界。Spectrum-XGS Ethernet 正是為此設(shè)計(jì),它引入了跨域擴(kuò)展架構(gòu),具備自適應(yīng)的網(wǎng)絡(luò)算法,可根據(jù)數(shù)據(jù)中心之間的距離進(jìn)行動(dòng)態(tài)調(diào)整:
自適應(yīng)距離擁塞控制:動(dòng)態(tài)優(yōu)化數(shù)據(jù)中心間網(wǎng)絡(luò)傳輸
精準(zhǔn)延遲管理:將 NCCL 通信庫(kù)性能提升了幾乎一倍
端到端遙測(cè)系統(tǒng):保障地理分散集群的可預(yù)測(cè)性能
黃仁勛表示:“AI 產(chǎn)業(yè)革命已經(jīng)到來(lái),而超大規(guī)模的 AI 工廠正是關(guān)鍵基礎(chǔ)設(shè)施。通過(guò) Spectrum-XGS Ethernet,我們?cè)诳v向擴(kuò)展和橫向擴(kuò)展的基礎(chǔ)上增加了跨域擴(kuò)展能力,將分布在城市、國(guó)家乃至洲際的數(shù)據(jù)中心連接成龐大的千億級(jí) AI 超級(jí)工廠。”
據(jù)介紹,云服務(wù)商 CoreWeave 已率先采用 Spectrum-XGS Ethernet。該公司聯(lián)合創(chuàng)始人兼首席技術(shù)官 Peter Salanki 表示“該技術(shù)可將我們的數(shù)據(jù)中心整合為統(tǒng)一超級(jí)計(jì)算機(jī)”。
在此之前,英偉達(dá)已推出 Spectrum-X 交換機(jī)和 ConnectX-8 SuperNIC,用于跨站點(diǎn)連接數(shù)百萬(wàn) GPU,同時(shí)降低能耗和運(yùn)營(yíng)成本。