美東時(shí)間9月9日周二,英偉達(dá)發(fā)布新一代Rubin CPX芯片系統(tǒng),專(zhuān)門(mén)針對(duì)AI視頻生成和軟件開(kāi)發(fā)等大規(guī)模上下文處理任務(wù),強(qiáng)化AI編碼和視頻處理能力。
Rubin CPX定于2026年底上市,采用卡片形式,可集成到現(xiàn)有服務(wù)器設(shè)計(jì)中或作為獨(dú)立計(jì)算設(shè)備在數(shù)據(jù)中心運(yùn)行。
這款芯片系統(tǒng)在技術(shù)規(guī)格上實(shí)現(xiàn)重大突破。Rubin CPX GPU提供30千萬(wàn)億次浮點(diǎn)(petaflops)運(yùn)算能力(NVFP4精度),配備128GB GDDR7內(nèi)存,支持視頻解碼和編碼的硬件,相比英偉達(dá)GB300 NVL72系統(tǒng),注意力加速3倍。
完整的Vera Rubin NVL144 CPX平臺(tái)在單個(gè)機(jī)架中集成144個(gè)Rubin CPX GPU、144個(gè)Rubin GPU和36個(gè)Vera CPU,提供8 exaflops AI性能,性能為英偉達(dá)GB300 NVL72系統(tǒng)的7.5倍。
英偉達(dá)CEO黃仁勛表示,Rubin CPX是首款專(zhuān)為百萬(wàn)級(jí)token處理而構(gòu)建的CUDA GPU。他說(shuō):
"正如RTX革命性地改變了圖形和物理AI,Rubin CPX是首款專(zhuān)為大規(guī)模上下文AI而構(gòu)建的CUDA GPU,模型可以同時(shí)進(jìn)行數(shù)百萬(wàn)個(gè)知識(shí)token的推理。"
英偉達(dá)宣稱(chēng),新芯片的投資回報(bào)率達(dá)到30至50倍,部署價(jià)值1億美元的新芯片硬件將為客戶(hù)帶來(lái)高達(dá)50億美元收入,即從1億美元的資本支出中獲得高達(dá)50億美元的收入。該預(yù)測(cè)強(qiáng)調(diào)了英偉達(dá)對(duì)AI基礎(chǔ)設(shè)施商業(yè)價(jià)值的量化努力。
技術(shù)創(chuàng)新:分離式推理架構(gòu)提升效率
Rubin CPX采用分離式推理架構(gòu),將AI計(jì)算過(guò)程分為上下文階段和生成階段。上下文階段需要高吞吐量計(jì)算來(lái)處理大量輸入數(shù)據(jù),而生成階段則依賴(lài)快速內(nèi)存?zhèn)鬏敽透咚倩ミB。
這種設(shè)計(jì)允許兩個(gè)階段獨(dú)立處理,實(shí)現(xiàn)計(jì)算和內(nèi)存資源的精準(zhǔn)優(yōu)化。Rubin CPX專(zhuān)門(mén)針對(duì)計(jì)算密集型的上下文階段進(jìn)行優(yōu)化,與現(xiàn)有基礎(chǔ)設(shè)施協(xié)同工作,提供3倍的注意力加速性能。
該平臺(tái)配備100TB高速內(nèi)存和每秒1.7千萬(wàn)億字節(jié)的內(nèi)存帶寬,通過(guò)英偉達(dá)Quantum-X800 InfiniBand或Spectrum-X以太網(wǎng)連接,由Dynamo平臺(tái)統(tǒng)一協(xié)調(diào)。
應(yīng)用場(chǎng)景:重塑軟件開(kāi)發(fā)和視頻生成
在軟件開(kāi)發(fā)領(lǐng)域,Rubin CPX使AI系統(tǒng)能夠處理整個(gè)代碼庫(kù),維護(hù)跨文件依賴(lài)關(guān)系,理解倉(cāng)庫(kù)級(jí)結(jié)構(gòu)。這將編程助手從自動(dòng)完成工具轉(zhuǎn)變?yōu)橹悄軈f(xié)作伙伴,能夠理解"大規(guī)模軟件項(xiàng)目"。
視頻生成方面,該系統(tǒng)可在單個(gè)芯片上完成解碼、編碼和處理,AI模型能夠處理多達(dá)100萬(wàn)個(gè)token的一小時(shí)內(nèi)容。這為長(zhǎng)視頻內(nèi)容生成提供了前所未有的連貫性和記憶能力。
多家公司已表達(dá)合作意向。代碼生成公司Cursor計(jì)劃使用該技術(shù)進(jìn)行代碼生成,視頻創(chuàng)作平臺(tái)Runway將其應(yīng)用于視頻生成工作流程,AI研究公司Magic則計(jì)劃利用該技術(shù)構(gòu)建具有1億token上下文窗口的基礎(chǔ)模型。
市場(chǎng)影響:鞏固英偉達(dá)AI基礎(chǔ)設(shè)施優(yōu)勢(shì)
Rubin CPX的發(fā)布進(jìn)一步鞏固了英偉達(dá)在AI基礎(chǔ)設(shè)施領(lǐng)域的領(lǐng)先地位。據(jù)分析師估計(jì),英偉達(dá)的數(shù)據(jù)中心業(yè)務(wù)本財(cái)年收入有望達(dá)到1840億美元,超過(guò)業(yè)內(nèi)其他公司的總收入。
該產(chǎn)品體現(xiàn)了英偉達(dá)在硬件和軟件創(chuàng)新方面的持續(xù)投入,這種速度是競(jìng)爭(zhēng)對(duì)手尚未匹及的。通過(guò)專(zhuān)門(mén)針對(duì)特定AI工作負(fù)載優(yōu)化硬件,英偉達(dá)繼續(xù)保持行業(yè)對(duì)其產(chǎn)品的依賴(lài)。
新平臺(tái)預(yù)計(jì)將為企業(yè)構(gòu)建下一代生成式AI應(yīng)用創(chuàng)造新的可能性,特別是在需要處理大規(guī)模上下文的高價(jià)值推理用例中。這標(biāo)志著AI基礎(chǔ)設(shè)施從通用計(jì)算向?qū)S脙?yōu)化的重要轉(zhuǎn)變。