過去一年,英偉達(dá)CEO黃仁勛頻繁現(xiàn)身于多國政府舉辦的峰會論壇上,游走拜會各國政要時,都會反復(fù)提及一個話題“主權(quán)AI”。
主權(quán)AI的核心理念認(rèn)為,每個國家都應(yīng)該擁有自己的AI基礎(chǔ)設(shè)施、數(shù)據(jù)和智能生產(chǎn)能力,以保護(hù)國家主權(quán)、文化、經(jīng)濟(jì)潛力。而以國家為單位建立的主權(quán)AI要做到獨立自主,不能依賴外部力量。用黃仁勛2024年在迪拜世界政府峰會上演講的一句話總結(jié)——“你不能讓別人來做這件事”。
在中國,AI崛起與國產(chǎn)化一直同頻共振。從百模大戰(zhàn)追趕ChatGPT,到DeepSeek、通義千問吸引全球關(guān)注中國AI創(chuàng)新,在國產(chǎn)AI模型陸續(xù) “上牌桌”的另一面,是國內(nèi)AI從業(yè)者從一開始就立足于獨立自主,從0到1搭建國產(chǎn)化產(chǎn)業(yè)生態(tài),將AI主權(quán)牢牢握在手中。
而商湯科技就是這條隱秘戰(zhàn)線上的先行者。
這家2014年成立的中國本土AI公司,當(dāng)生成式AI大語言模型席卷全球之時,堅定投入轉(zhuǎn)型。在去年成立十周年之際,公司已經(jīng)形成“大裝置-大模型-應(yīng)用”三位一體的生成式AI業(yè)務(wù)生態(tài),2024年全年貢獻(xiàn)了其60%以上的營收。今年上半年,這一比例繼續(xù)升至77%。
啃下AI國產(chǎn)化最硬的骨頭
經(jīng)濟(jì)學(xué)領(lǐng)域有一個基本原理,誰掌握生產(chǎn)工具,誰就能決定生產(chǎn)過程,從而掌握主導(dǎo)權(quán)。
商湯比許多同行更早意識到,AI的競爭不只是模型或算法的競爭,基礎(chǔ)設(shè)施的競爭往往能決定AI由誰生產(chǎn),發(fā)展AI的主動權(quán)在誰手中。
2019年,在ChatGPT還未誕生前,商湯科技內(nèi)部就提出了自建“大裝置”的構(gòu)想。
在內(nèi)部的設(shè)想中,大裝置是超大規(guī)模的AI基礎(chǔ)設(shè)施,解決所有生產(chǎn)AI過程中的關(guān)鍵問題:算力層以自建的AI數(shù)據(jù)中心(AIDC)為核心,支持模型訓(xùn)練與算力調(diào)度;在此基礎(chǔ)之上,平臺層囊括數(shù)據(jù)平臺、AI框架、推理引擎等AI開發(fā)的關(guān)鍵工具;模型層則包括模型相關(guān)的算法與軟件技術(shù)。

而基礎(chǔ)設(shè)施需要巨額投資撬動。2020年7月,商湯遞交上市招股書時,其中一項重要投資是在上海臨港落地建設(shè)公司的第一座智算數(shù)據(jù)中心,56億的總投資額已是商湯該年營收的1.6倍。
商湯董事長兼CEO徐立后來在公司十周年年會上回憶,商湯的大裝置計劃在公司內(nèi)外都面臨很大爭議。內(nèi)部很多人不理解,作為一家AI公司,商湯為什么要頂著虧損自建重資產(chǎn)基礎(chǔ)設(shè)施,外界當(dāng)時也認(rèn)為,數(shù)據(jù)中心是云計算的生意,與阿里云等云計算大廠的服務(wù)相比,專門針對AI提供算力的需求太小,沒有市場。
但商湯依然決心啃下這塊最硬的骨頭。
2022年,臨港智算中心一期工程投入運營,算力規(guī)模達(dá)14000 PFLOPS(每秒千兆億次浮點運算),超過了最初立項規(guī)劃(3740 PFLOPS)的4倍不止。至2025年8月,商湯大裝置GPU達(dá)5.4萬塊,運營總算力已突破2.5萬PetaFLOPS。
再到后來國內(nèi)AI行業(yè)掀起“百模大戰(zhàn)”、AI算力長期供不應(yīng)求時,基礎(chǔ)設(shè)施的重要性已經(jīng)不言自明,而國產(chǎn)化已成為當(dāng)下共識。
商湯科技董事長兼CEO徐立曾說,商湯大裝置從立項第一天起就被看作“打破業(yè)內(nèi)共識,創(chuàng)造新共識”的典型案例。而在商湯落地大裝置計劃的過程中,國產(chǎn)化是其一直同步推進(jìn)的事情。
商湯希望大裝置能成為國產(chǎn)芯片在真實場景中應(yīng)用的“試驗場”。為此在投建算力中心時,公司不僅批量采購多款國產(chǎn)芯片產(chǎn)品,同時與華為昇騰、寒武紀(jì)、沐曦、摩爾線程、壁仞等國產(chǎn)芯片廠商建立長期合作關(guān)系,針對20多款國產(chǎn)芯片做兼容適配。
以寒武紀(jì)為例。12月15日,在商湯發(fā)布行業(yè)首個多影視劇集視頻生成智能體Seko2.0的當(dāng)天,寒武紀(jì)官宣Day 0就已完成了對商湯自研日日新Seko系列模型的適配。能做到這一點的基礎(chǔ)是雙方10月簽署正式合作協(xié)議后的緊密合作。適配完成后,兩家公司還將在優(yōu)化模型核心能力、提升算力利用率與成本效率、強(qiáng)化大規(guī)模并行處理能力、構(gòu)建更靈活的資源管理機(jī)制等關(guān)鍵技術(shù)上深度優(yōu)化。

此外,商湯還在全國率先完成了華為昇騰910C 384的超節(jié)點全面適配。
今年7月,商湯聯(lián)合華為、海光、寒武紀(jì)、沐曦、摩爾線程、庫帕思等十余家國產(chǎn)生態(tài)伙伴,共同發(fā)布“商湯大裝置算力Mall”,目標(biāo)幫助客戶能低成本獲取高性能的國產(chǎn)AI算力芯片。同時,針對國產(chǎn)芯片普遍存在的算力資源碎片化、不同廠商芯片調(diào)度復(fù)雜、跨域訓(xùn)練穩(wěn)定性不足等共性難題,商湯還與上海人工智能實驗室發(fā)布DeepLink異構(gòu)混合調(diào)度方案,以幫助國產(chǎn)算力不僅“可用”,還努力做到“好用”。
讓全球愛上“中國AI創(chuàng)新”
在商湯“三位一體”戰(zhàn)略中,大裝置是基礎(chǔ)設(shè)施,大模型實現(xiàn)AI產(chǎn)品化,應(yīng)用則是將AI落地到千行百業(yè)的具體場景。大裝置從底層支持模型和應(yīng)用創(chuàng)新,模型和應(yīng)用通過市場反饋促進(jìn)大裝置優(yōu)化。
今年上半年,一個名為LightX2V的開源項目及其推出的視頻生成模型,在國外AI設(shè)計社區(qū)ComfyUI上走紅,累計下載量超過350萬次。海外開發(fā)者在Huggingface、GitHub 、Reddit的論壇上熱議討論。一位國外網(wǎng)友在得知LightX2V即將上傳時,激動發(fā)帖表示:"不睡了,坐等更新!"

LightX2V是商湯與北京航空航天大學(xué)聯(lián)合研發(fā)的實時視頻生成推理框架。在設(shè)計時,LightX2V追求低成本、強(qiáng)實時的視頻生成效果,采用了DiT蒸餾加速、輕量化 VAE、稀疏注意力等優(yōu)化創(chuàng)新技術(shù),能做到四步出片。
Sora2、Runway、Pika同類模型通常需要用幾分鐘、甚至十幾分鐘生成一段15秒的視頻,LightX2V只花5秒就能生成一段5秒的視頻。速度更快的同時,對硬件要求更低,僅需8GB 顯存與16GB內(nèi)存,就能運行140億參數(shù)模型生成480P/720P視頻,并且在算力芯片上不再局限于英偉達(dá)系列的高端AI GPU,兼容適配多款國產(chǎn)芯片。
將LightX2V與商湯自研AI 視頻生成智能體Seko結(jié)合到一起,將徹底釋放內(nèi)容制作者“一人劇組”的生產(chǎn)力。最新發(fā)布的Seko 2.0 支持100集以內(nèi)劇本的連續(xù)創(chuàng)作,內(nèi)置的兩項關(guān)鍵技術(shù)SekoIDX破解多劇集、跨分鏡角色的一致性難題,SekoTalk攻克多人對口型難題,實現(xiàn)自然音畫同步。目前在漫劇和短劇領(lǐng)域,Seko制作的真人短劇《婉心計》登頂抖音 AI 短劇榜第一。
除Seko與LightX2V外,商湯另一個開源的多模態(tài)模型架構(gòu) NEO也吸引了全球開發(fā)者的關(guān)注。
業(yè)內(nèi)雖然之前已經(jīng)有眾多多模態(tài)大模型,但架構(gòu)大都沿用“視覺編碼器+投影器+語言模型”的模塊結(jié)構(gòu),雖然實現(xiàn)了圖像輸入的兼容,但本質(zhì)上仍以語言為中心,圖像與語言的融合僅停留在數(shù)據(jù)層面。而NEO架構(gòu)通過在注意力機(jī)制、位置編碼和語義映射三個關(guān)鍵維度的底層創(chuàng)新,讓模型天生具備了統(tǒng)一處理視覺與語言的能力。
NEO架構(gòu)的創(chuàng)新也帶來了極致的效率表現(xiàn)。測試結(jié)果顯示,NEO架構(gòu)僅需業(yè)界同等性能模型十分之一的圖像數(shù)據(jù),就能開發(fā)出對標(biāo)競爭對手的視覺感知能力,在多項視覺理解任務(wù)中追平 Qwen2-VL、InternVL3 等頂尖多模態(tài)模型,在 MMMU、MMB、MMStar、SEED-I、POPE等多項公開權(quán)威評測中斬獲高分。
商湯用一個個實踐案例證明,降低AI使用門檻,通過開源項目加入全球開發(fā)者生態(tài),能讓中國AI影響力滲透到更多國家和地區(qū)。
國產(chǎn)化不是打造封閉系統(tǒng)
在中國AI崛起的道路上,國產(chǎn)化的本質(zhì)不是打造封閉系統(tǒng),而是要更多國產(chǎn)廠商參與加入建設(shè)生態(tài)。只有擁有國產(chǎn)化生態(tài),中國AI才算真正在全球獨立擁有一席之地。
商湯的國產(chǎn)化路線也從來不是一家公司在單打獨斗,而是長期堅持對外開放合作。
國產(chǎn)芯片廠一直是商湯科技重要的合作同盟,華為昇騰、寒武紀(jì)、本月A股科創(chuàng)板上市的兩家國產(chǎn)芯片公司摩爾線程、沐曦都是這個同盟里的重要成員。
以沐曦為例,商湯與其的合作不僅停留在產(chǎn)品采購與技術(shù)支持的層面,而是從戰(zhàn)略層面達(dá)成了長期穩(wěn)定的合作協(xié)議。產(chǎn)品技術(shù)層面,雙方形成了底層技術(shù)開放共建共享的模式,共同開展技術(shù)深度適配、產(chǎn)品解決方案聯(lián)合開發(fā)以及軟硬件協(xié)同開發(fā)等工作。商業(yè)化落地層面,商湯與沐曦通過技術(shù)深度適配,確保了沐曦GPU在商湯大裝置中的高效運行,兩家公司還聯(lián)合開發(fā)了一體機(jī)、平臺適配、模型適配等多款產(chǎn)品解決方案,滿足了不同行業(yè)客戶的多樣化需求。
前兩年,高端芯片一卡難求,國產(chǎn)化的目標(biāo)就是解決這樣的風(fēng)險。商湯與多家國產(chǎn)AI芯片企業(yè)深度合作,共同攻克“卡脖子”技術(shù),實現(xiàn)算力自主可控,推動了中國AI算力的自主可控與產(chǎn)業(yè)發(fā)展,形成“技術(shù)互補(bǔ)、資源共享、場景互哺”的合作生態(tài),也可減少市場對供應(yīng)鏈短缺的擔(dān)憂。
除了芯片廠外,商湯的合作同盟還在不斷加入新成員,數(shù)據(jù)廠商、AI公司等等。反過來,與國產(chǎn)同盟建立的國產(chǎn)化生態(tài)也在創(chuàng)造更多可能性。例如商湯和記憶張量公司合作,攻克了GPU硬件架構(gòu)適配難度遠(yuǎn)高于NPU的行業(yè)難題,實現(xiàn)了Prefill-Decoding分離(預(yù)填充-解碼分離)技術(shù)在國產(chǎn) GPU 上單卡并發(fā)效率提升 20%、吞吐量增長 75% 的亮眼成績,把推理性價比大幅提升150%。
生態(tài)無法一天建成,國產(chǎn)化是一條要花很長時間走的路,但路的盡頭方向明確,商湯已經(jīng)出發(fā)走在前面,接下來會有更多同行者加入。

