文|IT時(shí)報(bào) 賈天榮
編輯|錢立富 孫妍
上周,深度求索(DeepSeek)正式推出DeepSeek-V3.1大語言模型,并宣布自9月6日起調(diào)整API定價(jià)并取消夜間優(yōu)惠。根據(jù)最新定價(jià)策略,輸入部分在緩存命中時(shí)為0.5元/百萬tokens,緩存未命中為4元/百萬tokens;輸出部分定價(jià)為12元/百萬tokens。相比之下,此前V3版本的輸入價(jià)格為0.5元/百萬tokens(緩存命中)和2元/百萬tokens(未命中),輸出價(jià)格為8元/百萬tokens,且在0點(diǎn)30分至8點(diǎn)30分的夜間時(shí)段還可享受五折優(yōu)惠。
值得關(guān)注的是,根據(jù)官方說明,V3.1采用的UE8M0 FP8精度是針對(duì)下一代國產(chǎn)芯片設(shè)計(jì)的,這可能意味著DeepSeek在硬件適配方面投入了更多資源,而這些成本最終體現(xiàn)在API價(jià)格上。
《IT時(shí)報(bào)》注意到,今年越來越多AI大模型企業(yè)不再繼續(xù)降價(jià),而是開始上調(diào)價(jià)格。國內(nèi)多家大模型的優(yōu)惠期將在9月結(jié)束,不少廠商的新一代產(chǎn)品定價(jià)已顯著高于前代。
當(dāng)以“性價(jià)比”著稱的國產(chǎn)大模型,從單純的價(jià)格競爭轉(zhuǎn)向價(jià)值競爭,背后是成本壓力的集中爆發(fā),還是意味著價(jià)格戰(zhàn)告一段落,行業(yè)正步入真正的“深水區(qū)”?
漲價(jià)后 DeepSeek仍具價(jià)格優(yōu)勢
相比DeepSeek-V3發(fā)布之初的優(yōu)惠價(jià)格,DeepSeek-V3.1輸入輸出價(jià)格上漲了數(shù)倍。盡管如此,DeepSeek-V3的價(jià)格仍遠(yuǎn)低于目前最頂尖的閉源大模型,如GPT-5和Claude Opus 4.1。
記者注意到,GPT-5的輸入價(jià)格為1.25美元(約8.9元人民幣)/百萬tokens,輸出價(jià)格為10美元/百萬tokens。
Google的Gemini 2.5 Pro基礎(chǔ)定價(jià)與GPT-5一致:輸入價(jià)格為1.25美元/百萬tokens,輸出為10美元/百萬tokens。然而,在處理超過20萬tokens的長文本時(shí),其價(jià)格會(huì)翻倍——輸入價(jià)格提升至2.5美元,輸出價(jià)格提升至15美元。
在眾多大模型中,Anthropic的Claude Opus 4.1定價(jià)甚高:輸入價(jià)格為15美元/百萬tokens,輸出更是高達(dá)75美元。
即便與“中檔”模型相比,DeepSeek-V3.1仍具備一定的價(jià)格優(yōu)勢。例如:Claude Sonnet 4的輸入價(jià)格為6美元/百萬tokens、輸出為15美元;GPT - 5-mini的輸入價(jià)格為0.25美元,輸出為2美元。
多家廠商開始漲價(jià)
值得注意的是,這并非DeepSeek首次調(diào)整API價(jià)格。
2025年2月9日,DeepSeek-V3結(jié)束了發(fā)布初期的優(yōu)惠政策。當(dāng)時(shí),其每百萬tokens輸入價(jià)格(緩存命中/未命中)分別為0.1元和1元,輸出價(jià)格為2元。優(yōu)惠取消后,價(jià)格全面上調(diào):輸入價(jià)格調(diào)整為0.5元(命中)和2元(未命中),輸出價(jià)格升至8元。
回顧過去一年,大模型市場價(jià)格幾經(jīng)起伏。去年7月,《IT時(shí)報(bào)》曾報(bào)道,大模型廠商掀起空前降價(jià)潮:字節(jié)跳動(dòng)率先出手,BAT等企業(yè)緊隨其后,紛紛將百萬tokens價(jià)格壓至1元,甚至打出“免費(fèi)、全面免費(fèi)、永久免費(fèi)”的口號(hào),力度之大堪稱“炸場”。
當(dāng)時(shí),百度智能云市場部相關(guān)負(fù)責(zé)人在接受《IT時(shí)報(bào)》采訪時(shí)表示:“價(jià)格戰(zhàn)至少持續(xù)一年。三類企業(yè)可能被淘汰:套殼類企業(yè)、云基礎(chǔ)設(shè)施薄弱的企業(yè),以及缺乏數(shù)據(jù)飛輪能力的廠商。真正能存活下來的企業(yè),將占據(jù)市場份額并實(shí)現(xiàn)盈利。待市場格局趨于成熟和穩(wěn)定,大模型才能真正進(jìn)入客戶核心業(yè)務(wù)流,即所謂的‘深水區(qū)’?!?/p>
同樣在那一輪“價(jià)格戰(zhàn)”期間,一家AI智能體公司負(fù)責(zé)人也向《IT時(shí)報(bào)》表示:“大模型的定價(jià)已無法覆蓋成本,但廠商仍選擇降價(jià),核心目的是收集數(shù)據(jù)。”他舉例稱,GPT-4o采取“對(duì)公眾免費(fèi)、對(duì)開發(fā)者半價(jià)”的策略,以此獲取大量多輪對(duì)話等交互數(shù)據(jù),這些動(dòng)態(tài)數(shù)據(jù)比靜態(tài)數(shù)據(jù)更能快速提升模型能力。國產(chǎn)大模型同樣處于這一“燒錢換數(shù)據(jù)”的階段。
進(jìn)入2025年,市場出現(xiàn)轉(zhuǎn)折。越來越多廠商選擇停止降價(jià),甚至開始漲價(jià)。記者注意到,國內(nèi)多家大模型的優(yōu)惠期將在今年9月結(jié)束,不少廠商的新一代產(chǎn)品定價(jià)已顯著高于前代。
以“大模型六小龍”為例,智譜、月之暗面、MiniMax、階躍星辰等企業(yè)近期發(fā)布的產(chǎn)品價(jià)格均有所上漲。
智譜“全系模型享受五折優(yōu)惠”活動(dòng)截止日期為2025年8月31日。以其面向智能體打造的旗艦GLM-4.5系列為例,優(yōu)惠結(jié)束后,最高檔產(chǎn)品GLM-4.5-X的輸入價(jià)格將達(dá)16元/百萬tokens,輸出價(jià)格為64元。相比之下,其上一代旗艦GLM-4-Plus發(fā)售之初定價(jià)為50元/百萬tokens,而今年4月曾一度降至5元/百萬tokens。
月之暗面于8月1日推出Kimi K2高速版(Kimi-K2-turbo-preview),其參數(shù)與Kimi-K2一致,但輸出速度從每秒10 tokens提升至40 tokens。目前,該模型處于五折優(yōu)惠期,9月1日后恢復(fù)原價(jià),屆時(shí)輸入價(jià)格(緩存命中)為4元/百萬tokens、未命中為16元,輸出價(jià)格為64元。
MiniMax在2024年8月將旗艦?zāi)P蚢bab-6.5s大幅降價(jià)至1元/百萬tokens(輸入輸出同價(jià))。今年1月,其發(fā)布新一代文本生成模型MiniMax-Text-01,定價(jià)為輸入1元/百萬tokens,輸出8元/百萬tokens。6月上線的推理模型MiniMax-M1采用階梯定價(jià),最高檔為輸入2.4元/百萬tokens、輸出24元/百萬tokens。
階躍星辰的情況也類似。今年4月發(fā)布的Step-R1-V-Mini多模態(tài)推理模型輸出價(jià)格為8元/百萬tokens,而7月推出的新一代模型Step 3改為階梯定價(jià),低檔位價(jià)格略有下降,但最高檔(4k上下文)輸出價(jià)格升至10元/百萬tokens。
飛速發(fā)展難掩成本壓力
從去年的“價(jià)格戰(zhàn)”到如今的“漲價(jià)潮”,大模型行業(yè)正經(jīng)歷重要轉(zhuǎn)折。一方面,市場格局趨于穩(wěn)定,大模型企業(yè)進(jìn)入“深水區(qū)”競爭;另一方面,運(yùn)營成本壓力日益凸顯。
傳神語聯(lián)創(chuàng)始人何恩培在接受《IT時(shí)報(bào)》記者采訪時(shí)直言,大模型漲價(jià)是“必然的”?!巴耆赓M(fèi)的模式難以長期持續(xù)。”他解釋,互聯(lián)網(wǎng)時(shí)代的主要成本集中在帶寬,而大模型的運(yùn)行不僅依賴數(shù)據(jù)流量,還需要龐大算力和算法優(yōu)化,這些都會(huì)帶來高昂的開支。相比傳統(tǒng)互聯(lián)網(wǎng)服務(wù),大模型的運(yùn)營成本顯然更高,因此“免費(fèi)階段注定短暫,漲價(jià)不可避免”。
過去一年大模型廠商在算力、數(shù)據(jù)和人才上的投入推動(dòng)了技術(shù)快速迭代,然而與之形成鮮明反差的是,盈利難題仍未解決,即便是行業(yè)龍頭企業(yè)也尚未摸索出長期可行的商業(yè)路徑。
當(dāng)?shù)貢r(shí)間8月20日,OpenAI首席財(cái)務(wù)官Sarah Friar表示,OpenAI在7月首次實(shí)現(xiàn)10億美元的單月營收,但公司仍面臨人工智能算力短缺的壓力。
此前有消息稱,OpenAI預(yù)計(jì)今年?duì)I收將增長3倍,達(dá)到127億美元。收入增長的同時(shí),算力成本巨大。OpenAI CEO山姆·奧爾特曼(Sam Altman)表示,公司未來將投入上萬億美元建設(shè)數(shù)據(jù)中心。如何平攤這些成本、吸引更多付費(fèi)用戶,成為OpenAI面臨的挑戰(zhàn)。
何恩培進(jìn)一步指出,如果大模型長期依賴免費(fèi)或低價(jià)策略,可能對(duì)市場生態(tài)造成一定影響。他認(rèn)為,從免費(fèi)到收費(fèi)、從低價(jià)到漲價(jià)的轉(zhuǎn)變,可能引發(fā)市場認(rèn)知混亂,增加企業(yè)的市場教育成本。
對(duì)于API漲價(jià)是否會(huì)削弱客戶需求,何恩培認(rèn)為差異主要存在于B端和C端:B端客戶更關(guān)注綜合成本,尤其重視定制化、安全性和穩(wěn)定性;而C端用戶往往忽視“免費(fèi)”背后的潛在成本?!霸贐端,所謂的‘免費(fèi)’并不真正免費(fèi),客戶最終仍需為定制化服務(wù)和開發(fā)付費(fèi)?!彼硎尽?/p>
不過,何恩培也強(qiáng)調(diào),隨著技術(shù)進(jìn)步和算力價(jià)格逐漸下降,大模型長期成本壓力有望緩解。但這并不意味著價(jià)格會(huì)立刻下調(diào),其變化仍取決于市場需求和競爭環(huán)境?!按竽P偷纳虡I(yè)化仍處于初期,行業(yè)面臨諸多挑戰(zhàn)。未來能否找到收費(fèi)模式與技術(shù)成本之間的平衡,將成為發(fā)展的關(guān)鍵?!?/p>
排版/ 季嘉穎

