了解金山云最新資訊
2026-01-27 00:00:00
過去一年,如果僅從“算力需求增長”來理解中國智算產(chǎn)業(yè)的變化,顯然是不夠的。
在 2026 年 1 月 21 日舉辦的金山云年度 Tech Talk 上,金山云對其過去一年智算業(yè)務(wù)的演進進行了系統(tǒng)性回顧。從公開財報數(shù)據(jù)到客戶側(cè)真實使用情況,這些信息拼湊出了一幅更清晰的圖景:智算需求并非簡單放量,而是在訓(xùn)練、推理、應(yīng)用形態(tài)和工程方式等多個層面同時發(fā)生結(jié)構(gòu)性變化。
這場變化的核心,不再只是“誰擁有更大規(guī)模算力”,而是圍繞模型如何被使用、Token 如何被消耗、算力如何被組織展開。
變化首先體現(xiàn)在財務(wù)數(shù)據(jù)上。
根據(jù)金山云披露的公開財報,其智算云業(yè)務(wù)在過去一年實現(xiàn)了高速增長。以 2025 年第三季度為例,智算云賬單收入達到 7.8 億元人民幣,同比增長接近 120%。這一數(shù)據(jù)并非孤立,而是延續(xù)了此前多個季度的增長趨勢,顯示智算已成為金山云收入結(jié)構(gòu)中的重要組成部分。
金山云高級副總裁劉濤在分享中提到了金山云對這一趨勢的判斷:智算需求的增長重心,正在從訓(xùn)練側(cè)逐步向推理側(cè)轉(zhuǎn)移。
從訓(xùn)練視角看,過去幾年國內(nèi)智算需求的主要推動力,來自少數(shù)對算力高度敏感的行業(yè)。
自動駕駛與具身智能,是其中最典型的代表。這些行業(yè)往往需要長期訓(xùn)練模型,并處理視頻、點云、傳感器等海量多模態(tài)數(shù)據(jù)。在早期階段,它們對算力的需求更多集中在訓(xùn)練規(guī)模本身。
但與通用大模型不同,這類行業(yè)模型并不一味追求參數(shù)規(guī)模最大化。劉濤在分享中指出,自動駕駛和具身智能模型在訓(xùn)練階段,對算力密度的要求并不極端,但對顯存容量和數(shù)據(jù)處理能力要求更高。
這意味著,它們對算力平臺的訴求,正在從“算力數(shù)量”轉(zhuǎn)向“系統(tǒng)能力”——包括數(shù)據(jù)接入、預(yù)處理、多模態(tài)調(diào)度以及訓(xùn)練全流程的工程化效率。
推理側(cè)的變化更加顯著。
如果說訓(xùn)練側(cè)的變化仍然是漸進的,那么推理側(cè)的變化則更為直接和激烈。
一個被反復(fù)引用的數(shù)據(jù),來自火山引擎在其公開發(fā)布會上的披露:平臺每日 Token 調(diào)用量已達到 50 萬億級別。這是當(dāng)前國內(nèi)少數(shù)被明確對外公布的 Token 規(guī)模數(shù)據(jù)之一,也成為行業(yè)理解推理負載的重要參考。
與此同時,多個面向大眾或企業(yè)的模型產(chǎn)品正在持續(xù)擴大推理需求。例如豆包、通義千問以及近期加大投入的騰訊元寶,都在不同程度上推動 Token 消耗快速增長。
這些產(chǎn)品并不完全運行在同一云平臺上,但它們共同指向一個事實:推理階段正在成為智算需求增長的主要來源,且這種增長具備明顯的外溢性。
在所有推理場景中,編程類應(yīng)用被反復(fù)強調(diào)。
劉濤指出,2025 年一個尤為顯著的變化在于:編程相關(guān)請求正在成為 Token 消耗的主力場景之一。這一判斷并非孤立,而是與海外模型使用結(jié)構(gòu)的統(tǒng)計結(jié)果高度一致。
“Vibe Coding”成為一個關(guān)鍵詞。一個廣為流傳的事實是,Claude Code 的大量代碼本身,正是由 Claude Code 參與生成的。這意味著模型不再只是輔助工具,而是深度介入軟件生產(chǎn)過程。
從全球 Token 調(diào)用結(jié)構(gòu)來看,編程類請求在多家模型服務(wù)商中長期占據(jù)超高比例。金山云也觀察到了同樣的趨勢:代碼生成、重構(gòu)和理解能力的提升,正在顯著改變程序員的工作方式,并直接放大推理側(cè)算力需求。
在具體應(yīng)用層面,互聯(lián)網(wǎng)客戶仍然是智算需求的重要來源,但其需求形態(tài)已經(jīng)發(fā)生變化。劉濤提到,當(dāng)前互聯(lián)網(wǎng)場景呈現(xiàn)出三個明顯特征:
其一,多模態(tài)需求顯著增長。視頻生成、視頻理解以及復(fù)雜推理任務(wù),帶動了訓(xùn)練與推理負載的持續(xù)上升;
其二,模型參數(shù)規(guī)模不再單向膨脹,而是圍繞具體任務(wù)進行結(jié)構(gòu)性調(diào)整;
其三,Vibe Coding 在頭部互聯(lián)網(wǎng)公司中已較為普及,使用更強的商用模型進行代碼開發(fā),正在成為常態(tài)。
這些變化意味著,互聯(lián)網(wǎng)客戶對智算平臺的期待,已經(jīng)從“算力服務(wù)”升級為對模型生命周期管理和工程體系的整體依賴。
為了滿足更多元化的需求,劉濤表示,2025 年,智算平臺金山云星流已完成從資源管理平臺向一站式 AI 訓(xùn)推全流程平臺的戰(zhàn)略升級。從訓(xùn)推平臺、機器人平臺到模型 API 服務(wù),升級后的金山云星流平臺構(gòu)建了從異構(gòu)資源調(diào)度、訓(xùn)練任務(wù)故障自愈到機器人行業(yè)應(yīng)用支撐、模型 API 服務(wù)商業(yè)化落地的全鏈路閉環(huán)。
盡管各行各業(yè)大規(guī)模應(yīng)用 AI 還處于早期探索階段,但定位行業(yè)助力者的金山云,多年來持續(xù)打磨全棧 AI 能力。從 2023 年的智算網(wǎng)基礎(chǔ)設(shè)施,到 2024 年智算云的平臺化和 Serverless 化,再到 2025 年的一站式 AI 訓(xùn)推全流程平臺,通過提升平臺效率、突破行業(yè)邊界、加速推理布局,金山云為迎接 AI 應(yīng)用爆發(fā)做好了充分準(zhǔn)備。
在平臺效率方面,金山云星流訓(xùn)推平臺提供從模型開發(fā)、訓(xùn)練到推理的完整生命周期管理,具備開發(fā)、訓(xùn)練、推理和數(shù)據(jù)處理四大模塊能力,通過降低多模塊協(xié)同復(fù)雜度,能實現(xiàn)“開箱即用”的 AI 開發(fā)體驗。自研的 GPU 故障自愈技術(shù)結(jié)合任務(wù)可觀測性設(shè)計,可實時監(jiān)控硬件健康狀態(tài)與任務(wù)進程,自動觸發(fā)故障遷移與任務(wù)重調(diào)度,降低算力中斷風(fēng)險,保障長周期訓(xùn)練任務(wù)穩(wěn)定運行。
作為面向機器人開發(fā)與落地的全鏈路云原生平臺,金山云星流機器人平臺深度融合數(shù)據(jù)采集、存儲、標(biāo)注、模型開發(fā)、訓(xùn)練、部署與仿真等核心環(huán)節(jié),打造具身場景專屬的數(shù)據(jù)、模型、仿真一體化引擎。平臺率先實現(xiàn)具身智能數(shù)據(jù)工程領(lǐng)域采集、標(biāo)注、管理的全鏈路閉環(huán),可高效服務(wù)具身智能行業(yè)模型訓(xùn)練、仿真應(yīng)用場景分析等核心需求,助力客戶快速完成從算法研發(fā)到真實場景部署的全流程落地,最終推動機器人產(chǎn)業(yè)的智能化升級。
面向大模型應(yīng)用開發(fā)者和企業(yè)用戶,金山云星流平臺模型 API 服務(wù)提供高可用、易集成的模型調(diào)用與管理能力,覆蓋模型調(diào)用的全生命周期。該服務(wù)支持高并發(fā)推理與多模型管理,能夠幫助用戶高效接入多種模型資源,助力大模型應(yīng)用落地。目前,金山云星流平臺模型 API 服務(wù)已積累諸多行業(yè)客戶。
同時,金山云星流平臺的模型生態(tài)也在持續(xù)豐富。目前,平臺已支持近 40 種不同模型,包括 DeepSeek、Xiaomi MiMo、Qwen3、Kimi 等??蛻敉ㄟ^一站式訪問,即可高效接入多種模型,在暢享穩(wěn)定高效云服務(wù)的同時,更加聚焦 AI 業(yè)務(wù)創(chuàng)新和價值創(chuàng)造。