了解金山云最新資訊
2026-01-26 00:00:00
當全世界還在爭論大模型是否只是一個昂貴的“泡沫”時,金山云高級副總裁劉濤表示,這不是泡沫。
支持他論斷的,是正在發(fā)生的“Vibe Coding(沉浸式開發(fā))”熱潮——當Claude Code已經可以熟練地用自己寫的代碼來迭代自身時,機器人造機器人、代碼寫代碼的“奇點”已經真實地觸碰到了產業(yè)界的脊梁。
面對這個變化,金山云出招了。1月21日,金山云宣布智算平臺“金山云星流”全面升級,其不僅包含了覆蓋模型全生命周期的訓推平臺,還正式發(fā)布了機器人平臺和模型API服務。
這家老牌云服務商正試圖通過身份的自我重塑,積極投身這場關于未來生產力主導權的角逐。
過去一年,智算需求持續(xù)增長,主要推手已從頭部企業(yè)的訓練需求,悄然轉向了推理側的爆發(fā)。
數(shù)據(jù)非常直觀,火山引擎日均Token調用量已沖上50萬億大關;豆包、千問、元寶等模型的外溢需求正以不可思議的速度擴張。這種爆發(fā)式的Token消耗,本質上是AI落地現(xiàn)實場景的過程。對于企業(yè)而言,大模型不再是PPT里的點綴,而是實打實的降本增效工具。
“我們一直在關注推理什么時候爆發(fā),這種增速超過了過去所有IT基礎設施的認知?!苯鹕皆浦砜偛脤O曉感慨道。
在這種背景下,金山云將自己定位為工程化的陪伴者,其邏輯非常純粹:既然大模型正成為萬物互聯(lián)的“大腦”,那么云廠商就需要提供配套的“循環(huán)系統(tǒng)”——穩(wěn)定、高效且具備超高性價比的Token服務。
金山云走的是一條“任務驅動”的邏輯演進路線。2023年,行業(yè)主題是“大規(guī)模智算網基礎設施建設”,比拼的是對底層異構資源的管理能力。2024年,重點演進為“平臺化和Serverless(無服務器計算)”,核心是將資源交付轉變?yōu)槿蝿战桓丁6搅?026年,升級后的“金山云星流平臺”則錨定了三個核心主題:追求效率提升、構建行業(yè)平臺、加速推理落地。
這種轉變在于,智算時代的訓練任務極其脆弱,在大規(guī)模算力集群下,任何一點硬件波動都可能導致整個訓練任務的中斷。為了解決這個“釘子”,金山云自研了一套基于故障感知的自愈技術。
這套系統(tǒng)能針對硬件故障和軟硬結合故障進行分級處理。有些故障重啟即可,有些則需立即啟動替換策略。孫曉透露,這套機制可以實現(xiàn)“秒級感知”和快速處理。這意味著,即便底層硬件出現(xiàn)波動,客戶的一輪訓練任務也能在不中斷的情況下平穩(wěn)度過。
具身智能,是金山云眼中智算云的“下半場”,也是金山云重點關注的未來。
無論是自動駕駛還是人形機器人,行業(yè)目前仍處于一個“混沌場景”中,百花齊放但痛點固化。不同廠商有的關注大腦,有的關注小腦,有的則卡在數(shù)據(jù)仿真上。
金山云發(fā)布的“金山云星流機器人平臺”,試圖打通從數(shù)據(jù)采集、存儲、標注到模型訓練、部署與仿真的全鏈路閉環(huán)。孫曉認為,機器人場景需要解決的是“從算法研發(fā)到真實場景部署”的落地難題。
以自動駕駛為例,模型在車端,但訓練在云端,這對算力密度的要求或許沒那么高,但對顯存和多模態(tài)點云數(shù)據(jù)的處理能力要求極高。金山云通過構造閉環(huán)的數(shù)據(jù)平臺,讓客戶能更便捷地接收、處理這些海量數(shù)據(jù)。
劉濤在展望未來時描繪了一個畫面:2026年起,家庭場景機器人將逐步落地。從最初幫老人撿襪子、撿毛巾,到最終輔助生活,這是一個跨度長達5到10年的萬億賽道。而金山云要做的,就是成為這個萬億賽道的“底座”和“引擎”。
隨著傳統(tǒng)公有云市場進入存量博弈,智算云正帶來全新的增長機會。金山云能夠在去年三季度實現(xiàn)120%的同比增速,本質上是因為它抓住了這一波生產力重構的機會。
堅持“不做大模型”的承諾,反而讓金山云在生態(tài)建設上變得極度開放。孫曉坦言,他們的職責是基于開源模型,依托自研技術,提供最穩(wěn)定、最具性價比的Token服務。業(yè)內熱門模型一發(fā)布,金山云當天就能上線推理服務,這種響應速度在行業(yè)內也處前列。
在智算時代,配套產品正在發(fā)生劇變。過去是計算、存儲、網絡,現(xiàn)在則是以推理加速為核心的技術棧(包括引擎、算子優(yōu)化),以及圍繞Agent(智能體)構建的生態(tài)。金山云正通過PD分離(預填充和解碼分離)以及量化技術,壓低推理時延,提升吞吐性能。
甚至在某些爆款游戲的背后,金山云也在提供全棧云服務。在重負載、高并發(fā)的開服階段,金山云通過平臺化+工程師重保的機制,平穩(wěn)支撐了海量玩家的涌入。這種從游戲重保中沉淀下來的極限壓測經驗,正被移植到大模型推理的戰(zhàn)場上。
過去十年的云市場,是一場關于資源規(guī)模的博弈,云廠商扮演的是類似水電煤的“公用事業(yè)”角色。到了2026年,技術端的“內卷”仍將繼續(xù)。從更大的參數(shù)量到更先進的計算方式(如MLA或線性Attention),國內的大模型廠商依然在瘋狂追求效率的極限。
但真正的分水嶺在于“應用”。視頻生成的實用化、VLA模型在車端與機器人端的泛化、以及Agent在老百姓日常生活中的滲透,將讓推理需求呈現(xiàn)指數(shù)級增長。
智算云的紅利期不會永遠持續(xù),只有那些能解決極限工程難題、能打通行業(yè)數(shù)據(jù)閉環(huán)、能提供超高性價比Token的廠商,才能在潮水退去后依然立于潮頭。
“我們已經打下了良好的客戶基礎,未來3到5年,金山云會有一個顯著的變化?!眲判臐M滿。
當智算的齒輪加速轉動,這場關乎生產力主導權的競賽,才剛剛進入最殘酷、也最精彩的深水區(qū)。