了解金山云最新資訊
2025-07-31 15:17:00
7月22日,由中國通信標準化協(xié)會主辦、中國信息通信研究院承辦的2025可信云大會在京舉辦。會上,金山云成為首批通過可信AI云數(shù)據(jù)安全能力檢測的企業(yè);同時,公司斬獲兩項技術典型實踐獎。
作為國內(nèi)云計算領域信任體系的權威評估,可信云自2013年至今已舉辦多屆云計算行業(yè)技術盛宴,是我國云計算產(chǎn)業(yè)發(fā)展的風向標。其系列標準及評估結果已成為政府支撐、行業(yè)規(guī)范、用戶選型的重要參考。
行業(yè)首批
金山云通過可信AI云數(shù)據(jù)安全能力檢測
隨著AI等前沿技術的快速發(fā)展,云與AI融合不斷加深,云上AI服務的用戶數(shù)據(jù)面臨超范圍收集、未經(jīng)授權使用、外部攻擊竊取等安全風險,解決隱私安全保護、數(shù)據(jù)價值成為當前企業(yè)面臨的難題。
憑借十余年技術積累與行業(yè)實踐經(jīng)驗,金山云圍繞數(shù)據(jù)處理全生命周期合規(guī)性、模型服務安全防護、安全機制長效保障三大維度構建核心能力,以便為用戶提供安全可靠的AI云服務。通過可信AI云數(shù)據(jù)安全能力評測,既充分印證了金山云的綜合實力,也彰顯了其主動對標行業(yè)安全標準、積極踐行合規(guī)責任的擔當。
落地價值凸顯
金山云斬獲兩項技術典型實踐獎
本次,金山云在智算云與智算集群服務類-智算平臺和云原生類-云原生AI分別斬獲技術典型實踐獎。
在智算云方面,金山云星流平臺針對AI落地中的算力異構、數(shù)據(jù)治理低效與部署復雜等痛點,構建了訓推一體化架構,通過算力動態(tài)調(diào)度、多模態(tài)數(shù)據(jù)治理及輕量化推理部署技術,實現(xiàn)了資源利用率與開發(fā)效率的雙升。目前,該平臺已在具身智能、自動駕駛等領域落地,有效助力企業(yè)降低開發(fā)成本,加速其智能化轉型進程。
金山云星流平臺核心優(yōu)勢:
提供從模型開發(fā)、訓練到推理的完整生命周期管理;
智能匹配異構算力資源與任務需求,保障GPU資源利用率;
集成分布式存儲系統(tǒng)與高速RDMA網(wǎng)絡架構,實現(xiàn)訓練數(shù)據(jù)高速提取、模型參數(shù)高吞吐傳輸;
任務級可觀測能力覆蓋開發(fā)、訓練、推理全流程;
實時監(jiān)控硬件健康狀態(tài)與任務進程,自動觸發(fā)故障遷移與任務重調(diào)度,保障長周期訓練任務穩(wěn)定運行;
提供細粒度角色權限控制、任務隔離及資產(chǎn)隔離功能,滿足多用戶權限控制場景的合規(guī)性要求。
在云原生方面,云原生AI套件以金山云容器服務為底座,結合大模型客戶實際業(yè)務的云原生化落地經(jīng)驗,支撐大模型訓練及推理業(yè)務。該套件涵蓋異構資源納管、AI負載調(diào)度、資產(chǎn)加速、智能運維、資源觀測等開箱即用的云原生組件,可在大模型場景下提供全鏈路能力支持。
云原生AI套件核心優(yōu)勢:
統(tǒng)一接入和管理AI業(yè)務所依賴的IaaS資源,并標準化對接至KCE集群內(nèi),實現(xiàn)統(tǒng)一調(diào)度和運維;
完全兼容原生Volcano,同時支持RDMA與GPU親和性拓撲調(diào)度、任務自愈優(yōu)先級調(diào)度、嚴格FIFO等高階調(diào)度策略,確保提升任務間通信效率、減少GPU資源碎片;
安卓APP式在集群一鍵部署熱門大模型服務。同時支持使用套件內(nèi)的分布式推理框架、鏡像/數(shù)據(jù)加速、智能網(wǎng)關等組件部署并暴露推理實例。
秒級感知集群GPU節(jié)點故障(140+Xid Error 、20+硬件故障),分鐘級完成故障自愈及熱備機替換,并支持按照業(yè)務定制化自愈流程;
提供AI任務依賴的多維度的全監(jiān)控指標及日志輸出,確保大模型任務全鏈路透明。
AI浪潮奔涌向前,金山云將持續(xù)深耕技術,在可信技術和數(shù)據(jù)安全領域持續(xù)發(fā)力,秉承更加開放、協(xié)同的生態(tài)理念,以不斷深化的服務能力助力客戶數(shù)智化轉型。