产品介绍
梯度智能云是基于Kubernetes的容器云平台。解决开发、测试、运行环境统一、服务快速部署、运行期服务管理等调度问题。提供物理机、虚拟机、私有云、公有云统一接入的能力,屏蔽应用对基础设施层的依赖。

以应用为中心提供全方位的管理,秒级部署应用,保障用户体验流畅。

资源统一管理,高效共享,按需分配,集群资源实时监控,实现灵活调度和环境隔离。

自动发现,对于运行了从节点安装脚本的主机,可自动发现并出现在主机管理列表中

提供代码获取、代码检查、代码编译、镜像构建、自动化部署等功能。

易于扩展的分布式存储架构,提高系统可靠性、可用性和读写效率。

丰富的监控指标,对应用、集群、主机、站点等各项业务资源情况进行实时监控,及时告警。

多台服务器之间实现流量均衡分配,通过消除单点故障提升应用系统可用性。

对多租户提供灵活的权限管理以及资源的有效隔离。

收集并存储所有操作日志以及业务应用运行日志等。

轻松部署、更新、测试以及治理其微服务应用。

精准域名解析,包括对域名信息修改,设置域名解析记录

通过配置中心单独管理配置文件,方便用户在多环境间使用不同配置。

多种构建方式,从代码仓库自动镜像构建、 基于外部文件构建镜像、支持命令上传镜像等

产品功能介绍
  • 应用中心
  • 交付中心
  • 资源管理
  • 监控中心
  • 日志中心
  • AI中心
  • 租户管理
  • 微服务管理

以应用为中心提供全方位的管理;秒级部署应用,保障用户体验流畅;多重防护措施保障应用安全稳定运行。

应用管理

秒级部署
支持通过镜像一键秒级部署应用,并支持应用部署到不同的群集环境(开发、测试、预发布、生产等)。
应用运行全方位管理
提供对应用基础资源使用情况以及运行状况的监控;
包括:应用基础资源(磁盘、内存、网络)、应用实例、日志、配置等全方位的管理和监控;
支持对应用的创建、删除、启停、重新部署等操作。
可指定应用实例IP
应用实例IP可固定不变,具备虚拟机特性,操作简单方便。

配置管理

配置文件与镜像分离
通过配置中心单独管理配置文件,方便用户在多环境间使用不同配置。
简单易用的功能设计
提供配置组功能,方便用户批量操作;
支持对配置组或文件增删改查、导入导出等功能。

域名管理

域名解析
精准域名解析,包括对域名信息修改,设置域名解析记录如:A记录、CNAME记录、MX记录、NS等;
可将域名跟应用关联并支持客户端访问应用地址。
实时生效,安全可靠
解析记录修改后可秒级同步到DNS服务器 。

负载均衡

高可用、高性能
梯度智能云负载均衡可在多台云服务器间实现流量自动分配,通过消除单点故障提升应用可用性。
支持在线扩容或缩容
根据业务负载伸缩,消除单台服务器负载瓶颈、增加吞吐量、加强网络数据处理能力。
提高网络的灵活性可用性,对多台云服务器自动进行流量分发,扩展系统服务能力。
支持多种服务协议和调度算法
平台提供了http、https、tcp三种协议;轮询、静态轮询、最少连接优先、源地址哈希四种调度算法。
传统架构配置管理 / 梯度智能云配置管理
对于峰值流量高的高并发业务场景,如限时促销、周期性活动等,启用负载均衡对业务系统进行流量分发,弹性扩展应用系统对外的服务能力,实时对后端资源进行弹性调控,降低建设和运维成本。

以应用的可持续交付为标准;支持对代码的检查、编译、打包、镜像构建,到镜像一键部署应用的自动化生产流程;满足业务发展对版本快速更新和迭代的需求,提高开发效率。

镜像管理

多种构建方式
从代码仓库自动镜像构建、 基于外部文件构建镜像、支持命令上传镜像等。
基础功能
支持对镜像的分类查询、镜像版本复制;
用户可对镜像设定公开、私有或对镜像收藏等操作;
支持不同镜像版本镜像配置记录编辑等操作管理。

持续集成

梯度智能云为支持应用持续交付提供了包括代码获取、代码检查、代码编译、镜像构建、自动化部署等功能。

镜像仓库

安全可控
镜像仓库支持镜像安全扫描;支持多环境多用户的权限控制。
高可用
镜像仓库采用高可用的架构,并支持镜像远程同步。;

以提供弹性的基础设施资源为标准;基于容器技术实现对服务器资源的池化,实现整体资源的最大化利用;轻松管理超大规模集群,根据业务需求统一分配和调度资源。

主机管理

自动发现
对于运行了从节点安装脚本的主机,可自动发现并出现在主机管理列表中。
灵活弹性
可灵活设置实例在主机上的调度策略;
可以根据业务发展需要扩展和缩减主机规模,实现主机资源的弹性扩展。;

集群管理

服务器资源池化
实现资源的统一管理,高效共享,按需分配,对集群的资源使用情况
进行实时监控,实现资源的灵活调度和环境隔离。
集群类型可配置
用户根据需要可配置开发、测试、预发布、生产环境的集群。
基础功能
支持物理主机或虚拟主机加入到集群中,
云平台提供主机的自动发现功能,方便主机统一管理。

网络管理

帮助用户构建容器的隔离网络环境
用户可根据访问业务需求自定义 IP 地址范围,创建子网,并在子网内创建主机,为集群或者应用分配指定的IP,通过网络管理可以实现网段的规划和集群对应,部署应用时选择集群网段,就可以给实例分配对应的IP。
IP使用情况可视化
支持查看网段中IP的使用情况,并可对IP启用和禁用等相关操作。

安全可靠

不同集群网络间保证100%二层隔离,支持对任意应用实例加载动态 IP, 配置负载均衡规则。

性能卓越

容器间网络通过BGP进行路由交换,减少中间环节处理,提高了整体网络性能。

大规模部署

单个集群网络可管理 5000+台主机节点,适应混合云和私有云的不同部署需求。

共享存储

稳定高效、安全可靠、灵活便捷的存储管理
企业级分布式存储方式采用可扩展的系统结构,利用多台存储服务器分担存储压力,提高系统的可靠性、可用性和读写效率,并易于扩展可满足不同的业务场景需求。

在线扩容

支持在线弹性扩展,上层业务无感知。

大容量

分布式存储架构,可支持大容量的存储管理,根据应用业务需求实现存储卷灵活配置。

更稳定安全

所有存储卷基于资源池化技术实现的分布式存储方式,单台存储物理机出现故障,对业务无任何影响。

全面有效的监控方式,丰富的监控指标; 监控中心支持业务和资源层面的全方位监控,丰富的监控指标,能全面、有效、准确、及时的监控用户业务应用及资源运行状态,保障对监控对象的及时准确告警。

监控大盘

全面有效的监控方式
支持对主机(CPU、内存、磁盘用量、网络)、集群、站点、应用实例等进行全方位监控。
监控告警实时上报
可实时上报告警发生情况及正在告警的应用情况等。
指标灵活配置
告警可配置
故障自愈

应用监控

帮助运维团队数据驱动决策业务资源
通过详实记录不同时间段应用的资源访问和使用情况,来预判业务资源使用的峰值和低谷。
监控指标
监控指标包括:应用及其实例的CPU、内存、使用率、网络吞吐量等业务指标,帮助运维团队根据数据决策灵活分配业务资源。

集群监控

多维度监控指标
CPU使用率、内存使用率、磁盘使用率、集群网络吞吐量、集群磁盘总容量等。
支持大规模集群监控
客户业务的不断发展,底层的资源需求也随之增大,越来越多的基础资源需要监控,日常监控的效率成为运维的瓶颈。智能云集群监控为用户亦提供了大规模集群监控场景。

聚合

聚合集群内主机的性能数据,通过聚合得到的总数据可便捷地了解资源运行的总体性能情况。

稳定可靠

当监控到集群下的某个主机资源负载过高时,部署的应用可自动调度到负载低的主机节点上。

主机监控

主要监控指标
对CPU、内存、网络吞吐量、磁盘用量、 节点负载等指标进行监控,让您全面了解云主机资源的运行状况。

站点监控

核心监控指标
站点可用率和平均响应时间统计;
可以轻松的了解站点的实时和历史可用率,并以详细的图表展示。
支持HTTP/HTTPS/TCP等协议,全面问诊网络业务健康
秒级监控频率
站点可用性监控
发现故障定位问题

告警规则

智能告警
支持多种告警通知方式,可实时通知运维人员业务运行状况;
对云资源的异常情况进行告警,并提供告警信息查看、告警自定义阈值、告警订阅等;
可根据自定义阈值每隔若干个时间检查,若达到告警触发条件,则发起告警通知。
快速创建自定义告警
自定义告警强大,但创建和设置非常的简单,简单几个选择便可配置一条规则。

监控模板

预置丰富的监控模板
平台预置丰富的监控模板类型,如:Mysql 、 redis、nginx等常用的业务监控模板。
支持模板的导入导出
可对导入的模板文件进行编辑、修改、保存为自定义模板等相关操作。

日志中心支持三种类型的日志统一收集包括:应用日志、平台日志、操作日志等;可自定义日志存储周期,方便日志存储容量控制;支持对日志的查询、分析、上下文检索等操作,方便运维快速定位问题。

应用日志

应用日志采集归类
收集、分析、关联、搜索和归档来自各集群上应用相关的多个日志源的日志数据;
支持关键词、自定义时间范围检索应用日志,支持日志上下文定位;
通过日志信息用户可以掌握设备及应用的状态,帮助用户分析问题和追查错误根源。

操作日志

跟踪用户对平台各模块的操作行为
包括:应用管理、主机管理、持续集成、监控中心、用户管理等操作模块;
每条操作日志都记载着详细的操作内容、操作结果、操作者及操作详情等相关信息,
所有操作日志数据可永久保存并支持自定义时间范围查询。

日志平台

满足用户TB级日志分析和处理要求
对平台运行的所有应用及组件的日志进行采集和归类;
支持采集指定范围内的日志,支持多种日志文件格式自动解析。
实时查询分析
可以实时索引日志数据,提供关键词、模糊、上下文、指定时间范围等丰富查询手段。

实时

写入后可以立即被分析。

快速

一秒内查询多个条件可处理亿级数据。

灵活

可以改变任意查询和分析条件,实时获取结果。

日志平台框架图

智能云AI中心基于TensorFlow分布式框架而研发的,以帮助用户提升其对人工智能应用的训练和计算速度,提供从数据处理、模型训练到服务托管的一站式服务,为企业的运维和智能业务分析带来更多的可能性,具有强大的硬件资源管理能力以及高效的模型开发能力。

训练管理

训练作业部署和管理,模型快速迭代
支持 GPU 加速训练和分布式训练,可视化部署训练作业。支持优先级队列批量创建训练任务,将AI科学家从资源调度和等待中彻底解放,可实现多 GPU 大规模分布式计算,加快模型训练与迭代。

一站式

集数据导入、数据处理、模型开发、模型训练、模型评估、服务上线等功能于一体,提供一站式全方位的深度学习建模流程,快速打造智能业务。

高效性、易用

高效管理和分配硬件资源,支持模型训练和模型服务的统一调度,操作简单,快速上手,无需用户运维和管理软硬件配置。

开源标准

引领云原生分布式机器学习潮流,树立业界标准,帮助用户打造更高效的人工智能应用。

异构资源管理

能有效的调度和管理各类异构硬件资源
帮助用户更好地管理人工智能业务计算和训练所需的GPU、FPGA、ASIC、SoC等形态的专有硬件资源等。

为租户提供成熟的多租户管理模型;为租户提供灵活的权限管理以及有效的资源隔离;平台实现租户间的资源高度共享,提供资源利用率。

权限控制

租户管理
租户可以在界面上根据业务需要管理租户,实现租户资源的有效隔离。
角色管理
支持租户自定义角色,通过不同的角色权限可实现对用户操作和访问控制。

租户隔离

多租户机制提供了可隔离的容器云网络环境,平台的基础资源可在租户间实现共享或隔离,平台租户间的数据与应用是完全隔离的。

权限管理机制

支持不同的组织架构形式,组织架构可以是一个公司、一个部门、一个团队、一个项目组或者简单一个人等。

租户配额管理

对租户的计算资源和存储资源进行动态配置和管理
可管理租户配额,可以实时查询所有租户资源(包括CPU、内存、存储)等使用情况。

通过云原生技术帮助用户快速实现易接入、易运维的微服务解决方案。用户可以轻松部署、更新、测试以及治理其微服务应用。平台完全基于开源技术构建,提供了简洁友好的接入方式,模块化设计,可实现与企业内 IT 基础设施的快速集成。

服务治理

完善的治理功能
支持无侵入的微服务治理,提供限流、熔断、重试、服务降级、负载均衡、故障注入等微服务治理功能,支持蓝发布、金丝雀发布,基于拓扑图和链路追踪的流量管理。

链路监控

链路性能监控
从整体维度到局部维度展示各项指标,将跨应用的所有调用链性能信息集中展现,可方便度量整体和局部性能,并且方便找到故障产生的源头,生产上可极大缩短故障排除时间。
请求链路追踪,故障快速定位
智能云链路监控可以通过调用链结合业务日志快速定位错误信息。

可视化

各个阶段耗时

进行性能分析

依赖优化

各个调用环节的可用性

梳理服务依赖关系以及优化

数据分析 优化链路

可以汇总分析应用

在很多业务场景

产品应用场景
混合云及多数据中心
梯度智能云架构面对不同的基础设施可实现对公有云、私有云、自有IDC等资源的整合。通过公有云+私有部署+专线网络为用户提供行业解决方案,重点解决存量IT资源合理利用;企业上云保持业务稳定,架构平滑过渡;多数据中心容灾等场景和需求。
传统架构向互联网架构转型
梯度智能云针对传统企业,应用迭代缓慢,业务交付经常被推迟;传统的单体架构应用难以维护和扩展;应用的运维管理比较复杂等技术难题,通过容器技术将传统应用容器化,或拆成微服务模式,让业务应用以整个容器为单元去运行,企业可选择最合适的技术去开发业务; 提高资源的利用率,以及支持自动的弹性伸缩扩展,比如说快速容灾容错等等。
企业数字化转型的基础设施
数字化转型所需的核心能力“统一的数据及流程”,需要一种创新的架构设计方法,梯度智能云以容器技术助力企业实现数字化转型,自动化运维,轻量级微服务架构能支持上亿级企业大数据分析和处理需求。
多环境、多资源池DevOps流水线
梯度智能云交付中心,持续集成涵盖编码、构建、测试、发布等多个环节功能。包括:自动化持续集成、自动化部署等,可实时监控应用,追踪应用的关键指标;实现回滚,可提取不同环境的配置,以构建自动化持续交付流水线,达到快速交付和安全可控的目的。
基础设施资产集中化管理
企业信息化过程中面临遗留系统太多;信息爆炸,数据异构,难以整合;企业需要电子商务支持,但技术异构,难以协同;业务变化快,僵化的IT基础设施难以迅速响应,这一切都迫切需要一个整合IT架构,梯度智能云能无缝的对接各类基础设施实现基础资源信息的互联互通。

智慧驱动,云领未来

0731-82253717