华为发布CloudFabric解决方案,构建极简高效的云数据中心网络

服务器 数据中心
行业数字化转型加速企业DC云化,预计到2025年85%的企业应用将部署到云上,云计算成为各行各业的基本能力,行业云兴起、企业成为云化主角。如何快速构建一个支撑数字化转型的云数据中心成为企业的当务之急,而数据中心网络作为构建云的基石面临很大的挑战,成为行业数字化转型的关键制约因素。

概述/简介

方案产生的背景(客户挑战):行业数字化转型加速企业DC云化,预计到2025年85%的企业应用将部署到云上,云计算成为各行各业的基本能力,行业云兴起、企业成为云化主角。如何快速构建一个支撑数字化转型的云数据中心成为企业的当务之急,而数据中心网络作为构建云的基石面临很大的挑战,成为行业数字化转型的关键制约因素。

[[202640]]

  • 架构设计复杂:10+供应商,上千款产品,无从选择,方案设计周期动辄几个月。
  • 部署周期长:需求梳理(1周),手工配置(2周),上线调测(1周),至少需几周。
  • 故障定位难:近10年网络规模增加50倍,管理对象指数级增加,随着自动化程度的增加网络成为黑盒,一旦出现故障,难以定位。
  • 方案能力概述:华为CloudFabric,重新定义数据中心Fabric的设计、部署、运维、和互联,打造极简云数据中心网络。CloudFabric包括面向高可用、超大规模组网、高性能计算(High Performance Computing, HPC)等场景发布三大Fabric模型:Hyperscale Fabric、High Availability Fabric、HPC Fabric。面向场景的模型化极简数据中心网络解决方案,覆盖从设计、部署、到运维全周期,实现快速灵活方案设计、自动化网络部署、和智能化网络运维。
  • 极简设计(模型化组网):面向场景的三大模型化Fabric支持面向行业的按需自助灵活定制,快速完成行业云数据中心网络方案设计。
  • 极简部署(自动化部署):华为SDN控制器Agile Controller提供拖拽式网络自动化编排能力,业务上线时间从周缩短到分钟级。
  • 极简运维(智能化运维):基于Fabric Insight 智能网络分析平台,从应用视角看清网络,实现分钟级故障定位。

媒体圆桌日程

主题: 华为发布CloudFabric解决方案,构建极简高效的云数据中心网络

时间: 9月6日 16:30-17:15

地点: 嘉里多功能厅2

发言人: 李向军 (华为技术有限公司 华为网络产品线副总裁);

俞涛(华为技术有限公司 数据中心网络解决方案总监);

马烨(华为技术有限公司 路由器与电信以太产品线副总裁);

议程(45分钟):

时间 议题 发言人

16:30-16:45 华为CloudFabric,为企业构建极简高效的云数据中心网络方案李向军

16:45-17:15 媒体Q&A3位发言人李向军、俞涛、马烨

关键传播点(解决方案的差异化能力)

【场景1】High Performance Computing (HPC) Fabric

1. 什么是HPC

HPC(高性能计算)是一类特别的计算和应用场景,硬件上有大量的并行超级计算机集群,通过网络进行密集的通信和级联。HPC系统能够快速准确计算出结果,有助于解决商业和科学研究中面临的问题,所以HPC系统越来越多的被科研机构、政府部门、商业组织所采用。

2. HPC网络的现状与挑战

  • 计算网络要求低时延、零丢包:由于HPC网络需要支撑集群节点间密集且高速的计算,网络必须做到低延时、零丢包,目前市面上多采用Infiniband高速网络的架构;传统以太网达不到和Infiniband同等的低时延水平。
  • 无法构建大型网络,面临规模瓶颈:随着HPC和商业的结合,特别是AI的兴起,一些大型HPC网络出现,节点从过去的几百扩展到数千台规模,Infiniband架构瓶颈出现;由于基于Credit的反压等报文拥塞控制机制算法复杂,Infiniband架构只能支持一千台以下的网络规模,大型HPC网络无法实现平滑弹性扩展。
  • 网络架构多样,运维成本高:传统HPC网络中,数据传输、网络管理采用以太网架构;计算网络采用Infiniband网络架构;不同架构需要两套人员管理和维护,运维成本高。

3. 华为HPC Fabric方案能力

基于华为独家创新算法,推出业界首家基于以太网架构达到Infiniband同等性能的HPC网络解决方案,具备如下能力:

  • 低时延、零丢包:通过VIQ(Virtual Input Queue,虚拟输入队列)、动态ECN(Explicit Congestion Notification,明确拥塞通告)等华为独家创新拥塞调度算法,实现流量调度和负载均衡,网络零丢包,时延降低90%, HPC业务计算时长降低40%;整体性能达到Infiniband架构同等水平。
  • 5K超大组网能力:基于Spine-leaf 100GE以太网络架构,灵活扩展可支持多达5千台服务器接入,组网规模比Infiniband专用网络提升5倍。
  • 架构归一化管理:实现传输、管理、计算三网架构归一;基于华为SDN控制器Agile Controller,可构建统一网络资源池并灵活调度,实现HPC as a service。

1. 合作伙伴

  • 云平台层面:与FusionSphere、VMware、Microsoft、OpenStack、Redhat、UnitedStack、CloudStack、EasyStack等主流厂商或标准组织云平台的无缝对接,实现网络与IT资源统一管理。
  • 控制器和管理工具层面: 融入基于ONOS开源平台创新生态环境,与第三方控制器VMware NSX和Brocade Vyatta的无缝对接,实现业务统一编排和自动化运维管理。与Puppet联合发布数据中心网络自动化运维解决方案,部署效率提升30倍。
  • 网络设备层面:①Agile Controller基于Open API和OpenFlow等南向接口,与业界领先的应用交付网络厂商F5无缝集成,联合发布双活数据中心解决方案。②携手Infoblox为企业提供DNS、DHCP和IPAM的集成管理方案,实现应用策略自动化管理。③联合CheckPoint共同打造安全可靠的数据中心安全解决方案。④在硬件和芯片领域同Intel、Mellanox、Broadcom、Qlogic进行合作,打造更强性能的数据中心网络。
  • 计算虚拟化层面: Agile Controller可与VMware、微软、KVM等主流计算虚拟化平台的对接,实现数据中心物理网络与虚拟网络的统一联动。

【场景2】 High Availability Fabric

1. 数据中心网络的可用性挑战

某些行业对于安全性要求极高。以金融行业为例,数据中心网络存在以下要求和挑战:

  • 可靠:全球银行监管机构要求金融IT系统发生故障甚至毁灭性灾难时仍可对外提供连续不间断的金融服务;如中国银监会规定,银行网络中断时间超过3小时,定位一级故障并需上报国务院。
  • 安全:为确保数据安全,数据中心采用零信任安全模式(zero-trust security),确保东西向流量安全;而银行现网每年上万次安全策略调整,关联关系复杂,手工操作容易出错,问题影响面巨大。
  • 运维:业务发展给网络运维带来巨大压力,一方面,随着数据中心云化,网络管理规模急需膨胀。以某金融企业为例,过去五年网元数量增加10倍,故障增加18倍;另一方面,银行现网业务重要级别高,影响面大;一旦发现故障,需要在最短时间内快速定位和修复。

2. 华为High Availability Fabric方案能力

High Availability Fabric数据中心网络方案,具备如下能力:

  • 网络高可靠,业务零中断:1)链路级:通过硬件BFD(Bidirectional Forwarding Detection,双向转发检测)技术,实现毫秒级链路状态检测;2)设备级:核心交换机CE12800 99.999%的电信级可靠性、TOR交换机M-LAG(Multichassis Link Aggregation Group)备份机制,确保业务零中断。
  • 应用高安全,随需精准管控:CloudFabric支持微分段,安全策略从原来的子网级细化到VM级,保证应用间东西向流量安全;基于GUI界面拖拽式操作,可在数分钟内完成安全策略的自动部署。
  • 智能运维,分钟级故障定位:Fabric Insight网络智能分析平台,基于100%全网真实流采集分析,实时呈现应用与网络健康度,风险主动预测;基于大数据平台实现百亿条历史数据秒级检索、百万报文秒级分析,完成历史故障精准回放。应用异常应用自动关联故障链路,实现分钟级故障定位。

3. 合作伙伴

  • 云平台层面:与FusionSphere、VMware、Microsoft、OpenStack、Redhat、UnitedStack、CloudStack、EasyStack等主流厂商或标准组织云平台的无缝对接,实现网络与IT资源统一管理。
  • 控制器和管理工具层面: 融入基于ONOS开源平台创新生态环境,与第三方控制器VMware NSX和Brocade Vyatta的无缝对接,实现业务统一编排和自动化运维管理。与Puppet联合发布数据中心网络自动化运维解决方案,部署效率提升30倍。华为Fabric Insight网络智能分析平台与业界领先的应用性能管理(APM)解决方案提供商听云系统联合,支持从应用到网络的关联,应用异常可一键映射到网络链路,实现端到端运维和网络评估。
  • 网络设备层面:①Agile Controller基于Open API和OpenFlow等南向接口,与业界领先的应用交付网络厂商F5无缝集成,联合发布双活数据中心解决方案。②携手Infoblox为企业提供DNS、DHCP和IPAM的集成管理方案,实现应用策略自动化管理。③联合CheckPoint共同打造安全可靠的数据中心安全解决方案。④在硬件和芯片领域同Intel、Mellanox、Broadcom、Qlogic进行合作,打造更强性能的数据中心网络。
  • 计算虚拟化层面: Agile Controller可与VMware、微软、KVM等主流计算虚拟化平台的对接,实现数据中心物理网络与虚拟网络的统一联动。

【场景3 】 Hyperscale Fabric:匹配互联网业务场景的Fabric最佳选择

1. 超大数据中心网络的挑战

以互联网行业为例,随着业务的蓬勃发展,ISP数据中心网络规模持续扩张,带来如下挑战:

  • 数据中心弹性扩展与网络性能压力:ISP数据中心规模持续扩张,部分超大型数据中心服务器规模可达到几万台; Spine-Leaf架构中,核心交换机和TOR交换机间full-mesh,布线数量巨大,管理复杂。视频、搜索等大数据业务网络流量急剧增加,由于频繁的多台服务器并发访问1台服务器,呈现出典型的流量突发等特征,瞬时流量超过带宽的多倍。因此,数据中心网络要支持弹性扩展的同时、降低布线的成本、提高网络性能,确保业务的连续性。
  • 网络自动化部署压力:在几万台规模的数据中心中,网络设备超过几千台,大量重复的配置动作急需要自动化的脚本配置能力,同时网络从原来支撑业务的服务,转变为向企业销售、即买即用的云商品,网络部署必须在数分钟内完成,对网络的自动化能力提出了更高的要求。
  • 多云协同管理压力:互联网行业不同业务对计算资源的I/O性能要求存在差异,数据中心网络需要同时支持多种计算资源的接入,并支持裸金属、虚拟机(VM)、容器等多种计算资源的统一云化管理。为了实现计算存储网络的统一管理,数据中心网络需要支持与业界主流多家云平台开放对接,提供灵活的多云混合管理能力。

2. 华为Hyperscale Fabric方案能力

华为Hyperscale Fabric数据中心网络方案,具备如下能力:

  • 5万台服务器无阻塞接入,业界80倍端到端大缓存:核心交换机CE12800具备业界最高1032T交换容量,通过动态CLOS组网架构和信元交换技术,可支持多达5万台服务器的无阻塞接入;同时具备业界首款100GE短距双纤光模块,节省75%布线,简化管理。CE12800核心交换机单板支持24GB大缓存,CE6870接入交换机支持4GB超大缓存,端到端大缓存轻松应对网络突发流量。
  • 网络全自动,分钟级业务上线:华为SDN控制器Agile Controller提供拖拽式网络自动化编排,业务上线时间从周缩短到分钟级,同时支持业界自动化管理工具(Ansible、Puppet等)的对接,实现物理网络的自动配置。
  • 多云协同,OPEX降低80%:支持物理机、虚拟机、docker等多种计算资源接入,支持多种云化资源的统一管理;华为SDN控制器Agile Controller可与FusionSphere、VMware、Microsoft、OpenStack等主流厂商或标准组织云平台的无缝对接,实现网络与IT资源统一管理,并可支持多DC、公有云、私有云统一管理。

3. 合作伙伴

  • 云平台层面:与FusionSphere、VMware、Microsoft、OpenStack、Redhat、UnitedStack、CloudStack、EasyStack等主流厂商或标准组织云平台的无缝对接,实现网络与IT资源统一管理。
  • 控制器和管理工具层面: 融入基于ONOS开源平台创新生态环境,与第三方控制器VMware NSX和Brocade Vyatta的无缝对接,实现业务统一编排和自动化运维管理。与Ansible、Puppet联合发布数据中心网络自动化部署解决方案,部署效率提升30倍。
  • 网络设备层面:①Agile Controller基于Open API和OpenFlow等南向接口,与业界领先的应用交付网络厂商F5无缝集成,联合发布双活数据中心解决方案。②携手Infoblox为企业提供DNS、DHCP和IPAM的集成管理方案,实现应用策略自动化管理。③联合CheckPoint共同打造安全可靠的数据中心安全解决方案。④在硬件和芯片领域同Intel、Mellanox、Broadcom、Qlogic进行合作,打造更强性能的数据中心网络。
  • 计算虚拟化层面: Agile Controller可与VMware、微软、KVM等主流计算虚拟化平台的对接,实现数据中心物理网络与虚拟网络的统一联动。

400G数据中心互联解决方案

1 云数据中心互联网络的现状与挑战

互联网业务云化导致数据中心双活、灾备建设需求越来越多,带来如下挑战:

  • 互联网业务云化和数字化转型,流量增长迅猛:预计到2025年,85%以上企业应用会部署到云上。数据中心间流量达到T级别。流量平均年增长超30%,部分OTT间数据流量增长超150%。网络必须做到大容量,满足业务迅猛的增长,网络弹性扩张,流量可调可控。
  • 传统网络业务部署周期长,网络利用率低下:异厂家跨层网络,不能统一管控,跨部门沟通效率低下,严重制约新型业务快速扩展需求。对于突发热点事件和大量临时性业务需求,传统的分布式路由转发和最短路径策略,容易造成网络局部流量拥塞,网络利用率低下。
  • 传统网络架构和设备不适配数据中心环境,运维成本高:传统IP层和光层相互独立,不同层次需要两套人员管理和维护。传统网络设备高能耗,不适配数据中心环境,这些都造成过高的运维成本。

2 华为400G数据中心互联方案能力

华为400G数据中心互联解决方案:业界首款4T线卡,满足数据中心间流量迅速增长需求,简化互联网络复杂度,OPEX降低75%

  • 海量带宽,400G数据中心互联中解决方案方案中,超大容量路由器,每槽位4T容量,40端口100GE板卡和8端口400GE两种线卡,相比100GE端口密度提升4倍,可以极大的简化骨干网络的光纤和运维成本。
  • 智能随需,华为流量调优方案,使用创新的ROAM算法,集中计算路径的带宽,时延,相比业界算法平均快10%,实现端到端流量的可视化和业务实时的检测和调整,实现带宽利用率从30%增加到80%。
  • 绿色节能,华为路由器采用新一代solar 5.0 自研芯片,集成NP,MAC,查找算法三合一芯片,集成度更高,16nm工艺,相比上一代功耗降低32%,加上业界首创的单板浮动散热等技术,整体能耗相比业界降低50%。
责任编辑:武晓燕 来源: 51CTO
相关推荐

2017-09-07 08:52:57

华为CloudFabric

2017-09-21 15:48:30

华为CloudFabric

2014-05-26 14:56:50

敏捷数据华为网络大会华为

2014-03-31 16:26:19

数据中心云计算华为

2023-03-01 16:22:54

ICT

2012-09-06 17:10:34

数据中心华为

2012-10-15 11:11:17

数据中心解决方案GITEX华为

2012-05-27 17:17:57

华为云数据

2018-01-18 18:59:00

浪潮浪潮云浪潮城市云

2015-05-27 10:27:07

2017-09-07 11:18:56

华为数据中心方案

2012-10-16 11:20:06

2011-05-13 18:18:43

博科云优化网络解决方案

2022-02-28 21:55:01

超融合数据中心

2015-12-08 15:45:32

云数据中心网络华为

2014-12-24 10:47:20

施耐德绿色数据中心

2013-09-22 12:48:59

2012-03-09 14:58:40

云立方云计算

2011-04-26 17:13:58

云计算微软云数据中心

2013-05-15 16:06:01

华为交换机虚拟化网络
点赞
收藏

51CTO技术栈公众号