搜索
您的当前位置:首页正文

网络项目割接方案V

来源:好走旅游网
中烟集团数据中心网络

项目割接方案

华为技术服务有限公司 Huawei Technologies Co., Ltd.

2017年6月

文档名称 中烟集团数据中心网络项目设备割接方案 技术文档 ■ 工程文档 □ 文档类别 档 □ 项目文档 □ 服务文档 □ 培训文档 □ 运维文其他 □ 当前版本 创建日期 文档主送部门 中烟集团数据中心 文档作者 联系方式 修订记录

修改记录 日期 修改人 审阅人 摘要 建立文档 建立文档 目 录

第一章 割接说明1.1 总体说明

建设单位 集团 华为技术有限公司、北京银信长远科技股份有施工单位 限公司 割接局点 中烟集团数据中心网络和营销中心 CE12804 V200R001 涉及设备及版本号 USG6600 V500R001 CE6851 V200R001 割接及测试时间段 2017-6-17 08:00至2017-6-18 13:00 回退时间段 13:00-21:00 升级/割接简述: 本次设备替换为,我司的CE12804替换现网的Cisco Catalyst 6509设备,USG6600替换现网的juniper设备。对原有硬件设备进行替换,涉及业务改变,原来的OTV将采用VXALN技术替代,其它配置原则上采用原有配置,接口地址有部分改变,由于设备软件版本不同命令会有变化,不对网络结构以及流量走向做改变。 升级/割接影响: 此次操作将会影中断网络约2天。 1.2 人员安排 客户配合人员:

小组编号 割接人员 单位 联系电话 1 2 3 华为公司人员:

小组编号 割接人员 施工单位 联系电话 1 2 3 4 北京银信人员:

小组编号 割接人员 施工单位 联系电话 1 2 3 4 其它人员:

小组编号 割接人员 施工单位 联系电话 1 2 2 4 5 6 7 8 后端保障人员

小组编号 保障人员 施工单位 联系电话 1 2 3 1.3 物料备件准备

物料名称 数量 提供方 备注(物料Bom编码) 需要根据现场机房情况光纤跳线 若干条 客户 确定(单模/多模/长度/接口类型) 光功率计 1 客户/集成商 使用本期采购未使用模备用光模块 10 客户 块 原有网线长度不够或失备用网线 若干 客户/集成商 效情况下使用 线缆标签 若干 集成商 1.4 组网结构 1.4.1 割接前组网结构

原中烟数据中心和营销中心现有核心交换机Cisco Catalyst 6509和广域网路由器Cisco 7606已运行多年,系统容量不足、故障率升高。

组网如下图: 1.4.2 割接后组网结构

核心区两台CE12804(数据中心级交换机)横向堆叠成一台设备,然后虚拟成两台VS,数据中心VS与园区网VS与数据中心中间通过两台USG6650互联,中间USG6650防火墙进行安全控制,USG6650防火墙双机热备;数据中心VS设备通过波分链路与CE6851对接,实现VXLAN的分步式网关。园区网部署一个VS作为汇聚交换机,与互联网USG6650互联,提供安全控制。

割接后组网图如下: 1、数据中心组网图: VXLAN设计图:

第二章 割接规划

VLAN,策略等沿用原有数据不做新规划,IP设备端口互联用原有互联地址,根据网络拓扑做部分规划,具体见附件:中烟集团数据中心网络和营销中心网络项目。 2.1 设备端口规划

具体接口连接根据中烟集团数据中心网络和营销中心网络项目,现场配置再做具体调整;

2.2 设备标签以及描述 设备标签根据现有条件制定 例如:

XXX机房

设备编码:

设备用途: 安装位置: 管理地址:

xxx-xxxxxx

xxxx

线缆标签模板:

集团 Fr:设备名称 接口

To:设备名称 接口

例如:

集团 Fr: X1/0/1/0

HW_CE12804 集团 To: 6F_HW_USG6650 2/0/0

第三章 割接步骤3.1 离线测试

在割接前对可预料的风险进行了离线测试,在割接前做好了充足准备规避相关风险,在未通过以下测试情况下不进行割接:

1, 2,

验证Cisco 4506千兆光口与CE12800千兆光口对接是否成功。 CE12800设备多模万兆单板千兆模块与USG6650 多模千兆光口对接是否

成功。 3, 4, 5, 6, 7,

验证万兆模块在千兆多模/多模链路运行情况。 接口地址对应是否正确。 板卡热插拔,电源模块热插拔。

VXLAN分步式网关测试,倒换测试,检查测试是否正常。 Cisco 4506生成树协议与华为生成树协议对接。

3.2 运行情况信息收集

1,收集现网C6509 C4506 juniper C7606 ASA5580配置 2,接口状态

3,ARP表,MAC表,路由表

3.3 备份数据

保存现网设备配置至计算机。 3.4 割接人员分组及安排

由于割接工作跨越了两个机房,需要安排两组人员在两个机房实施,

3.5 割接动作

预期结果、检查序号 时间 实施内容 操作步骤 方法 人员安排 1、设备安装、调试。 2、线路铺设,完成本部与卷1 割接前一周 割接前准备工作 烟厂机房的线路布放,并且在割接前一周确认需要布放的线缆无误。 1、检查设备配置,确认配置光纤跳线铺设,线缆做好标签,设备脚割接前一周 本导入加电待命。 无误。 2、将需要替换的光纤跳线铺 设至相应机柜,割接线缆做好标签。细化网线和尾纤的标记方法:网线在配线架侧均做好标签,光纤在主机侧做好标签且要与需要割接的光纤的绑在一起,方便万一回滚。 1、设备安装,线路连接。需要在割接确认完全无任何问题,例如OSPF,BGP等。 CE12804、CE6851、防火墙、各接入交 成功/PING通对端设备,OSPF、割接前一周 换机联通,设备状态正常 2、波分设备安装配置完成,且完成与卷烟厂机房对接完成。 3、光纤交换机需放线至新的 BGP邻居关系正常。(华为) OSN1800(待完成)EMC人员负责 完成,集成商、2 08:00-09:30 Vxlan割接 华为、数据库/主机人员 C6509,N7000互联端口shutdown,不下将C6509,N7000互联端口 08:00-08:10 电。 shutdown。 完成CE6851、N5548线路对接,CE6851、N5548对接,N5000二层、生 08:10-08:30 成树数据配置更改。 将新布线接至N5000,生成树 状态检测 Oracle RAC、 HA环境接入 1、 Vxlan联通后,将网口连至Vxlan调通后,安排一组ORACLE 新装交换机,oracle工程RAC/DB2群集,首先联机进行测试,测师确认RAC集群状态及业 08:30-09:00 试内容包括系统状态和切换措施,确认务是否正常 。 RAC及群集可正常工作(在此之后需把网口速率升成10GE) 2、 确认业务正常后,需要把IBM P750网口速率升成10GE ORACLE RAC/DB2群集业务观察,测试 09:00-09:30 结果确认 Oracle RAC、 HA环境测试。 视情况处理问如第步测试业务不正常,进行问题排对数据进行对比,路由、MAC、 题,时间不超过查。 2小时 ARP表项查看。 如不能排除,将进行回退,后面步骤不建议在配置更改时不做保存, 再执行 等业务正常后保存,便于回退 回退测试 割接终止 1、部分服务器把网卡升至服务器迁移 部分服务器把网卡升至3 9:30-11:30 10GE 置,更换光模块,修改服务器配置。 10GE,需厂家和集成商完成配 1、 数据中心,服务器接至接入交换机上。PC-SERVER在配线架侧依次跳线。 9:30-10:30 线缆迁移,服务器接入。 2、 小型机需要主机侧完成换线操作,有些小型机运行双机业务,需维保厂家在完成换线操作后确认主机状态。 9:30-11:00 业务观察,测试结果确认 检查各项业务的运行情况。 视情况处理问如第步中ERP、SEM或有超过30台服务对数据进行对比,路由、MAC、 题,时间为1小器测试业务不正常,进行问题排查。 时 ARP表项查看。 如不能排除,将进行回退,后面步骤不建议在配置更改时不做保存, 再执行 等业务正常后保存,便于回退 回退测试 割接终止 完成(深信服, 4 10:00-12:00 互联网割接 集成商、华为) 成功/PING通对完成USG6650、AD4000、 Cisco 10:00-10:30 互联网设备线路连接 3560连线与配置 端设备,OSPF、邻居关系正常。(深信服, 集 成商、华为) 将原有ISG1000的PAT/NAT配 10:30-11:00 AD4000配置 置转移到AD4000(周末做好配深信服 置,不启用) (各业务测试 11:00-12:00 互联网业务测试 人员) 成功/PING通对如互联网业务测试不通过,预计在1个建议在配置更改时不做保存, 端设备,OSPF、BGP邻居关系正等业务正常后保存,便于回退 常。(华为、集成商) 小时内不能排除,将进行互联网割接项目的单独回退 回退后,业务检 回退测试 查(各业务测试 人员) 5 12:30-14:00 广域网割接 成功/PING通对端设备,OSPF、进行广域网USG6650,广域网设备的割将新布线接至CE12804,Cisco 12:30-13:00 接。 7606 邻居关系正常。 (C7606)人员安排、华为) 测试广域网链路,检查邻居关 13:00-13:30 网络测试 系和链路。 华为、集成商、各卷烟厂网络管 理人员 (各业务测试人 13:00-14:00 业务测试 检查各项业务的运行情况。 员) 视情况处理问如第12步测试业务不正常,进行问题对数据进行对比,路由、MAC、 题,时间为1小排查。 时 ARP表项查看。 是否能解决 回退后,业务检如不能排除,将进行回退,后面步骤不建议在配置更改时不做做存, 查(各业务测试 在执行 等业务正常后保存,便于回退 人员) 6 14:00- 园区网割接 楼层接入交换机、CE12804、 14:00-14:30 园区网设备联线与配置 无线控制器联线 华为、集成商 测试WLAN业务正常上网,出华为、集成商、口业务访问与园区网与数据 14:30-15:00 园区网网络测试 中心的互访联网访问园区网客户安排人员测 试 与数据中心 成功(各测试人 15:00-16:00 园区网业务测试 检查各项业务的运行情况。 员) 视情况处理问对数据进行对比,路由、MAC、 题,时间为1小 ARP表项查看。 时 是否能解决 回退后,业务检建议在配置更改时不做做存, 查(各业务测试 等业务正常后保存,便于回退 人员) 所有测试结果用表格形势反7 16:00-17:00 对各业务观察,再次确认业务是否正常 馈 割接完成 割接时间窗为2017-6-17 08:00到2017-06-18 17:00,保留序号1-7进行,具体时间根据现场情况作调整。

其中分别为VxLan、服务器、互联网、广域网、园区网各保留2小时、1小时、1小时、1小时、1小时排故时间,总计保留6个小时的排故时间,因此,本次实施原则上断网时间为D日上午8点至D+1日1点,D+1日1点至17:00为意外应急时间。

第四章 测试验证

4.1 测试验证内容

目前了解的有数据业务,广域网接入业务等。

序测试项目 号 操作及预期 备注 互联网正常访问各大网站,收发邮件,登陆各业务系统办公,测1 互联网业务 试WLAN业务正常上网,出口业务访问与园区网与数据中心的互访 数据中心VXLAN正常访问,断开主开会时选择3-42 数据业务 链路后,VXLAN业务是否正常切换 个应用 3 广域网接入业务 PING通对端网关IP。 实际使用视频会议系统,图形无4 视频会议业务 卡顿乱码,语音清晰。 5 Vxlan业务 ORACLE RAC/DB2群集,联机进行测试,测试内容包括系统状态和 切换措施,确认RAC及群集可正常工作 4.1.1 设备状态检查 1,设备CPU占用率/内存占用率

2,接口错包统计,接口UP,MAC表,ARP、对比路由表与割接前收集数据对比。

接口错包统计:display this interface brief

在链路端口下查看端口状态是否UP:display this interface

查看接口下MAC地址学习情况:display mac-address

查看接口下ARP表项:display arp

对比路由表:dis ip route-table

第五章 回退机制

为防止割接过程中出现不可预料的异常,我们制定了相应的回退机制。针对割接时间窗内操作预期可能存在的风险项定义应对方案。

如果出现以下情况在预定时间窗内不能恢复,则进行回退操作。 变更失败定义:

1,波分链路、以太网链路无法UP。 2,各路由协议状态不正常。 3,验证测试不通过。

4,所带业务出现中断或者时延较大,在60分钟之内如不能恢复正常。 5、割接计划中说明的其他事项 5.1 故障判断

预期结果、检故障情况 操作步骤 查方法 检查链路光功率,端口协商状态,波分链路、以太网链路无法更换模块。检查网线连通性,更UP 换网线。时间窗内排除直接回退。 退 业务恢复/回路由协议不正常 检查配置,根据状态信息排查。时间窗内排除直接回退。 业务恢复/回退 出现单个电源模块失效、主单模块运行,在24小时内更换。业务恢复/回控板、业务板失效。 时间窗内排除直接回退。 退 业务出现中断或者时延较大 时间窗内排除直接回退。 业务恢复/回退 检查配置,根据状态信息排查。VXLAN对接不成功 时间窗内排除直接回退。 业务恢复/回退 ORACLE RAC/DB2群集,首先联机进行测试,测试内容包括系统状VXLAN对接成功 态和切换措施,确认RAC及群集可正常工作 退 业务恢复/回测试WLAN业务正常上网,出口业务访问与园区网与数据中心的互互联网USG6650割接 访联网访问园区网与数据中心,时间窗内排除直接回退。 退 业务恢复/回测试广域网业务,测试不成功,广域网设备的割接。 时间窗内排除直接回退。 业务恢复/回退 5.2 紧急回退

具体回退步骤:

1, 线缆拆除,恢复原有设备线缆连接。 2, 原设备互联端口打开。 5.3 应急计划:

广域网、园区网割接时出现以下情况且无法在1个小时内解决,将考虑进行应急:

1、 多个广域网节点无法接入

2、 园区网接入交换机出现故障,导致多个楼层无法连接网络 3、 WLAN系统失效,wifi用户无法连入

4、 出现设备不稳定或用户访问系统速度慢的问题 5、 其他尚未预见的问题

主要措施: 1、 2、

系统暂时放弃主备架构,修改为单设备或单线路运行 安排在周日进行单项故障排查

第六章 风险评估

在第三章-离线测试部分在割接前对可预料的风险进行了离线测试,在割接前做好了充足准备规避相关风险,在未通过测试情况下不进行割接。 6.1 风险评估

发生可能风险项 性 应对措施 CISCO设备与华为设备千兆-千兆接口对接失败 高 割接前测试验证,更换匹配模块 波分设备与CE12804与CE6851接口对接失败 中 割接前测试验证,更换匹配模块 万兆模块在千兆光纤上光功率衰减过大掉包。 中 割接前测试验证,更换匹配模块 CE12800设备多模万兆单板插千兆模块与USG6650 多模千兆光口对接是否成功 中 割接前测试验证,更换匹配模块 CE1280、CE6851与思科交换机对接,中 割接前测试验证 生成树需一致 单模块运行,申请备板卡,电源模块失效 很小 件 第七章 守局方案

1、守局目的:

为保障割接后设备的稳定运行,提前发现设备隐患或客户网络方案问题,减少对业务的影响,充分调配现有的人力资源,特制定此管理制度。 2、职守方式

本次割接的设备在市局点,此项目采用现场守局,确保能够在发现问题的第一时间进行处理。 3、管理制度

1、 一旦出现影响业务的状况和其他紧急情况,第一时间通知项目组负责人以及远程保障人员。

2、 一般问题请与设备接口人联系,如果有现场职守人员,同时通知现场职守人员。

3、 守局人员(不管是否在守局状态)、后方支持人员手机一定要保持24小时畅通。

4、 守局人员根据值班表安排,在现场值守我司设备运行状况,并同时紧急处理设备突发情况;如有特殊情况提前电话通知工程负责人,不得擅自脱岗。

4、守局值班安排 割接/守局人员名单

姓名 电话 地点 第八章 配置模板

因篇幅问题不能全部显示,请点此查看更多更全内容

Top