耿竞一

耿竞一:大家下午好,很高兴今天能在ODCC跟在座的各位专家一起分享腾讯在IPOC领域的探索和实践。说到IPOC,我的个人理解它并不是指某一种具体的技术,而是一种方法,最终追求更快速、更灵活、更开放的解决IP在光使用层次的解决方案。为什么需要IPOC,或者说未来IPOC为什么会成为一种趋势?首先看一下OTT大型网络在城域网当中面临的挑战。随着互联网应用和云计算时代的到来,数据业务对数据中心间的互联带宽的诉求在增大。以腾讯为例,目前单一城市的城域网建设总量52T,AWS官方的数据也可以看到同城备份数据达到25T.用50%的带宽利用率来计算,城域网带宽建设已经达到了50T.还有另外一个数据分享,去年11月份腾讯渡过了自己18周岁生日,截止到目前每年城域网的建设量相当于过往年份加起来的总和。意味着城域网带宽建设成本在整个数据中心基础网络交付成本中的占比越来越高。越来越多的城域带宽建设意味着我们要部署越来越多的大型传输设备。目前的大型传输设备基本是面向于运营商的通讯,我们要将这些巨无霸部署在我们的机房当中,要进行很多的改造,都意味着三个月以上的改造周期。这对于我们目前追求快速交付的互联网数据中心,尤其是在云计算的背景下,我们要求厂商7天到货,一个与交付,这种背景下提出很大的挑战。

另外一点,就是来自于运营的挑战。目前的运营体系当中分为两个不同的运维平面。我们的运维团队需要在两个平面分别对网络进行运维和感觉。我们现在所用的传统的传输设备,它的管理通道大部分还是采用与cli和snmp的方式。这对于几十人的网络运营团队来说,尤其是目前基于SDN思想可精细化运维的背景下,带来了很多的困难与麻烦。

所以我们实际需要一个成本更低、灵活度、开放度更高,可运维、可管理能力更强的传输方案,这就是今天要讨论的IPOC.

既然说到IPOC是一个传输方案,首先来看一下在传统的OTN传输的网络架构。总体分为三个部分,以太网设备,传输设备电层子架,传输设备光层子架以及中间的传输线路。发出相同波长的白光,然后完成波长转换,最后由光层完成合波,放大和长距离传输。中间涉及到的组件包括电层,光层EDFA,中间根据组网和距离的不同还包括RODAM,电中继等等。在IPOC方案当中的网络架构,很明显最主要的区别在于我们将原来传输设备的电层处理部分直接拿到交换机侧处理,我们的以太网络设备发出不同波长的采光,经由中间的传统传输设备的光层,或者是未来开放式的电路设备,完成光层设备的传输。这样带来几个好处,第一,我们在整个网络结构上变得更加的简单,为后续基于SDN思想的统一运维管理提供了可能。第二,由于我们减少了一次中间的电层处理,所以端到端的转化时间有所降低。其实在传统的业务当中,尤其是城域网的时间挑战并不是很大,现在是5毫秒以内,满足当前的业务需求没有问题。但是通过前面说的AWS的数据可以看到,现在在云背景下同城的数据中心的互通时延要求两毫秒以下,可以这个方案带来的时间降低对我们来说很有利。第三点非常重要,就是降低了成本,至少从物料成本是这样的。我们将中间传输设备当中成本占比很高的电层部分可以直接省略掉,还省掉客户侧的光模块。

这里提出的交换机的采光方案,相干光技术可以对光信号的相位、频率进行调制,从而更适合于长距离的高速率的传输。我们现在说到的交换机采光方案目前有几种选择。第一种,CPF2的ACO方案,大家知道在光的技术处理中最核心的技术就是dsp芯片,我们就是集成在核心交换机。先看基础技术,在QSPK的调制下,可以做到1000公里。大容量16T,目前这组数据已经完全满足当前的城域网的带宽要求。但是ACO方案也有一些自己的问题。因为我们前面说到它采用集成度较低的方式,集成了交换机板卡上,而我们的交换机DSP芯片之所以能够完成长距离的传输,很重要的一点是因为加入了fec,而我们目前还没有标准的200G,所以很大的问题在于我们没法实现跨厂商交换机的互通,这对我们实际部署当中带来很大的挑战。另外就是集成度较低,所以功耗较大,受限于尺寸的限制。第二组方案,CFP2 DCO,DOC方案与ACO方案最核心的区别在于,将DS芯片直接集成在光模块上,这样就解决了跨厂商交换机互通的问题。另外因为它的集成度更高,现在我们看到的商用产品,单模块的功耗可以做到16到18W,功耗更低。单板卡密度有所限制。第三种方案QSPP28 colorZ的方案,这个数据传输距离只能做到80公里,而且这里的80公里是指增加了光放和色彩补偿的情况下做到的极限距离。另外单波只能跑到50G,这里的100G是指单模块可以出两个波长。所以我可以用到的单光纤的大容量只能做到4T,这是性能数据上的差距。还有另外一个问题,目前能看到的QSPP28的光模块,是采用固定不可调的波长,如果在线网当中用满一个光纤4T,需要在交换机侧维护40种不同类型的光模块,这对于线网的资产管理尤其是备件管理来说简直是恶梦。所以综合几种方案的分析,我们目前选择的是第二种方案,CFP2 DCO.并且主要交换机供应厂商也为我们研发了8×200GCFP2 DCO的核心交换机版本。

因为目前200G的标准还没发布,所以针对这里提到的8×200GCFP2 DCO方案定义了相关的规范。分为三个维度,第一个,我们定义了CFP2 DCO光模块的电接口设计方案。左图显示了CFP2光模块,我们拼凑出了第二个200G,做出了单个光模块200G的效果。第二个方案,定义了BCM的电接口,与一个CFP2光模块进行对接。对整个工作系统规范进行了定义,包括环境要求、工作要求,我们希望有更多的厂商和同行能够加入到规范的探讨和执行当中。

为了验证我们方案的可行性,在腾讯的成都城域网搭建了实验区环境,有两点需要说明。第一,因为我们前面提到的8×200GCFP2 DCO交换机板卡要到2017年Q4才能发布,所以我们采用的是已经上市的4×100G的。另外一点是核心光传部分,我们采用的是传统的方法。实验区有两个核心的目的,第一个是验证方案的连通性,这没有太大挑战,因此已经做了理论分析。第二点,是我们要验证交换机采光方案在可运营能力上是否能满足现有的运营要求。所以我们在网络架构上将整个网络分为了两个运维域,以太网设备运维域可以通过交换机,或者通过交换机上的采光模块,对每个波长的相关信息进行监控,包括收发包功率、电流电压,一旦监测到故障,我们看到运维的报警信息,从而确认故障是发生在传输侧还是以太网交换机侧,可以为后续的故障处理提供借鉴。我们在线往当中也通过手工验证了这种运维思路的可行性,但是这实际上只是最基本的运维手段。我们在实验过程中也遇到了很多问题,比如最简单的,目前我们的交换机端口与光传输侧的每一个波长的对应关系还是只能通过人工的方式来维护,在光层部分无法实现自动检测。所以我们也推动了目前的波分设备的供应商,为我们做定制开发。总之刚才提到的所有的运维手段,与我们对IPOC所期望的基于SDN管控的诉求还有很长的路。

最后有几个问题。第一,如果我们的城域光纤资源足够丰富,100公里以内,是否有更加物美价廉的方案可以选择。第二个比较重要,既然我们在方案上简化了整个网络的架构,那我们在其中的部分组件,尤其是中间的光层传输部分能否采用更加简洁,更加开放的系统,来帮助我们更快的实现最终的IP+光统一高效运营的目标。未来即将到来的400G是否给IPOC提供了更多的可能性。上面的问题还无法给出准确的答案,希望通过ODCC的力量,有更多的厂商加入到IPOC领域的研发当中,希望在明年的ODCC峰会可以找到这些问题的准确答案,以上是我今天的分享,谢谢大家。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党