10月17日,2018年开放数据峰会(Open Data Center Summit 2018,下文简称ODCC)数据中心网络分论坛在北京国际会议中心举办。ODCC关注数据中心产业的各个方面,从国家政策和法规,到地方制度和项目,从产业全局发展到具体技术落地,从尖端热点技术到传统行业推广,从国内到国际,从宏观到微观,全力推动中国数据中心产业发展。

以下是腾讯高级光互联架构师孙敏的演讲实录:

图片1

今天跟大家简单分享一下腾讯构建稳定可靠的数据中心光互联以及现在开展和未来开展的一些规划。内容主要是四个方面:背景介绍、性能分析、在电信、数通上的应用,智能体系监控方面的工作,最后是一些挑战。

腾讯当前跟很多大型互联公司一样,随着互联网包括大数据时代的发展,现在主要的业务从原来的ToC到现在的ToB有一些转变,腾讯数据中心需要兼顾ToC、ToB的要求。腾讯数据中心光互联当前是25G Based,TOR选用的是100G。

构建稳定可靠的数据中心光互联遇到一些现实的挑战,在线运行光模块数量超过百万,新增数量也超百万,内网外网要提供安全的网络环境,另外采购模式变化和设备白盒化进程深入,所以我们当前的挑战还是非常大的。

如何构建稳定可靠的数据中心光互联,我们思路大概是三个方面:从历史和经验吸取一些教训和总结,特别是光模块在电信应用的经验,然后应用到数据中心;另外是构建新的应用体系;第三是利用大数据和AI平台。

数据应用基本上是2000年以后,所以一些经验和积累可以通过电信的应用进行推广,包括进行一些总结。另一方面数据中心光模块应用低于电信级光模块应用,我们可以优化一些设计和验证。

最终目的是要通过电信应用推导出数据中心的应用,包括应用规则、模型、模式、现象。这是我们简单的总结,以光模块失效模式为例,通过电信级应用推导出数据中心应用的情况。

可以看到光模块在数据中心里,芯片占比大概是40%,封装10%,辅料相关的30%,电信相关的20%。传统数据中心光模块应用上,我们是把光模块直接拿来应用,没有走到光模块生命周期的前端,而现在,我们提出一种新的应用模式,从光模块的设计开发的工作就介入,跟供应商一起联合设计,定制参数设计规格或者自定义光模块其他的需求。

另一方面我们正在建立一个比较完善的光模块的认证体系,包括早期的背景调查。一些更详细的武力分析,单体分析,对接测试,之后才会有系统适配、小批量应用和大批量应用。

这是第三方面的工作,就是光模块在线监控,现在一般硬件解决方案是通过双链路,一个Server连到两个交换机上,如果一个链路故障了通过另外一个链路进行支撑,这是当前的成熟解决方案,但是也会带来一些问题,就是成本问题,或者双链都失效的情况下就得不到问题的解决,

硬件保障是必须的,软件方面也是需要的。

现在很多人都在提光模块的在线监控,理想状态下,我们希望在在光模块的标准SPEC之内希望再设置一个小的spec,不影响业务,如果光模块出现问题,希望SPEC能超越小SPEC,但能满足业务需求,当然这是理想状态了。实际上遇到的情况是这样的,一种情况光模块确实在小SPEC里运行,一旦失效就超出了标准的SPEC。另外超出了SPEC,但是没有失效,是长期不稳定的状态。

所以目前我们是通过三方入手:通过模块架构设计、参数自定义、结合大数据和AI平台进行算法优化,从而提升准确性和效率。

这是另一方面的工作,我们正在建立这样一个数据库,将光模块的所有数据存储并且加以分析利用,保障监控设计硬件的数据,能够充分的为我们所用。

刚才讲的是我们已经开展或者是正在规划的一些工作,当然挑战是持续存在的,比如说现在我们即将面临的400G应用。比如说从100GSR4,到400G SR8或者SR4.2,芯片数量提升了一倍,这直接导致失效率的提升。另外以单模PAM4调制为例,在同样的电势差下,NRZ的2个电平要变成PAM4的4个电平,线性度要求就更高,误码率要求就降低了。

还有DCI的挑战,相干光模块由于内部架构复杂,器件种类繁多,,所以我们在建立这样一个模型的时候会遇到很多困难,这也是一个挑战。

上面就是我今天的分享,简单总结一下,我们数据中心业务在逐步增长,包括新的业务出现,数据中心网络安全性包括稳定性,现在也是进入到了400G时代,挑战会更大,所以构建稳定可靠数据中心光互联是数据中心业务的基石,谢谢大家。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2024-01-22 15:25:05
2024-01-19 15:41:34
国际资讯 亚马逊宣布将在五年间在日本投资150亿美元 用于扩建数据中心
此项投资将主要用于扩建该公司在日本的数据中心,并加强其在当地的业务运营。 <详情>
2024-01-09 16:53:00
市场情报 中兴通讯分布式存储+ DPU,加速数据中心转型
存储技术在不断地创新、完善、加速演进,以更好地满足业务的存储需求,但同时也使得存储协议和文件系统越来越繁重。 <详情>