5月27日下午,2021中国国际大数据产业博览会"数字基础设施论坛"在贵阳数博会会场隆重召开。论坛由中国通信工业协会数据中心委员会、数据中心产业园资源促进会承办,中国IDC圈协办。包括贵州省政府领导、业内专家、企业高层等众多嘉宾汇聚一堂,共同解读新基建发展现状、研讨数字基础设施产业发展趋势。
北京易华录信息技术股份有限公司超级存储实验室副主任李继勇在论坛上发表主题为《超级智能存储--数据中心的存储秘密》的演讲,以下为演讲速记实录:
大家好,今天咱们这个论坛围绕碳中和,如何节能,数据中心如何节能降耗展开讨论。我今天讨论相对比较细了,是以数据中心的专门的存储类探讨在数据中心如何节能降耗,以及在节能降耗的同时满足数据中心的应用。
其实,我们给的一个相当于一个解决方案,一个超级存储的解决方案,我们知道现在随着大数据的不断的发展,包括一些技术,包括5G、新基建的发展,数据越来越多,传统的数据中心容纳的数据越来越大,你必须投入相应的设备,整个设备的能耗也会大大提高,面对现在这种问题,数据中心存在这样几个问题:第一个问题我这个数据是存不下的,这些数据随着大数据的挖掘的技术,它的价值化和资产化充分体现出来了,跟以前的传统是不一样的,如果是把这些数据扔掉,基于成本,基于空间把这些扔掉我们把自己兜里面的钱给扔掉一样,是一种浪费。所以海量数据存不下是数据中心需要解决的问题。再一个数据存储的成本的确太高,需要IT设备的投入,能耗、电耗,长期运营的成本,这个是比较费钱和烧钱的。
还有,我们要考虑数据的安全性的因素,比如说我们有勒索病毒,从几百万美元到几千万的美金不等,所以说如何安全的存储这些数据也是需要数据中心考虑的问题。
再就是我的运行能耗非常高,这是我们有了数据中心开始一直存在的问题,如何解决这个问题呢?我们从一个比较细的力度,也就是说数据中心存储数据这个角度去给出了一个超级智能存储的解决方案,这是一个整体的架构,包括四层,第一层是存储的物理层,存储的物理层我们看到介质层面比较常用的,一个是磁盘的介质,还有电介质,我们比较创新是融入了光盘的介质,再就是存储的管理层,我会用超级智能存储引擎把下面的光、电、磁进行管理,进行分段管理的技术对数据进行合理的判断,按数据中心进行分级的存储,在多种存储介质里面自由的流动。再往上走就是服务层,顶层就是有一个融合的协议,支持块、对象和文件,通用融合的协议,也有门户网站的界面。
所以说这种结构我们是考虑了数据中心生产业务系统,还有这种高中低频的云存储的服务,多种场景下设计的架构。
这里面我解释一下,用到了蓝光存储技术,为什么要用它?首先来讲什么叫蓝光存储技术?我不知道下面有多少嘉宾是知道这个技术的?简单来说它就是以大容量的蓝光光盘作为介质,同时以光盘的设备统一管理光盘,一个设备是几千、上万的光盘,这个设备叫光盘库,会有机械手,光驱,能够实现光盘的自动的读写,同时配套一些管控的服务器和管控的软件,形成通用的网络设备,可以用通用的网络方式使用它。
为什么要用这个产品?或者这个蓝光存储技术?它有几个比较突出的特点,一个是容量大,它跟我们DVD的光盘不一样,现在一块光盘形状跟尺寸跟我们普通的光盘是一样的,但是它一张光盘可以达到500GB,这样对应一个机柜可以达到3.2个PB,再一个保存的时间比较长,可以达到100年的保存寿命,还有超高的安全性,数据一经写入光盘之后,不管是有病毒的攻击或者认为的篡改来攻击它,我数据不会丢掉,数据写了之后不可以删改和删除,所以它可以从物理的角度保证数据的安全性。
再一个跟碳中和有关系,就是非常低的能耗,整个机柜工作单机柜是170W。再一个我们讲提供了超全的存储场景,为什么有了蓝光光盘之后还要提供磁和电,因为光盘是靠机械装置抓取光盘的,在实时性的响应做不到,但是实时和非实时的业务都有,我们做数据中心的存储设备我们要满足多场景的应用,这样把光盘的基础上融入了电存储和硬盘存储,对那种高频的数据可以放在电存储里面,中频的数据我们可以放在磁存储,长期的数据放在蓝光里面。
还有一个安全,安全我也讲了,网络安全的事件很多,超级存储的安全如何做?我们做了多副本的技术,EC冗余和安全性的传输,我介绍蓝光的时候讲了,它的可以从物理层面保证数据的安全性的问题,因为数据是刻在光盘上,所以这个数据是不会被病毒或者电磁破坏掉的。
还有一个长寿命的问题,以前数据没有价值化,或者形成数据资产之前是一个长期的事情,这个大家不会关注这个事情,那么多数据都放在那里浪费空间,但是现在这个数据变成了资产,它是有价值的,我们可以作为数据生产的材料长期进行存储管理,所以说存储的时长是非常重要的因素,蓝光光盘是技术材料采用无机相变的材料,是有别于硬盘的磁性材料的原理不一样,所以可以保证数据是100年,但是我们知道硬盘只有3到5年的寿命。
还有能耗的问题,大家可以看一下,数据中心这里面有很大部分能耗被我们提供IT设备运行的环境所给消耗掉了,蓝光非常低的能耗,工作的时候170W,待机70W,因为发热低,我相对于我运行环境的要求低,所以蓝光机房不用投入空调,还有温度跨度的问题,它的跨度是非常宽泛的,在10度到40度之间不会对数据造成影响,我们做了一个比较,相对比于同等的机柜,它的能耗仅仅占机柜的5%,可以节省95%的能耗,因为刚才我们讲碳中和的时候,怎么来实现这种碳中和?几个方面?一个是发电,一个是用电,蓝光存储这一块就是在用电方面我可以数据中心里面的能耗整体拉下来。
这其实也讲了成本的问题,原因跟上面的一样,第一个我使用了分级的策略,我是按照二八的规律来分布,有20%的数据我经常用到,80%的数据不经常用到,这时候利用分级把80%的冷数据放在蓝光存储里面,大大降低了我整个数据的一个存储的成本,包括我蓝光可以百年存储,我不用做数据迁移了,我能耗非常低,不耗电,这样的话我整个TCO占存储的6%。
再一个强调一个自主可控,我们也知道背景,国家非常重视自主创新这一块,整个超级存储技术都是按照自主创新这个方式做,包括国产的CPU和操作系统,它是可以系统兼容的,这个产品是我们自主研制的产品,我们从光盘的介质层面,这个是很少可以做到的,光盘介质层面到核心的关键件都是我们整套生产的,包括我们整套的存储软件,包括数据湖的信息化的软件。
这里面讲一下主张,刚才也有嘉宾讲分离,冷热分离的部署,超级存储一个是说数据要进行分级,把存储的力度分细,按照数据被访问频度我们放在相应的存储空间里面,再一个是分级部署,蓝光机房不需要空调,你跟传统的热磁存储放在一起是一种浪费,所以冷热进行分离这样部署。
再介绍一下超级存储的运用,北京易华录信息有限公司是国资委下面上市的子公司,从2015年我们在全国推广和部署数据湖,也为咱们的城市提供数字化的基础设施,截止到今天,我们已经落地在建的数据湖是36个,已经落地和储备的项目是70多个,已经接下的是200多个,这些数据湖里面最基础的是数据中心,我们的一个数据观点是什么?超级存储就是在数据湖里面的基础设施广泛的使用,每一个地方的使用效果比较好,PUE可以达到1.4以下。
这个就是我实际的机房的情况(PPT),这是在天津热磁跟蓝光的机房,图上是蓝光的机房,这个机房占地面积不大,200平方米左右,我这个蓝光节能没有部署精密空调,所以说我这个单个机柜占地面积是2平米,占地面积节省了五分之一,所以我整个的成本也就是说跟热磁比是30%到10%的范围。当然除了我们在数据湖使用之外,我们这个在行业也广泛使用,去年的鹏城实验室当时我记得是32PB,合计的带宽可以达到100个GBE,也是高容量型。
剩下就是我们在金融、政府、央企、广电行业的案例,因为时间原因我不介绍了,谢谢大家,我介绍这些,希望有机会跟大家再交流。谢谢。