为了深入落实国家大数据战略,推动大数据产业交流与合作,展示我国大数据产业最新发展成果,2019年6月4日至5日,由中国信息通信研究院、中国通信标准化协会主办,大数据技术标准推进委员会承办的2019大数据产业峰会在北京国际会议中心隆重开幕。6月5日,大数据安全论坛隆重举行。

刚刚许博士的演讲向我们展示了金融数据作为一种兼具敏感性和公共性的特殊类型的数据,下一步就如何解决金融数据的安全性和可用性之间的平衡关系,我想会是下一步各方关注的焦点和话题。从刚才以上的演讲我们也感觉到,讲到大数据安全保护,其实本质上也离不开技术层面的保护,接下来就有请中国电信天翼云关泰璐先生,他的演讲主题是《建立大数据安全的新思维》,欢迎。

关泰璐 (1)

中国电信天翼云大数据安全负责人 关泰璐

首先感谢信通院给我们这个机会,让我能够把我们近段时间的一些工作给大家作一个汇报,其实不是演讲,是一个交流。不能老是我讲大家听,如果在我演讲过程当中谁有问题的话可以及时举手示意我,我能回答的就回答,不能回答的方便加一个微信,我们一块儿聊一聊。我看在座的很多人是熟人,很多认识的人,可能我们交流得也比较紧密。这块主要是希望能够抛砖引玉,因为整个的产业发展会有大量新的点子和新的思路,我们只是能够给大家提供新的解决思路。

今天给大家介绍的题目是建立大数据安全的新思维。我从三个方面讲一下:1.大数据安全面临的挑战;2.中国电信大数据安全体系;3.实践与思考。

一、大数据安全面临的挑战

据我的了解来说,我个人的认知数据应该是一种资源,为什么是一种资源?有以下三个理由,现在数据被认为是国家第三大创新要素,而且在深刻而广泛地影响和改变人类社会。举一个简单的例子,以前我们打车的时候都是用叫车的方式,出门之后伸手拦车,但是自从有滴滴等一些电商平台之后,我们几乎很少有人伸手拦车,当然也有,但是更多的是在网上预约车。前一阵滴滴受到整顿的时候,在南京和杭州两个城市,晚上突然间滴滴宣布了停运,导致上万个深夜想要打车回家的人员无车可打了,说明新的技术一旦投入应用,而且受到广泛应用之后,再想回到以前的状态几乎是不可能的,数据也是这样一种状态。

第二,数据是人类对客观世界数字化的表现。为什么这么说?以后的5G和以后整个的工作过程当中,以后可能不是单纯的某一个人,而是只是简简单单的一个代号,有可能在电信运营商内你的代号可能是你的手机号码,有可能在银行里面代表的是你的银行帐号。

第三,数据的连接和融合也是一种趋势,而且这种趋势是正像而且是不可逆转的。从历史的角度来说,我们自从发明了计算机,一直到发明互联网,再到移动互联网、物联网等等,所有的连接把我们人类通过计算机连接、通过网络连接,通过地球村连接,通过所有的移动互联网手机去连接,乃至于以后我们的物联网和5G出现之后,会把整个人类和整个微观世界进行详细的连接,这个连接的过程中会出现和产生大量的海量数据,这些数据都是一种资源。

有人把数据称为新型石油,但是我从整个从业的过程当中,我认为这个观点有点不妥,为什么有点不妥?石油和数据在以下几个方面是不同的,第一个是所属权明确与否的问题,石油的所有权非常明确,你买了就是你的,你加到你的汽车里每天可以跑500公里,这个油就是你的。但是从数据所有权的角度来说,尤其像金老师讲的,金融类的数据,或者医疗类的数据能单纯说这个数据就是患者或者医生个人的吗?不能这么说。所有权不明确是第一个比较大的问题。

第二个是隐私保护的问题,使用石油的时候是不会涉及到用户隐私保护的,也不会关心你到底开的是凯迪拉克还是兰博基尼,还是QQ,但是数据是不一样的,数据确确实实涉及到用户的隐私,我们可能不高兴别人知道我们的财产问题。

第三个问题石油是一次性来源,但是数据只要人类文明还在,数据就会源源不断产生。第四个是流通溯源,石油溯源或者其他资源溯源是很容易的,有可能来自于中东,有可能来自于我们的大庆,但是数据,尤其在数据丢失的溯源问题来说是非常难的,你根本不知道你的数据从哪儿来的,比如以前有一个非常典型的段子,有一个人去银行办银行卡,去建设银行办银行卡就叫张建设,去交通银行办银行卡叫张交通,突然间有一天他接到一个骚扰电话说张建设先生,您的什么什么东西,他知道这个数据是从建设银行泄露出去的,这是比较极端的典型例子,真正在产业界和现实过程中想去溯源是非常非常费神的。

第四个囤积价值,石油、煤炭等等传统的能源是有囤积价值的,我放在那儿,随着数据时间的推移和使用量的推移,价值量会慢慢变多,也可能慢慢变少,但是数据如果是沉淀和陈年累计的数据,一旦不用,它的数据价值和时间是进行相应的递减,所以从这块得出一个观点,数据是一种资源,但是数据流通起来的价值是更大的。

数据安全的问题就是隐私保护的问题。世界上主要的国家,比如美国、欧盟、日本等等,还有中国也推出了相应的隐私保护的观点,比如说以2018年的GDPR为例,GDPR实际上是2018年年度法律头条的词汇,不光是产业界、法律界的人士在谈GDPR,就连做安全的也开始研究GDPR,现在GDPR对整个行业的影响确实是比较巨大的。GDPR相关法律出来之后,给我们带来一个非常大的困难,就是合规问题现在已经成为大数据公司以及行业里面首要的首先发展的主要风险,为什么这么说?从2018年Facebook和剑桥分析的案例可以看出来,之前在GDPR和美国相应的个人保护的角度来说,法律不是很明确的规范的过程当中,Facebook和剑桥分析已经好多年了,已经合作好多年了,但是一直没有曝出问题,突然从GDPR推出来以后,大家把眼球直接由原来的业务发展投放到了个人用户信息保护的角度,从这个角度上来说,这是当天Facebook曝出来数据泄露的问题当天,在美国纳斯达克的股价硬生生下跌10个百分点左右,但是后来这个事情,随着这个事件慢慢淡化之后,股价后来又涨上去了,从一个侧面来讲,它也体现出来美国政府对待数据保护的一种态度。

我们中国安全的风险太多了,左下角第一张图是原来大名鼎鼎的数据公司叫“数据堂”,去年被山东警方一举擒获他们的高管,搜出来大概有30亿条的用户个人数据,号称光硬盘就好几车,不知道真假,说明他们整个业务的合作、经营的模式是写在《宪法》里的,是写在法律里面的,他们在发展的过程当中相对来说比较粗放,我们要做好用户的信息保护,严重不符合《网络安全法》和两高的司法解释,导致相关的问题。

第二个是中信银行。

第三个是滴滴,我们比较清楚了,之前顺风车时间对他们的影响非常大,为什么我说把合规作为企业发展的首要问题来说?原因在于此。

第四张图是去年和运营商相关的,大概有30亿条的数据,说是从运营商这一侧被人家盗用,集团领导也是高度重视,最后查了一下,我们确实是受人代过,也暴露出来我们在整个数据管理方面存在的问题。

这是我们团队做的一个统计,从2017年到2018年整个数据泄露事件。我们统计了一下,大概有三个维度造成了数据泄露,第一个维度就是信息的配置不当造成的,比如左边这块,分别有美国五角大楼,大概泄露3.5亿条数据,有埃森哲的,还有南非的一家征信机构,大概泄露五千万条数据,但是这五千万条数据包含的价值非常高。下面的是运动手环的公司,当时显示的是在朝鲜的一个北部山区,在无人区里面竟然有人运动,暴露出来一个什么问题?朝鲜的北部山区底下应该是有一些军事基地的,有一些士兵在地底下运动,暴露出来他们军事基地的轨迹。实际上这是一个军事机密泄露的问题,不光朝鲜,还有美国、俄罗斯、中国的军事基地也在泄露的范围之内。由于信息配置不当造成数据泄露大概在53%左右。还有内部员工数据泄露的问题,最典型的就是趣店,当时有两个员工离职,心怀不满,把趣店大概两千万条数据直接拿到黑市上卖,这个情况确实比较恶劣。对于入侵攻破,黑客入侵攻破是比较抓用户眼球的,但是在整个盘点过程当中,他们整个数据泄露的占比应该是占20%左右,比如说徐玉玉事件,刚才许老师也谈到了这个问题。还有韩国大的比特币交易中心被黑客攻击之后造成一亿美元的数据泄露。Uber被黑客攻破之后采取了非常极端的措施,就是花钱找黑客私了,我把这个钱给你,这个数据你不要暴露出来,但是黑客还是很有正义感,坚持把这个数据暴露出来。整个盘点过程当中,从2015年一直到2018年,我们可以看到整个数据泄露的态势是呈指数级上涨的过程。2018年据不完全统计,数据泄露大概在100亿条左右,这个数据听起来特别吓人,感觉好像我们在座的每一个人的每个数据都在黑客面前是透明的,是这样的吗?我觉得应该也差不多。从整个数据盘点来说,整个数据的安全过程当中,最优先解决的应该是内部问题。

这是CSA评点的时候,大数据面临的主要安全挑战,大概十个方面,比如无法对数据溯源、分布式框架等等,缺乏实时监管,我抽象了一下。我觉得就是四大方面的危险,第一个对于未知安全威胁的发现问题,你怎么能够解决App攻击,怎么解决你不了解的攻击?你怎么做好防护和应对?第二个账户异常的问题,账户异常面临很多问题,比如内部特权账号的问题,合作厂家的问题,监管部门的账号问题,这些内部人员造成的威胁远远大于外部,怎么把内部人员的账号管好?这个才是我们面临的挑战。第三个数据的泄露和数据的滥用,我们怎么发现?怎么在这个过程当中把黑产猖獗的势力打掉?我觉得是在整个安全产业界比较重点关注的问题。第四个就是监管部门他们一直在强调严监管,我们怎么给他开放口径,给他开放口子,让他们能够对整个数据的流通、使用、合规进行强监管,我觉得这也是一个需要考虑的问题。以上四点解释之后,我觉得为什么今天的ISA大会在推出安全模型,为什么现在所有的工作在转向于以数据资产为核心的数据保护工作,这个是明显的一个转变。

简单回归一下,通信安全出来之后,我们大概分为五个阶段,比如通信安全阶段、计算机安全、网络安全和信息安全阶段,我把这些阶段简单称之为传统安全,这个确实是有一些武断,但是数据安全跟前面的安全有明显的区别,区别在于哪儿?用比较流行的《权力的游戏》来解释,传统的安全,比如说像夜王在攻打凛冬城的时候,凛冬城把自己的重兵部队放在城外,有骑兵等等,又是骑兵,又是火把,声势浩大,目的在于不能让夜王的僵尸部队打进来,一旦打进来就完蛋了。但是看过的人都知道还是打进来了,但是确实是防不住,数据安全这个问题是什么?夜王本身就是数据,他就像特朗普一样,原来的所有工作是保护特朗普在白宫,只要他在白宫,他就是安全的,因为在白宫外面布置了海量的安全防护手段,但是特朗普这个人是要到处乱跑的,夜王也是要到处攻击别人的,他总会有走出白宫的一天,也总会走入凛冬城这一天,怎么办?如果对整个数据保护做得不好的话,可能就被一击毙命了,整个传统安全和数据安全大的区别就是原来我们是更加侧重于边界的防护,数据安全更应该注重数据本身的保护问题。

简单回顾了一下,大数据安全主要是既要关注外部安全,更要关注内部安全,要考虑综合的合规、用户隐私保护、业务和应用系统方面的安全。我们的传统安全可能我们要做好边界防护,用好安全设备几乎就够了。但是大数据安全和传统安全不是割裂的,数据安全是建立在传统安全之上的,没有传统的安全,数据安全肯定做不好,但是如果传统安全做得再好,但是对于数据自身的价值的体现,对于数据自身的保护没有做好的话,我们做的数据安全在整个流通的领域使用过程还会面临诸多的问题。这是为什么题目叫作建立大数据安全的新思维这样一个标题,我们想改变防护的体系和思路。

我们认为数据安全大概整个防御的基石有三个:1.法律法规,前面各位专家也都提过了,今天的安全论坛谈论的安全技术比较少,谈论法律法规确实比较多,以后是一种方向,安全人员不能光研究技术、光研究安全管理,更需要研究法律法规。2.需要管理规范。现在的管理技术手段确实还是稍显空白,我们应该用三分技术、七分管理来实现这个问题,3.要加大研究我们的技术手段,最后会达到保护目标。我们大概设置了一个目标,我们把它分为四个等级,第一个是严密保护级,涉及到秘密一级放在这儿,第二个是区域限制级,有一些在行业内共享的数据是不是可以划定一个小区域,让它自由流动。第三个是监督检查级,主要是用到个人的信息和数据,把它放到这里面,非个人用户的数据,把它放到完全开放,这也是符合整个国际发展的趋势。

二、中国电信大数据安全体系

基于电信和国家法律法规的要求,我们建立了整个安全防御的整体框架,大概分为四个层级,有愿景级、框架级、管理办法和细则,四维代表大数据的技术安全、产品安全、运维安全、业务安全,从四个角度把所有的业务能够做到有法可依、有据可依、有据可查的过程,我们也建立了一横一纵大数据安全的防御体系,一横代表我们物理层、网络层、应用层,一直到高层,这个更加依托于整个传统的安全体系,一纵代表数据产品周期,我们要有规章制度去可遵循,有安全技术可以实现,具体是咋实现的,请看下一张片子,我再提一下我的安全观,要以逻辑的安全思维来建设系统,同时以黑客的视角防御安全,这个可以作为我们安全的个人理解。

安全保障思路贯穿从产品到消费的各个环节,身份认证加密等等,数据存储我们认为是比较重要的,我们要进行脱敏的数据管控,为什么?从《权力的游戏》可以看出来,敌人肯定会把你的堡垒攻破,怎么建立在堡垒被攻破下的防御体系?我觉得还是要做好我们的脱敏工作,一旦数据被脱敏了或者被加密了,即使偷走了,数据大部分也都是属于非敏感数据,也是需要加密的数据,他想破解和还原同时要搞定我们的脱敏系统,同时要拿到我们的密钥,这样机会成本会比较高。还有对数据挖掘,数据挖掘主要是重点防御的观点,就是我要对用户的所有行为,以上帝视角的方式来看到每一举每一动,这样的话在监管也好,在整个防御过程当中,只要知道他干什么,你心里就会比较有谱。第四个数据发布的时候要知道数据发布的内容到底是不是合规的,是不是符合《网络安全法》的要求,是不是符合自己的保护要求。最后一个是数据消费,这一块不太细谈了。我们建立了四大安全产品,这是目前在研已经成型的产品,在电信那块有一个展会,大家感兴趣的话可以去那儿参观一下,主要是针对于大数据业务合作伙伴众多、业务场景复杂、产品迭代快的特点,设计出来防御数据本身为重点的安全产品。

数据安全脱敏系统跟信通院一块儿合作做一些脱敏标准的工作,有几个模块,主要可以深入地嵌入到整个业务流程里面,对电信四门十八类数据进行实时和非实时的脱敏,我们主要是建立了自己的分级分类的标准体系,我们采取脱敏的方式是以字段级进行脱敏,这个应该是在业内第一款针对大数据平台进行的脱敏,我们支持众多的组件,我们可以进行很好的支持。这是脱敏的流程,我们会有一个原数据管理的流程,通过脱敏的策略进行相应的配置,自动调取脱敏策略,进行相应的脱敏工作,放到数据指定的位置上,这样可以形成完全自动化的过程,可以用少量的人干预。这是整个脱敏过程,这是平台审计系统(如PPT),用户的操作行为,通过追踪全网关联分析实现大数据平台资产安全审计的产品,这个是完全基于零信任的安全模型,动态安全基线为理念的安全产品,主要是结合了机器学习、UEBA等先进的理念做的整个呈现过程。

这是整个态势展示(如PPT),按照集团的相应要求,我们从2014年开始,所有的日志的数据都在这儿,下面还有很多小目录,确保在登录到这个平台的所有人的所有操作,我们都要有所记录,而且从中会发现一些高危的问题。这是拆用自己自定义的方式做的SIEM系统(如PPT),用了二十多种大数据关联分析模型,五十多种维度的指标,一百多条自定义的安全规则。SIEM系统有一个问题,会产生海量的误报,我们尽量把误报压缩,确保报出来的每一个报警都是有据可查的。

这是用机器学习和UEBA进行分析的过程(如PPT),对每个人进行行为基线的划定,简单的问题是说举一个不恰当的例子,平常每天中午就吃两碗饭,突然今天中午吃了三碗饭,肯定是有原因的,我们需要查,归根到底来说,比如说我们的运维人员和数据开发人员登录到我们这个系统每天干的事应该类似,如果他的账号失窃了,被人盗用了,他的行为轨迹一定和他平常有区别的,如果你的行为基线和当天的行为有所偏差的话,我们会有及时的告警工作。

这是出口审计(如PPT),履行用于API攻击安全的审核过程。

这是数据水印系统(如PPT),主要重点解决一下数据如果丢了,我到底能不能找回来?甚至我能不能回溯出来攻击路径?到底从哪个方面、哪个口子漏出去的,这是我们比较关心的问题,有五大优势,详细的我就不太说了。

这是我们现在一直在研的比较感兴趣的eUID的方式(如PPT),我们会努力打造自己的标签体系,和外面的医药数据、金融数据进行交互、对接的体系。

三、实践与思考

GDPR到底是一个什么样的观点?从我的观点来看,我们统计了一下这是截了别人的图,从2019年以后的资产规模达到10亿美元以上的独角兽的场景可以看到整个领先的是美国和中国两家,为什么欧洲急急忙忙推出GDPR?我们当时提出一个观点,他是不是想收人头税?因为在整个第三波的技术浪潮过程当中已经远远落后中国和美国,但是又不甘心他的数据被人家无偿使用,我就搞出一个GDPR,你要想用我的数据就得给我交钱,从整个的发展态势过程当中也印证了我这个猜想,我觉得GDPR的推出目的不是保护欧盟的数据,实际上是给自己找了一个由头,收一下人头税。这是我的一个简单粗放的观点。

我们也在这儿呼吁一下法律界和产业界的人,我们一定要擦亮双眼,不能够人云亦云,要有自己的判断,我们也要打造这样的安全体系,我们用众多的安全手段和防御能力,我们在行业内能够形成一个统一的标准。这是域外管辖权的问题,华为孟晚舟被美国抓住,我下面提出一些问题,我们必须要旗帜鲜明地反对域外管辖,同时也要给走出去的互联网公司和行业提供这样相应的指导和保护。

这是华为和中兴事件带出来的问题(如PPT),在社区里面可以看,华为整个的贡献值,华为的占比大概是在22%左右,是整个属于行业里面偏低的,但是在中国是领先的,我们也呼吁广大的厂家能更多地在开源社区投入更多的力量,贡献开源的生态,更加强大地把握开源软件的话语权。

我评估了一下,从操作系统、软件等等过程当中,我们确实是比较落后的,月活十亿左右的App里面,我们只有一个上榜的,微信,剩下的全是美国的。还有产业地图,几乎找不到中国的厂家。是不是我们就确实是没有什么希望打赢这场“战争”了?我觉得不对,我觉得从几个方面,第一个,我们中国市场规模空间确实大,第二个创新应用确实是比较活跃,第三个我们数据量特别大,第四个我们老百姓特别认可,从几个角度来说,我们对打赢这场“信息战”“高技术战争”,我们的道路是光明的,但是的确是非常曲折的。

结束语:1.作为大数据行业来说,我们必须要有所敬畏,我们心中确实需要仰望星空,但是我们必须要脚踏实地,人的心里必须要有敬畏,我们要敬畏法律,要遵守法律,在法律框架内做自己的事。2.周汉华教授说的话我特别有感触,互联网和大数据是中国少数领先世界的产业,如果法律过于严苛就会遏制产业的发展,我在这儿也想呼吁一下,我们确实不能够单纯地为了遏制而不让它发展。3.在“贸易战”的大前提下,我们确实有很多的问题,同时,我们也应该更加地努力,要响应主席的号召,叫撸起袖子加油干,为国家贡献自己的力量。最后用主席的诗词结束今天的分享,中华儿女多奇志,不爱红装爱武装,中国必胜。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2023-05-25 08:48:28
运营商 中国电信与招商局集团签署战略合作框架协议
5月23日,中国电信集团有限公司与招商局集团有限公司在深圳举行战略合作框架协议签约仪式。 <详情>
2023-05-19 08:53:14
运营商 中国电信邵广禄:投资结构向数字经济倾斜,天翼云、AI等数字产业投资每年增长40%
在5月17日举办的2023年世界电信和信息社会日大会上,中国电信集团有限公司董事、总经理、党组副书记邵广禄介绍了中国电信在云、网、数、智、安等方面的新进展。 <详情>
2023-05-09 09:39:55
运营商 中国电信研究院发布两项云计算领域RISC-V研究成果
基于RISC-V的云服务器操作系统适配以及轻量级虚拟化平台研发,是业界推动RISC-V入云进程的关键步骤,也是中国电信构建RISC-V云计算生态领先优势的重要突破。 <详情>
2023-03-14 09:09:33
运营商 中国电信启动2023年天翼云安全产品集采:总规模1068台
3月13日,中国电信发布公告称,中国电信2023年天翼云安全产品集中采购项目资格预审公告(以下称原资格预审公告)于2023年3月3日发布,现对原资格预审公告进行变更, <详情>