为了深入落实国家大数据战略,推动大数据产业交流与合作,展示我国大数据产业最新发展成果,2019年6月4日至5日,由中国信息通信研究院、中国通信标准化协会主办,大数据技术标准推进委员会承办的2019大数据产业峰会在北京国际会议中心隆重开幕。6月5日,数据流通技术与法律论坛隆重举行。

尊敬的各位来宾、各个领域的专家、大家下午好,我是来自腾讯研究院的王融。我们连续参加大会的分会好几年了,今年也是围绕今天这个主题,今年的分论坛了很大的特色变化。我们把法律、技术两个领域的专家齐聚一堂,大家从不同的解释教解读工作中合规的问题。从我自己的工作经验来看,去年已经发布了2018年数据治理报告,解决隐私和数据保护问题里面我们越来越意识到单一靠法律或者单一靠技术不能解决问题。而且越来越明确的,法律本身有自己的缺陷,比如欧盟的GDPR对数据的流动、保护建立了非常全面的规则,实际上在GDPR实施这一年多以来我们可以看到确实还是不仅没有解决原来的问题,还可能带来了更多新的问题。所以我们真的要打破原来的一些思维定式,从不同的角度大家共同讨论,激发不同的思路,期待今天的论坛能给大家带来更多的启发,希望今天的论坛里面的这几位发言嘉宾,特别是法律和技术不同领域的专家,他们的思想和火花能够带来新的碰撞,给大家带来知识。

下面有请今天第一位发言嘉宾:中国通信院云计算与大数据研究所高级工程师闫树,他在这个领域深耕多年,将给我们解读可信数据服务与安全多方计算。有请。

W020190605534398794826 (1)

中国通信院云计算与大数据研究所高级工程师 闫树

谢谢王老师的介绍,大家下午好,欢迎大家来到数据流通的论坛。像王老师的介绍一样,今年的论坛设置有一些不一样的地方,往年技术是一个论坛,法律是一个论坛,今年合在一起。我们发现这两个地方只有融合起来才能释放最大的价值,做技术的一定要遵守法律的要求,做法律的也要知道技术的现状,尤其我们现在产业的发展其实是日新月异的,很多时候现状如果我们更好了解到的话,会发现无论从政策还是法律的角度会有更多可以实现的地方。

数据流通成为数据价值释放的瓶颈,数据价值释放的环节上数据流通成为卡脖子的环节,我们知道数据价值释放涉及到对数据的共享与挖掘,多方之间进行转移。但是数据的转移牵扯到多方的数据安全和法律的问题,尤其在合规性方面,已经面临很多的各种各样的风险,通过可落地的技术手段解决问题,在法律的框架下充分发掘数据的价值。

所以我们今天的论坛既有法律方面的专家,也有来自BAT三家做多方计算的三位很著名的技术专家,可以共同的为大家奉献一场如何解决数据流通问题的方案。

数据流通是国家大数据战略的重要方向,总书记说过要制定数据资源确权开放流通的制度,国务院的发展纲要里面提到要促进数据资源流通建立健全数据的交易机制和定价机制。GDPR发布了相关的报告,一方面是自由流通,一方面是保护,他们知道这两个之间需要有一个平衡。在欧盟委员会2018年发布的欧洲数据私营共享指南当中,里面对数据流通的现状和问题进行了分析,发现最大的问题是第一是技术,73%的欧洲企业在做具有流通业务的企业,它们认为技术问题是阻碍数据流通最大的障碍,54%的人认为是法律,这也是我们今天把技术和法律放在一起阐释数据流通的缘由。

我国面临的数据流通也不容乐观,这都老生常谈了,数据安全有待加强,数据定价、数据质量这些都是长期制约数据流通的问题。国家合规性要求也在不断的提升,今年1月信标委发的个人安全信息保护的国标,网络安全法,还有上周网信办的数据安全办法,提出了很明确的监管内容,有一部分内容要求比较高。

然而,法律法规更多是解释什么样的举动是犯法的,但是没有告诉你如何算合规。我们想合规怎么操作,这是我们所做的工作想解决的问题,我们希望通过我们的标准和研究,帮助做数据流通的企业,帮助各方用户在不触犯法律的基础上,做到又符合行业共识,流程又很顺畅,这样能够有比较清晰的解决方案,这也是我们服务的根本宗旨。

我们院长期跟踪数据流通的发展,在16年颁布了数据流通自律公约,算是行业自律比较早的尝试。17年进行了信息披露的行动,把企业做数据流通的时候涉及到相关的一些公众不知道的内容,但是必须向公众阐释、有必要增强可说服性的内容进行披露,完成了十家企业的评测工作。后来数据流通市场在一些法律的影响下,产生了一些变化,所以我们现在也面临比较新的形势。现在更多是从技术角度进行解释,去年发布《数据流通行业关键白皮书》,从理论走向现实的技术有比较全面和比较深入的阐述,我们单位获批的有发改委大数据流通与交易技术国家工程实验室,我们在这个里面牵头做的大数据流通合规评估研究中心,是实验室下面评估的中心,成为数据流通合规性领域比较权威的机构。

在可信的领域,这是一个非常简化的模型,我们这次推出的是数据供方的标准和数据流通平台的标准,多方计算的标准现在都已经制定,这次发布是以TC601的名义来进行的发布,同时我们在中国通信标准化协会进行了立项,目前这两项在同标协下面5月份完成了立项工作。

我们对可信阐述的四个方面包括技术可信、流程可信、管理可信、用户可信。技术可信方面,我们的标准里面,虽然点到为止,但对数据流通的技术进行了一些提倡,用某些技术完成某些功能,但是可信服务的标准并没有对技术细节进行探讨。另外是流程可信,对数据流通过程中的很多环节进行了规范性的流程描述,比如我们要做一件事情先怎么样怎么样,我们这个标准大致来讲管理性的标准,比如做流通品的管理,做流通过程的管理,每个管理包括什么步骤,都算什么表现,这是标准里面着重探讨的。用户可信,通过评测的企业对用户来说是可信的,这是希望标准最终能够达到的效果。

第一个标准内容包括两个:一个是可信数据供方的评估要求,可信数据流通平台评估要求。第一是可信数据供方的评估要求,我们梳理了相关法律法规中的一些管理办法,尤其是网络数据提供的要求,我们在这个里面进行了归纳。第二个是可信数据流通平台的要求,包括术语、定义、总体要求,数据流通管理平台,供方需方的管理等等。

我们把数据流通分成了三类:一个是中介性的;第二个是采集、产销;第三是综合服务商,标准约定了数据流通平台的资质和功能,功能分成通用功能和非通用功能,非通用功能针对三种不同类型的数据流通提出了不同类型的分类,数据挖掘和数据分析是综合服务商的平台提出的要求。

接下来是数据流通参与主体的管理,比如我作为一个流通平台,我要进行数据流通的时候跟数据供方约定什么内容,跟需方约定什么,都有设计。接下来是数据流通品管理,我们在数据流通品里面分了基础管理、流通品分类、交付方式等等。还有数据流通过程管理,梳理了数据流通企业进行数据流通的时候的全环节,资格审查、质量监测、需方需求评估、供方数据传输、相关数据服务、交付结算、流通后服务,我们推荐有一些双方的质量评价,或者数据保险等等增值服务。

接下来是安全多方计算,接下来三位专家会详细的介绍,这里简单把定义说一下,这是一种计算方法,或者是一种计算技术,试图解决的问题是,多方是指三方以上或者更多的,对彼此不是完全信任的条件下完成数据价值的共同释放,或者数据计算。我有我的数据,你有你的数据,他有他的数据,我们本身并不想把自己的数据拿出来,我们想利用对方的数据实现综合的函数计算或者相关的功能,这个其实并不是不可能的。现在有三个人,想算三个人的平均年龄,但是我不想把自己的年龄告诉其他人,我把我自己的年龄加一个数告诉其他人,其他人再加上一个数告诉我,我把我加的数减下去就知道了大家的年龄。

多方计算也是很的巧妙的函数的计算方法,同时功能和性能随着最近几年的计算技术和大数据技术的不断提升导致现在的一些理念走向现实,可显示性和可落地性,或者产业化的能力越来越强。多方计算的金融数据价值很高,如果跟一些其他数据进行结合之后释放的价值会很多,但是数据本身的安全性要求很高,所以必须要一些技术手段来达到释放的条件。这些产品有些是以内部使用为主,慢慢的也会往外提供,有的是大数据的部门,有的是安全部门,下面三位专家也会介绍。

我们这个标准是基于安全多方计算的数据流通产品,我们本身对安全计算这一块,并不是完全评测安全计算本身,而是通过,我们希望是实现数据流通的功能,从数据流通的角度进行数据评测,从供应方到需求方对数据安全进行保护。产品化进展,目前市面上也不少,各种方法实现多方计算的流通产品,像区块链也可以作为一些解决方案进行提供,优势就是原始数据不发生转移,可以正确的完全多方数据参与的任务,包括性能受到比较大的影响,而且产品差异度比较大,这也是我们推广这个标准跟评测最大的意义,希望通过这个评测,这个评测包括我们自己对功能的审查,对日志的查验,还有算法的专家进行审核达到安全性的背书也好,或者认证也好,需要统一的标准来界定基于安全多方计算的数据流通,来验证数据流通的方式。

我们标准包括了五块,这也是我们跟在座的,或者基本上国内做安全多方计算的很多厂商共同完成的标准,包括的是数据相关基础能力,编译及计算能力数据流通相关管理能力,产品安全性、健壮性、稳定性相关能力,以及有些相关性能要求,对于计算各类任务我们要定义一些性能。

这个标准是技术性比较强的标准,这是我刚才进行五大类领域的,每一个有相关的测试,并且有必选和可选的发布,6月份就要对一些厂商安全多方计算进行评测,我们接下来通过不断的测试进行标准的更新,吸纳业界最新的结果,同时符合更广泛的业界技术需求。

第一个就是产品的性能,除了这个功能之外,对它的性能要进行一些更深入的探索。另外是其他种类的数据流通产品标准,下一步会涉及到其他的种类建立相关的标准。像刚才说的,基于安全多方计算的数据流通的产品正式加入了接下来的产品能力评测,下个月进行第九批的测试报名,希望大家参与我们的报名测试工作。两份单位的参与单位也是得到了很多厂商的大力支持,可信数据服务是在华为、北京邮电大学、搜狐等等,这些企业和专家为我们这个标准贡献了很多的力量。

安全多方计算也是蚂蚁金服、百度、阿里巴巴、腾讯云等等,他们对我们的标准也是进行了探讨,在此也是对参与标准编写的企业表示感谢,谢谢大家。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2019-07-31 13:28:21
大数据资讯 贵州:大数据服务队为传统企业“会诊”
日前,贵州省大数据发展管理局和国家工业信息安全发展研究中心共同主办的大数据与实体经济深度融合全国行在贵阳举行启动会。贵州以大数据为传统企业的转型升级“把脉问诊” <详情>
2019-07-30 16:33:20
互联网 工信部:上半年我国互联网企业业务收入5409亿元 同比增长17.9%
上半年,互联网企业完成相关的互联网数据服务收入48.2亿元,同比增长34.2%;截止6月末,部署的服务器数量达155.9万台,同比增长22.3%。 <详情>
2019-06-13 09:51:54
国内资讯 数梦工场崔晓峰:数据资产需要可治理、可管理、可共享
服务于25个以上部省级客户、100个以上城市级客户、拥有150多项专利、通过CMMI5级软件认证……这些都是数梦工场在2015年成立以后,短短4年内取得的成绩。 <详情>
2019-06-11 15:52:00
国内资讯 现场直击 | 2019大数据产业峰会
为了深入落实国家大数据战略,推动大数据产业交流与合作,展示我国大数据产业最新发展成果,2019年6月4日至5日,由中国信息通信研究院、中国通信标准化协会主办,大数据技 <详情>
2019-06-11 11:31:42
国内资讯 2019大数据产业峰会| Datablau王琤:EDW2019-国际数据管理最新趋势
国内跟西方有很大的差距,西方行业里数据湖架构讲了很多,国内目前行业内讲得还是比较少。国内大部分都是把大数据平台当储存来用的场景,数据湖、数据海、数据池塘等等很多 <详情>