在2019年11月1日举办的2019金融科技产业峰会之“人工智能在金融领域应用”分论坛上,中国信息通信研究院联合行业协会、金融机构、科技厂商、高校等多家单位,邀请知名学术界专家、行业内顶尖企业工程师,就人工智能在金融领域应用的相关议题开展交流,希望为金融及技术领域从业者提供交流的平台,共同推动行业健康发展。星环信息科技(上海)有限公司金融业架构负责人庞博做了主题为:《金融科技中的人工智能平台建设》的演讲。

庞博

星环信息科技(上海)有限公司金融业架构负责人庞博

庞博:各位嘉宾、各位领导早上好,我来自星环科技,我叫庞博。目前在这边主要负责大数据、人工智能以及云计算的解决方案落地的工作。

上面的几位行业专家们都已经分享了整个人工智能在金融这个行业里面的一些领域的应用以及算法、以及实践,接下来我主要是从科技厂商的一些角度来去给大家分析一下整个人工智能平台建设的一个必要性以及它的一个要点。

我今天的提纲总共分为三个部分:第一部分我简单介绍一下星环公司;第二部分介绍人工智能平台建设的必要性;第三部分就是我们建设的思路以及它的一个要点。

首先星环是大数据、人工智能以及云计算的技术软件供应商,我们一直以来也是想通过技术给我们的金融企业、客户包括我们的大众提供简易化、便捷性平台的软件,能够真正地让我们的大数据、人工智能以及我们的云计算走入到我们的企业应用里面。

目前我们有已经超过1600家的企业用户,涵盖了大概10多个行业的应用。这个是我们获得的荣誉,包括Gartner的咨询公司的评测以及DS官方测试,还有前一段时间通过信通院这边评测作为产品线最丰富的供应商厂商,还有2019年我们在世界人工智能大会上面获得的AI产品奖,还有工信部2018年大数据产业峰会上面星环AI产品获奖的情况。

同时我们也是作为国家发改委科技司这边举办的AIIA的人工智能的竞赛,星环作为其中一个赛点,这个比赛上个月圆满结束,同时我们也同工信部这边一起举办过一些培训,我们会定期给我们的企业包括我们的用户提供大数据、人工智能以及云计算的一些培训。

这就是我们星环公司整个的产品家族,包括三个部分,我们叫ABC,A就是AI的部分,主要是智子人工智能平台以及上面的一些解决方案。B就是大数据平台,加上上面一些开发工具、组件等等。第三是针对数据分析、数据应用等等构建的数据分析云平台。

以上是我们在金融行业提供的一些AI解决方案,我们看到比如说客户管理类的、营销类的,这里面涵盖了整个客户的生命周期的管理以及相关营销策略。第二块就是整个风险控制类,包括我们反欺诈、反洗钱等等,包括信贷这块,运营类的包括智能运维、智能报销等等,还有监管合规等等的金融解决方案。

第二个章节主要是讲一下人工智能平台建设的必要性。目前我们在行业里面尤其是我们的业务人员,大概分为两类思想,第一类业务人员觉得人工智能真正对业务的提升并没有太大的帮助,他们不是非要相信这个技术。第二类就非常相信人工智能,他们认为它就是超人。现在智能客服实际上已经有了比较大的发展,但是实际上人工智能虽然在比如说营销、风险控制、监管合规等等领域有非常大、非常广泛的应用,但是还是得需要跟我们的专家的经验、我们的一些知识相辅相成,所以我们也认识到整个技术的局限性,它是需要我们科技公司以及我们行业的一些专家不断地去积累才能真正把人工智能深入地、深度地应用到我们金融的领域里面。

我们在百科上面人工智能的定义就是去研发、模仿以及拓展人的理论知识的一种技术。所以说我们整个人工智能里面其实是离不开人工的这些经验,比如说我们的业务分析的经验,我们对数据的一个定义等等,以及智能算法、一些模型,我们需要不断地去积累下来、去成就,才能最终把我们的这些技术深入地应用到我们金融行业这个领域里面,所以说建设的必要性就是把我们人工知识以及我们智能的这些模型做一个沉淀和积累。

这是我们真实的在落地过程中的一个过程,其实我们发现,我们这个图上面两层的这些模型,比如说客户管理的一些模型,我们一些风险控制的模型,包括产品推荐的一些模型,他们都需要用到一些公共的数据,比如说我们看到的静态的数据有交易类的,有设备类的、有网络类的、、静态数据,动态数据,比如客户存款信息、财务信息等等。这些数据在我们建模的时候我们需要做大量的特征工程才能知道哪些数据最后是适用于我们这个模型的。首先从特征这个角度是可以复用的。

最后我们看到我们做零售产品的推介,我们做这个模型的时候实际上也用到了倒数第二层的客户细分模型或者贷后违约的预测模型,或者是客户流失模型。我这里想表达的是特征和模型都是可以不断积累的,同时通过这些不断地积累也避免了我们在未来构建新应用的时候重复地造轮子。

这是我们现在的现状,首先就是我们在金融行业里面,我们的建模的语言是非常多的,比如说有R语言、有SAS语言、有Python和Matlab语言,面对不同的角色,学统计学的同事更偏向于R和SAS,算法工程师对Python或者对Matlab更加了解。

第二平台也是非常多的,比如单机、Spark、Tensorflow、MxNet上面,工具上会出现碎片化。

信息也会碎片化,不同的部门对于活跃客户、流失客户、设备指纹、风险评级数据的标准定义都不同,工具碎片化、信息碎片化导致模型共享上面会存在一定的问题。

我们现在发展的历程,就是在企业里面先是拿到了业务部门的业务需求,然后我们再去想我们能够通过什么样子的算法解决这个业务需求,再往下一步我们去选比如采用什么样的语言去倒数据、去建模等等,我们希望通过平台化的一些管理把我们的特征和模型积累下来,在不久的未来我们能够真正实现数据与技术驱动整个的业务创新,我们通过我们已经积累的数据、我们积累的模型去发现一些业务上暂时还没有想到的需求。比如说黄老师讲到,我们采用无监督的学习去发现洗钱里面的异常行为,可能这些异常行为在我们用这种有监督的算法可能是没有办法去发现的,这个时候很多业务也没有意识到,包括前面我们专家提到的智能运维,可能有一些这种异常是我们业务他可能也没有意识到。

第三部分主要是想讲一下人工智能平台建设的一个要点以及我们在真正落地的过程中提供的一些思路。

第一个我们认为建设企业级人工智能平台的总体目标是包含了这几部分,但不限于这几部分。第一部分这个平台应该是面向于各种角色,包括我们的算法工程师、我们的业务分析专家、我们的行业专家等等,构建一个统一的平台,它的目标是为了提升整个建模的效率以及降低由于各种包的导入升级带来的一些IT运维成本。第二块我们认为应该与大数据现有的一些基础设施进行对接,比如说我们的模型需要跑在分布式或者GPU的架构上面才能有一个非常大的性能的提升,这个时候我们与现有的这种分布式的架构进行对接,同时实现特征的、模型的一些共享和复用,避免重复造轮子。第三部分就是我们要与业务系统的打通,真正地去跟踪这个模型的一些应用的效果,不停地去迭代,不停地去提升它的性能,设置一些对照组。最后构建AI的中台,面向未来越来越多的应用提供平台化的服务。

我们在建模的过程中可能会涉及多个部门,比如说有数据工程的部门,他们需要对这个数据做一些治理、做一些整合。还有我们数据建模团队去做整个数据的模型开发以及设计,最后就是我们的业务分析师,真正地去使用。其实我们肯定最右边的图,是现在整个过程中涉及到的一些工具,比如底层、数仓等等一些工具,中间建模的一些工具,再上面有一些BI的工具,我们知道再往后BI跟AI的定义会越来越模糊,在使用BI去分析数据的同时其实也需要用到AI的这些功能。所以说其实我们认为这个平台是需要打通整个数据这一层,然后贯穿整个数据的整合到数据建模到最后数据的分析与展现。

我们前期大家在各个金融行业里面都已经构建了大数据平台,但是实际上在业务这个层面其实是没有感知的,因为可能他们真正应用到的还是业务系统,同样其实对于业务来说,他们把AI平台或者是AI建模工具也定义为开发环境或者是训练环境,真正在生产环境上面其实还是业务系统。所以说我们认为我们未来如果想通过数据和技术驱动整个业务的创新其实也是必要的,让我们的业务真正地去接触到我们整个建模的这个流程,让他们参与进来,让他们真正地去相信我们的解释性是能够值得他们信赖的。所以说其实我们认为能够通过上面这套架构从打通数据到业务全流程。

这是我们在落地中的企业级人工智能平台总体架构,我认为最下面是我们的一些数据源,我们AI平台需要贯穿各种数据源,比如关系型数据库、数仓、大数据平台等等,再上面提供的是数据资产的目录,我们能够让我们的数据科学家、我们的业务人员能够去看到我们真正有哪些数据资产,他可以去申请、可以去订阅。

再往上是一个数据的门户,比如说我们数据的准备,我们数据的探索,数据的特征工程等等,建模。其实我们据调研,在一个真正的AI落地的过程中可能有30%是建模的工作,有70%都是数据准备的工作,所以说我们要尽量地缩短这个数据准备的时间,让我们数据的科学家、业务分析师快速地拿到这些数据,然后应用到它的建模的流程里面。

再往上我们认为需要有两个管理,一个是特征及标签的管理,比如说别的部门、别的工程师已经完成的一些特征工程,梳理出来的一些特征和标签为什么不能复用呢?包括我们前面做的一些AI的模型、风控的、客户的、精准营销的等等这些模型其实也是可以积累下来,然后通过迭代、通过它的一些性能的追踪提升它的最终的效率。

最往上就是它的一个接口层,一般现在有离线批处理的,还有我们觉得未来需要提供这种实时的服务。

还有就是整个管理,比如多租户管理、资源分配、安全管控、审计、运维、包括简易化的部署安装等等。

Garbage In Garbage Out,数据质量差,得到的模型效果也非常差,我们认为从技术的角度,比如说在整个AI的平台构建会需要提供比如说数据质量的一些管理,ETR的加工调度以及数据脱敏,生产环节中数据是非常敏感的,我们如何把数据脱敏到开发平台、脱敏到开发的环境中让我们建模工程师使用,这是非常大的问题。

从业务层面,快速地搜索这些高质量的数据,以及通过这些数据的申请与订阅,能够获取这些数据然后开始它的特征工程。后面我还有一个点点点,因为这个其实只是数据准备的化解。

这其实是人工智能模型的开发,比如说对于我们这些业务专家可能喜欢可视化拖拉拽的建模,对于模型工程师或者是建模专家可能更喜欢代码编程的模式。

我们认为一个建模,把这个模型开发完了把它上线了,我们认为只是刚刚开始,因为其实更重要的是模型运营。比如说我们模型的性能追踪,我们是否对业务有真正的提升以及模型迭代。模型特征的分享和共享,让我们避免重复开发这样的工作。

还有我们的安全管控,其实我们知道这个是企业级的一个人工智能平台,在上面会有数据、会有我们的计算资源,所以说如何做到计算资源与存储资源I/O、网络上面的格局以及数据资产如何做到安全性隔离,再往上是多租户的能力。

总体来说我们是希望能够构建一个夯实基础的大数据与人工智能平台,再往上提供这些丰富的应用工具以及安全的管控和多租户能力,最终为上层多样化应用提供服务,然后让我们的人工智能真正广泛应用到各种金融应用里面。今天我的演讲就到此结束,谢谢大家。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2024-01-11 16:24:47
市场情报 权威认可!GoldenDB助力国家开发银行和国泰君安荣获2022年度金融科技发展奖
GoldenDB在金融领域已形成领先的落地深度与广度,银行业金融级分布式数据库市场占比24.4%。 <详情>
2024-01-03 15:14:51
市场情报 GoldenDB金融级分布式数据库市场排名第一!
《报告》显示,GoldenDB在银行业金融级分布式数据库市场份额排名第一,占比24.4%。在核心业务覆盖的深度与广度为行业领先。 <详情>
2023-12-29 17:27:29
2023-12-08 14:12:06
市场情报 GoldenDB携手北京金融科技产业联盟发布《应用指南》,助推金融业高质量发展
GoldenDB是基于中兴通讯在数据库领域20多年研发积累、近10年金融行业锤炼打造的一款成熟稳定商用领先的金融级分布式数据库。 <详情>