中国IDC圈7月1日报道,2016年6月24日,由数据中心联盟金融信息技术委员会主办、中国IDC圈协办的"2016金融信息化成果展示会"暨金融信息化技术委员会成立一周年报告会在北京国际会议中心盛大召开。

本次会议持续一天时间,共设置了一个主论坛和三个分论坛,分论坛包括大数据专场、数据中心专场、云计算专场。会议特邀了国内各大银行技术大咖及业界精英齐聚一堂,共同探讨"互联网+"时代下,我国金融信息化发展的现在和未来。其中,北京诚智汇达信息科技有限公司创始人兼CEO龚才春博士出席“大数据专场”并发表关于题为《职场大数据征信》主体演讲。

大数据龚才春

北京诚智汇达信息科技有限公司创始人兼CEO龚才春博士

以下为龚才春演讲实录

龚才春:职场大数据征信这个事情,为什么我们要来做这样一个事情,我本身背景完完全全互联网技术屌丝的背景,对金融对征信以前一点不了解,为什么我们想做这样一个事情?我们发现对比一下中国、美国、日本三个国家,在美国其实从业者只有1.4到1.5亿,日本从业者只有8000万样子,中国从业者9.2个亿,是日本12倍,美国的6倍多,美国前一段时间大家看到一个新闻,微软以262亿美金天价收购了(英文),在美国1.4亿的从业者出现在一家将近三百亿美金的人力资源公司,日本八千万从业者出现一家300亿美金的公司,中国猎头行业大概是三千亿市场规模,实际上没有哪一家公司做到超过1%以上的份额,在人力资源行业和中国餐饮行业几乎一模一样的情况,也就是说没有出现大公司,我们认为中国人力资源这一块没有出现大公司。

正常情况下中国人力资源行业应该出现两到三家千亿美金以上的招聘网站,三到五家五百亿美金上的猎头公司这是正常的,为什么中国出不来一家像样公司,大就是中国人力资源这块诚信环境特别恶劣,后面有一些具体数据讲到我们中国人力资源这一块到底诚信环境有多么的恶劣。这是我们在讲一个人力资源行业的基本的情况,首先我们可以看到HR他会在那抱怨,HR老是说为什么我收到简历那么多的虚假,为什么我收到简历跟我发的职位一毛钱关系都没有,这是HR的抱怨。另外一方面HR天天自己在那造假,它发布很多的虚假照片,也发布很多过期的职位,在网站上都有这种情况。我们在中国人力资源招聘网站每一天发出来职位是1000万左右,60%是虚假的职位,虚假职位有很多是诈骗的职位,58、赶集上大家看得比较明显。人力资源行业有四个比较奇怪现象,第一、每一个人都讨厌别人不诚信,我发现别人不诚信我特别反感。第二、每一个人都希望自己可以不诚信,我可以获得一些利益,包括猎头也是,它天天发虚假职位,他又希望收到简历又是真实的。第三、发现别人有不诚信的时候我都希望识别出来。第四、如果我自己不诚信的时候我希望别人都看不出来,在中国行业都变成这样子了,这是中国的诚信环境情况。

候选人天天在那造假,简历天天写假的,约谈面试基本上不来,我们打了电话、发邮件、发短信,这种情况下到面率不超过20%,这个不超过20%包括BAT这些大公司也达不到30%、40%,只有像金融这块或者说大型国企央企这块到面率比较高,我们公司基本上达不到10%的,这块导致我们觉得诚信环境特别恶劣,不管是HR还是候选人都非常不诚信。

不诚信不是人的问题是机制问题,不是说中国人诚信就那么差,而是没有一套诚信。之前大家都被黑车司机宰过,但是我们Uber、滴滴打车就没有这种情况了。人力资源之所以不诚信是因为人力资源这一块商业模式导致的,类似于我们招聘网站的商业模式类似于举个例子猎聘,你一年交一万九百八十块钱可以一年发50个职位,另外一方面因为你职位是假的,候选人也造假,经常投哪些职位也不知道,还是机制问题,我们从机制上改变这些,至少我们现在识别这样一些造假,这是给的一些数据。

第一个数据85%简历造假,这个数据官方给的数据,我在大街网看到数据比这个更可怕,几乎发现每一份简历都有造假,虚假简历几乎100%.第二个说30%,就是说一个应届毕业生简历拿到以后真实成分不超过30%,我们试过一个事情你把一个班所有简历集中在一块,你去掉姓名、手机号码等其他内容基本上一样的。我在淘宝你面试大数据挖掘等一定到我这面试,我面试一个非常牛的学校我面试30个学生,这个导师4个学生我同事面试,面试完以后4个学生号称那个项目负责人,你把所有简历集合起来很容易识别出来。中国为了招大学生花200亿及中国应届毕业生每年七千多万,找工作四百万,找到工作一百万左右。为了招这一百万人我们花200亿平均每招一个大学生需要两万投入,招白领大家还不知道花多少钱,这个市场份额我还没有得到数字。

蓝领这块问题更加严重,同时更加有价值,像保姆,我家有一个小孩要请一个保姆来看,我很担心保姆会不会给我孩子喂安眠药,这些对蓝领行业征信更加有需求。后面说一些背景,我们现在征信系统我大概知道有240多个征信项目,基本上大家都还是更多集中在金融的征信这块,因为确实与钱靠得很近,我没有金融背景我还是从事我比较了解人力资源行业,来做人力资源线上的征信。人力资源也有线下的背景调查公司,泰和做得比较大,一份背景调查报告三十到五十块钱。这是我们整体的商业模式,最下面是我们所说数据层,我们未来能够用计算机生成每一个人职场征信报告我们需要采集很多数据。第一方面数据我们叫做权威数据,教育部、社保、公安部等这些是权威数据,大家到教育部查我在什么地方上的大学,也许查不到,因为教育部只有2001年的之后数据,2001年之前的数据他自己没有。第二我们通过合作方式跟我们合作伙伴交换数据或者共享数据,我们开发我们猎头管理软件HR管理软件,这些都是跟猎头HR共享数据。第三块通过我们互联网采集,这块我们大部分数据通过这种方式获取的。第四块用户到我们这注册,提交他的征信的数据。中间我们所说我们征信的计算的过程,我们所说的大数据挖掘,在职场大数据就在中间我们生成征信报告的过程。这里说了职场的定级,可能大家没有听说过什么叫做职场定级?其实大家可能知道教育部每年对中国高校进行排名,中国有3500所高校,教育部基本上每年出前一百,一百强能够出来,中国排第3500的高校是哪一个,教育部不知道,中国最牛的大学是哪个,最差是哪一个,我们用计算机算一下,发现前一百高校跟教育部基本上比较吻合,我们排序办法比较靠谱。在职场这块定级不仅仅是高校定级,另外公司的定级,中国有七千万家公司到底哪一家公司最厉害最牛,哪一家公司最不好。中国有9.2亿从业者,每一个职场信用怎么恩样,每一个人出去找公司应该拿多少钱工资,这个事情由计算机来算,为什么我们这些事情由计算机算而不是用HR来算,HR心理没有谱,也要天天问别人了解行情。我们共享人力资源的数据,大家认为我们这些事情为什么用计算机算,我人去面试,面试过程当中我就知道这个人虚不虚假,知道这个人怎么样,其实人最不靠谱的。我们在大街网做了一个数据,我们HR筛选简历,我们发一个职位HR找到一个候选人,业务部门判断候选人跟这个有没有关系,HR准确率60%,找的10份简历有4份跟这个职位没有关系的,我们大街网(音)计算机算出来是80%这一块,在筛选简历计算机远远超过人类的。第二块面试,面试是计算机厉害还是HR厉害,面试判断一个候选人谁更好谁更差,人准确率是56%,56%什么意思,我们拍脑袋是50%的准确率,你面试花那么多的代价那么多的钱,准确率只有56%,还不如不面试,人力资源这块其实你不需要面试你面试也白面试,用计算机算更加靠谱,需要你对这个人足够了解,信息上有足够的获取。

后面计算的征信,职场大数据征信两个方面,第一个虚假简历识别,虚假识别是中国特有的现象,在美国在日本或者英国基本上没有这样一个市场需求,因为没有谁敢在自己简历上造假,在中国几乎所有人都会在自己简历上造假,所以我们现在识别特别多简历的虚假,大家如果加我微信好友我会发出我识别出来的虚假,其实很简单。我们主要的客户分为五类。第一个猎头会用背景调查,HR也要做背景调查。金融机构这一块实际上也要看这个人职场的征信。举个例子我发现这个人确定是百度的总监,类似确定像刘总就是百分点的技术VP,这种向银行申请贷款五百万,你不需要提供任何资料可以直接发放,这没有任何风险,这是我们职场征信用到金融机构的原因。第四个金融机构,你投资一个创业者更多投资这个人,如果创业之前他职场经历有虚假,你这个钱可能打水漂,哪怕项目再好。最后是业主,我请一个保姆一个保洁等业主也是我们的客户。我们白领征信这块我们想怎么做?最左边是我们所说的数据,这只是列一下,远远不止这些数据,猎头随访记录、面试官评价,不管是我们微信微博乱七八糟我们能够采集到的数据,包括运营商各种各样的地方获取到的数据都在这个范畴之内,中间是我们挖掘模块。基本上所有我们从分类上来讲我们要判断基本上都是六类方法。

我挑两个第一个自行提交材料。第二第三方辅助,我跑到教育部去查是不是真的是你,我验证你身份我到公安部查。数据调查验证,我拿到30个同一个大学计算机系同一个学生,30个简历发现6个学生会主席,就知道有5个是假的。我们面试如果简历他说他是北京大学的学生,我们判断是不是北大一个问题可以回答,北大正门是朝哪个方向,只要回答不出来这个问题一定不是北大,如果是清华我问清华东门朝哪个方向,回答清华东门朝东一定不是清华的,造假特别多。北京邮电大学设计学院,简历就写北京邮电大学,我们说白领这块我们从哪几个方面判断,包括姓名、性别,大家不要小看性别,很多人性别造假,尤其是互联网这一块你知道很多人性别造假。如果他不写性别一定是女孩,他跑到我这面试商务不写性别一定是男的,基本信息也有很多造假的。教育背景我说了工作经历,我们做过很多背景调查,百度一下我知道这个人很多虚假。这块给大家举一个例子,讲一点点的干货,我举个例子有一个人号称是我们淘宝人力资源的总监到外面面试,恰好是辕马资本投的公司面试他,吹得很好很不错,问我一下这个人的人品能力怎么样,我开始因为在淘宝库里面找不到这个人,我淘宝里面没有这个人,我说你把他简历给我看一下我看看他到底什么背景,那个朋友把这个人简历给我了,我拿他简历做了一个很简单事情,我在百度直接输他的E/mail地址一发,这个人曾经发过一个招聘,招聘人力资源的专员,他是人力资源的经理,你2014年发的职位,邮箱留的你的邮箱,你一定在这个公司,他写2004年到2008年在淘宝做人力总监一定是假设的。

后面说薪酬福利,硕士到我这工作说薪资多少,他说三千块钱,正常他薪资六到七千块钱,技术的话会高一点点,他出去找不到工作没有工作经验,他说我就到你这来就要三千块钱,工作三个月就去跳槽,然后对下一家公司说我在上一家公司六千块钱,他现在有三个月经验我给他八千九千很正常,他是完全找不到工作的人变成月薪八九千的人,就通过一次欺骗就可以。包括面试爽约等都是职业道德方面。

大学生没有工作能力,我们认为大学生什么都不会,这种情况下我们对他征信内容有一定区别,不需要对他工作能力进行征信,更多对大学生时间管理能力进行征信,我们怎么判断大学生的时间管理能力,我只要知道这个学生每天什么时候起床,什么时间去图书馆,什么时候吃早餐,就知道这个大学生怎么样,这个数据我们比较容易获取的。

蓝领这块更多是验证,第一个就是他身份的验证,他是不是真的是那个人,第二个就是人脉的验证,实际上如果我们追债更多用人脉追债是更好的方法,对蓝领这块我们判断他有没有案底、杀过人,有没有强奸过女孩子,这块对蓝领最关心的,相对这块比较好做。

后面讲市场规模的预估,大家很容易想像出来它的市场规模有多大,大家给一个两千亿左右,芝麻真相负责人告诉我说肯定不止两千亿。这是我们公司的一些情况,我个人介绍在册子里面写的很详细,包括我从业背景,以前在什么地方做过一些什么破事大家比较很清楚,下面是我们几个合伙人,还有我们公司现在几个核心骨干的员工。我们现在已经有了一些数据,简历这一块我们现在三年前简历有一亿份,近三年之内48000万份简历,通过各种各样的办法,有合作也有采集的,通过各种各样的方法获取的。我们采集简历为什么这么快?你到招聘网站下载一份简历需要几十块钱,我们不需要自己去弄,因为我不需要这个人的联系方式,中国人所有联系方式我都有,为什么下载简历还需要花钱,所以我们下载简历速度还是蛮快的。这些老赖的数据,欠过别人钱一直还,法院判你还还不还,有案底的人,有精神病史,有吸过毒都是职场必备的数据,还有权威数据你调用别人接口就可以了,对于我们来讲我们不希望以调用接口去做,调用接口可以做认证,不能去挖掘,我们在批量的数据下进行挖掘生成结果,我们希望有存量数据而不是一条一条的验证,这是其他一些数据,这是重点讲的一个大学数据,这是我们跟河南大学合作一块做教育部的一个项目,大学生职业征信体系建设,我们征信这块李克强总理非常重要,去年开国务院会议开72次会议其中有38次讲怎么建立我们政府征信体系。对大学生关注比较多,河南省这一块走在前列,不仅仅是大学生这块想建立信用体系,河南省已经从幼儿园开始,幼儿园小孩每天早晨几点上的校车这个数据记录下来,如果这些数据都记录下来,以前我经常吹的牛皮的事情,人怎么实现永生这个问题不存在了,我们就可以保证这个世界上人永远不会死,你躯体死了以后我们可以在我们计算机世界里面可以完完全全复制一个跟你一模一样的你出来,我们所谓的虚拟生存这么一个技术其实大家可能都听说过了。

第一我们掌握数据量更加足够,另外我们用计算机算出来速度更加快基本上秒级我们可以点出这个结果。这是我们现在公司开发的进度或者正在做的事情,包括猎头系统基本上上线了,也有几家猎头公司正在使用,我们正在推广的范围之内,我们HR系统比较好玩我们开放平台,我们破公司才十几个人的时候我们想到我们技术要开放要免费提供给别人使用,包括大家做招聘很多人尤其我们公司,类似于百度这种公司可能每年有几十万的简历,大部分公司其实没有简历处理能力,所以我们提出开放平台,你简历我可以帮你检息,我都可以把你导入数据库而且全部是免费,包括匹配和搜索都是免费的。

这是我们的目标,今年目标我们基本上采两亿份简历,更新五千万份简历,公司这一块我们想一千万家数据我们获取比较齐全,这些后面是我们解析这一块,后面有一点叫做发现一亿个以上的虚假点,我们发现有一个虚假地方称之为虚假点,我们希望今年发现一亿个虚假点,这是我们长期规划,毕竟我们现在是创业公司,现在十几个人,所有费用都是我掏的,花200多万的样子,我们有这样一个长远规划,我们正在做的事情是最核心的三个部分,猎头平台、HR平台、采集平台,我们做一个数据平台,我们算是中国大人力资源数据中心,虽然我们做得时间比较短,也就是十几个人,数据量来讲一般招聘网站比我们小多了,这是我们数据中心。

第二做我们征信平台,最主要三个征信平台,白领、蓝领、大学生。未来我们做三个平台,一个精准营销平台,我们不做营销服务,我们只要有这样一个数据就可以了,我们把我们数据推荐给这些营销平台使用。大家要做广告首先餐饮的广告向我推荐你最后推荐湘菜馆,怎么知道我喜欢吃湘菜这件事情对我们来说特别简单,我知道他的户籍籍贯是哪里的,由百分点采集看看它的日志就知道他是湖南的他可能喜欢吃湘菜。我们有全国9亿多人简历数据之后,我们觉得我们营销效果比别人更好。第二我们做我们背景调查的平台,我们跟背景调查公司合作,背景调查公司调取费用,他收他五千,我收我们的五十,征信报告比我们简历差不多。

下面学习和分享平台,每一个人在职场都有学习的需求,这个学习对背景调查和真相很有用的,像刘总,我怎么判断他的文本挖掘的能力很强,你写的文章做的PPT,大家对你点评很好,基本上能判断了,这个我们也在做这个事情,这是我们长远规划,我要讲的大概是这些,谢谢各位。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2021-08-04 10:20:45
大数据应用 数据安全治理背景下征信业发展
近年来,随着《网络安全法》、《数据安全法》和《个人信息保护法(草案)》等数据安全保护相关法律框架的落地或颁布,中国征信业发展也嬗变升级,征信业的政策环境、市场环 <详情>
2019-01-08 21:25:06
大数据应用 大数据在征信体系建设中应用的思考
互联网诞生在美国,但在中国应用最为广泛。金融科技脱胎于互联网,走在前沿的依然是美国和中国。金融科技包括大数据、云计算、区块链、人工智能等技术,其中大数据作为一切 <详情>
2017-05-22 09:35:37
大数据资讯 大数据征信面临的挑战与对策
随着征信市场化步伐加快,大数据征信成为热门话题,受到互联网金融和资本市场的追捧。 <详情>
2016-06-02 10:55:00
大数据资讯 大数据征信:芝麻信用、腾讯信用和51信用卡等信用评分模型解析
如今随着大数据时代的到来和发展,可用于评估人们的数据越来越丰富,如电商的交易数据、社交类数据(强社交关系如何转化为信用资产)、网络行为数据等, 来自互联网的数据 <详情>
2016-04-28 18:28:00
大数据资讯 天创征信赵千里:细分领域中的大数据征信
4月27日至28日,由工业和信息化部指导、中国信息通信研究院主办的"2016大数据产业峰会"在北京国际会议中心盛大召开。28日下午,在“大数据征信与数据流通”分论坛中,天创 <详情>