《关于做好个人征信业务准备工作的通知》中规定的六个月准备期已过。期间,央行对8家机构进行了多次验收,但在验收后均保持沉默,迟迟未发个人征信牌照。可见央行对发放个人征信牌照持谨慎的态度,对个人征信机构的评分模式、数据来源、隐私保护等方面要求严格。第一批个人征信牌照尚未发放,第二批人征信牌照申请暂停。要顺利通过央行验收,进入个人征信领域,各家机构还需修炼内功。从央行的态度来看,我国个人征信市场离百花齐放仍有段距离。
相较于保持独立性,个人征信机构在对用户隐私保障方面受到的争议多一些。国务院颁布的《征信业管理条例》,对个人征信业务已经有比较详尽的规定,例如个人宗教信仰、血型、疾病等相关信息禁止采集,个人的收入、存款、有价证券、商业保险、不动产的信息和纳税数额等需要明确告知信息主体提供该信息可能产生的不利后果,并取得其书面同意才能采集。但是,随着个人征信机构与其他机构的深入合作,征信机构接触到的用户信息类型变得复杂,对于地理位置、社交信息、消费信息这些“个性化”数据的采集范围,并不好界定。同时,用户在授权征信机构使用相关信息时,同意个人征信机构将不涉及详细信息的评估结果推送给合作或服务机构。这种“打包”方式的授权,不能确保用户完全知情,存在泄露用户隐私的风险。
“如果只是服务于集团公司,根本不需要成立征信公司。我们成立就是为了服务于第三方公司。”前海征信总经理曾经在采访中这样说到。从逻辑上来说,个人征信机构定位于第三方,保持自身的独立性是说得通的。随着个人征信市场的发展,市场上必然会出现更多的个人征信机构。如果无法保持独立性,产品的质量得不到保障,市场自然会将其淘汰。退一步来讲,即便是服务于集团内部,征信产品依然需要保持独立性,不公正的信用评估损害的是整个集团的利益。然而,目前个人征信机构用信用评分陪跑集团其他业务的营销手段,使其作为第三方的独立性遭受质疑。笔者认为,随着引入外部数据的比例升高,服务机构的数量增多,个人征信机构的独立性会得到实质提升。
独立性和隐私保障是绕不开的话题
马云马化腾马明哲的个人征信牌照梦还有多远?腾讯征信与银行信用卡中心合作紧密,广发银行和浦发银行都是其合作伙伴。除了银行,P2P网贷平台信而富已经和腾讯征信联合推出了借贷产品“现金贷”,共同探索大数据借贷和征信。
前海征信的产品则主要用于机构客户,着力于B2B市场。前海征信和陆金所联合打造的P2P开放平台“人民公社”,并且与小贷公司、消费金融公司、汽车金融公司业也有合作。
芝麻信用在集团内部已经用于花呗、借呗等,根据芝麻分数的不同,用户被授予了相应的额度。在集团外部,芝麻信用与金融类场景和生活类场景的合作紧密。芝麻分达600便有机会得到招联金融“好期贷”、趣分期和来分期提供的金融类服务,以及小猪短租、相寓、神州租车、一嗨租车、世纪佳缘、珍爱网和网易花田等提供的生活类服务。
目前,三家机构都推出了相应的评分类产品,用来评价用户的信用状况。除了信用评分,三家机构还推出了其他产品。芝麻信用有数据变量服务、行业关注名单、反欺诈产品和芝麻报告。前海征信有数据类产品、云系统和功能插件三大产品线。腾讯征信有人脸识别服务和反欺诈产品。
信用产品的应用
P2P,马云马化腾马明哲的个人征信牌照梦还有多远?采用创新模型和算法的大数据征信,在信用评估过程中到底起到了多少作用?这是大数据征信急需回应的问题。在传统征信人来看,各类大数据对于征信的作用尚待验证。在各种数据中,金融数据与信用评估的相关性最强。除开金融数据以外的其他数据与用户信用状况的相关性如何,怎样在非金融数据找到合适的变量,并把这一系列弱相关的变量结合起来全面刻画用户的信用“肖像”?这些是新模型和新算法需要解决的问题。
现阶段,大多数人的关注点是三家机构的数据来源,对评分模型这种仁者见仁智者见智的方面关注度不高。实际上,运用大数据进行征信,算法显得尤其重要,算法不同影响着评分的准确性。目前,三家机构的评估维度和评分模型有一定区别。根据公开资料整理,芝麻信用的评分模型与FICO相似,同时在研究和吸收传统征信评分模型的算法优势上,积极尝试了前沿的随机森林、神经网络等算法。前海征信的评分标准和FICO相同,在变量设计方面,根据自身数据特点,改变了部分变量。腾讯征信利用了其大数据平台TDBank,在不同数据源中,采集处理相关行为和基础画像等数据,并利用统计学、传统机器学习的方法,得出用户信用评分。
表1.三家个人征信机构信用评估维度
模型和算法的较量
通过三家的数据来源可以看出,芝麻信用的电商数据和支付数据多,前海征信的金融数据非常丰富,腾讯征信的社交数据十分全面。同时,芝麻信用和前海征信对外部数据的兴趣相当浓厚,积极寻求外部合作机构。
马云马化腾马明哲的个人征信牌照梦还有多远?腾讯征信的内部数据维度众多,包括了说说、相册、音乐、游戏和QQ增值服务等业务数据,也包含了QQ群、QQ关系链和用户属性等关系数据。截至2015年底,QQ月活跃账户数达到8.53亿,微信和WeChat合并月活跃账户数达到6.97亿,社交数据资源丰富。在外部数据方面,腾讯公布的具体信息不多。
前海征信的数据主要有三个方面,一是平安集团内部数据;二是包括银联、电信运营商、公安机关、最高法院在内的其他第三方数据;三是近200家金融机构的数据,这些金融机构在一定程度上与前海征信进行数据共享。据有关新闻报道,前海征信与金融业务相关的数据占比约为六成。
芝麻信用的数据可以分为内部数据和外部数据。内部数据主要是电商交易数据和支付宝的各类金融数据。外部数据主要包含了公安机关、最高人民法院、教育部、工商行政管理局等政府公共数据,深圳电信、LinkedIn、神州租车等合作机构数据,以北京银行为代表的金融机构的部分数据,以及用户自主上传数据。从芝麻信用公开的资料来看,外部数据占比已超过80%,远大于其内部数据占比。
数据何处来?
近日,央行即将发放个人征信牌照的消息再次传出。这离央行印发《关于做好个人征信业务准备工作的通知》已有一年零四个月。在8家等待牌照的个人征信机构中,芝麻信用、腾讯征信和前海征信因背靠阿里、腾讯、平安三大集团,各自有马云、马化腾、马明哲这样有名的“爸爸”而备受关注。其实,这已经不是“三马”第一次聚首。早在2013年,“三马”便已强强联手,成立众安保险。此次,“三马”再相聚,合作伙伴变竞争对手,火药味甚浓。经过一年多的准备,三家机构在数据来源、评分模型和信用产品等方面做出了哪些成果,离拿个人征信牌照还有多远?笔者将在本文进行对比分析。
温馨提醒:随时光飞逝,岁月变迁,文章观点,准确性、可靠性、难免有所变动,因此文章观点仅供参考!