首页网

杨凯生:多数P2P片面认识大数据 行业应避免认识误区

“有一些互联网企业刚开张没多长时间,对投资人的宣传,对客户的宣传当中总要加上一句自己是运用大数据技术。其实不少互联网企业,他们充其量所能做的是把自己客户群的一些行为数据保留下来。把自己已经得到的数据,误以为是全量数据,把自己所拥有的样本,以为是一个具有充分代表性的随机性的样本,恐怕就会出现问题。”

他曾说,“前一阶段,一些从事互联网金融业务的公司,尤其一些P2P网贷公司频频出现失败的案例。除了其中一部分是蓄意行骗欺诈以外,多数可能还没有搞清楚究竟什么是大数据,自己获得的究竟是什么数据,有没有掌握好数据的挖掘技术、建模技术和分析评估的技术。这些问题并不仅仅是技术问题,实际上也是思想方法和认识方法问题。大体这些公司在思想方法上存在片面性,过分高估自己数据处理能力,并且与普遍存在急功近利的倾向有关系。他们对自己拥有的这些数据究竟能不能用,应该怎么样用于风险识别和管控,并没有经过认真的可行性的应用,也没有可靠的经过反复验证的风险计量模型和科学有效的数据分析方法。”

杨凯生:多数P2P片面认识大数据 行业应避免认识误区

事实上,在4月26日北京大学互联网金融研究中心举办的“北京大学互联网金融发展(第二期)发布会”上,杨凯生就发表了同样主题的演讲。

此外,他认为强调大数据的重要性,不能丢掉小数据。传统的小数据有经典的数理模型,有比较成熟的数据分析统计理论、方法,数据挖掘的技术早就成形。但是大数据到今天为止,管理理论、分析方法都还处在快速发展更迭的阶段,并没有十分的成形。大数据数量越大,噪音相应也就越大。甚至往往是数据大幅增加的时候,它的噪音的增长幅度要快于数据量的增长幅度。因而大数据的挖掘成本是比较高。再比如大数据更容易反映出一些相关关系,而小数据通过分析比较容易直接得出因果关系。在许多情况下相关关系并不能简单地取代因果关系。因此,大数据和小数据各有特点,各有它的长处、短处。简单的想以此来取代彼,不是一种科学的看法。只有把它融合起来,把小数据分析方法的完备性、准确性和大数据的多维性、即时性融合起来,才能对管理真正带来一种质的改变。

同时,有人总以为在一个样本范围内得出了结论,就等同于掌握了对某个问题全部的规律性认识。其实在一个范围内的结论(即便是正确的结论)也不一定能够简单外推,这就是在所谓机器学习中需要严格防止的模型“过度拟合”问题。模型越是复杂、需要纳入的变量越是多,就越容易出现这样的问题。这也正是在金融风险管控中必须注意的“模型风险”问题。

他表示,有的机构掌握了一定量的客户信息数据,就以为掌握了大数据,而忽视了对数据分析工具和方法论的研究,这在金融业务中就有可能影响对风险的识别和防控,造成风险的积聚和扩散。

他指出,互联网思维有另一层含义,即互联网、大数据技术的发展和进步给人类提供的是从更宽视野、更多维度、更全方位来认知问题和分析问题的工具和方法。

P2P,杨凯生:多数P2P片面认识大数据 行业应避免认识误区

杨凯生认为,一些互联网金融公司出现问题,除了常说的法规不够健全、监管不够有力、行业自律比较薄弱,投资者的教育欠缺等等这些原因之外,恐怕还有一个原因是大家对互联网,对大数据技术的理解和认识存在着一定的偏差。在大数据时代更要注意处理好碎片化信息和完整性数据的关系,处理好结构性数据和非结构性数据的关系,作为企业包括银行还要处理好客户个性化意识和社会化共同需求的关系。

据财新网报道,5月14日,在“2016年中国金融科技创新论坛”上,中国银行业监督管理委员会特邀顾问、中国工商银行原行长杨凯生发表了《关于大数据的认识误区及其在互联网金融中的表现》的主题演讲。

温馨提醒:随时光飞逝,岁月变迁,文章观点,准确性、可靠性、难免有所变动,因此文章观点仅供参考!

猜你喜欢
Copyright © 2013-2014 首页网 ALL Rights Reserved