你不仅不需要一名优秀操盘手的数据资料,并且如果你没有那更好。因为当我们面对所有可用的大数据时,我们很容易陷入一些我们都可能陷入的误区。如果我们能铭记以上所有要素,当我们分析数据时,我们将会比P2P借贷领域里的其他投资者更胜一筹,同时能更清楚地意识到我们贷款组合中存在的风险。
总结
大数据与P2P借贷:不要被误导信用分也是一个很好的例子。我们会很自然地认为公开呈报会减少借款人的信用分,也确实如此。然而,影响的大小取决于何时何事。5年前的个人评估不能作为对借款人6个月前情况的判断依据。 6个月内的公开呈报对借款人信用分的影响比较明显,其他方面的对借款人信用分和我们对其支付能力的看法影响较小。
科学家和研究员对这个短语比较精通。意思是,如果2件事物是有关联的,这并不意味着他们之间一件事情发生就会导致另一件事情也同时发生。这里讨论的一个很好地例子是,我关于以州来筛选贷款的帖子。我们之前讨论了加拿大地区违约率最高,同时它还拥有迄今为止最高的贷款成交量。如果你仅凭违约率最高,就将它从你的投资策略中筛除,那么就意味着加拿大地区所有好的贷款都被你拒绝了。这就好比倒洗澡水把婴儿也倒掉了。
要素4:相互关系并非因果关系
比如说,信用分依赖于我们之前讨论过的许多因素,包括偿还记录,负面评价,公开呈报,资信调查,有效的信贷循环以及债务与收入比。当我们筛选信用分时,我们已经综合考虑了这些因素,如果进一步考虑孤立的变量,实际上是多余的,甚至有害于筛选条件的质量。因此,如果我们选择的条件包括信用分较高且没有负面评价两项,尽管我们已经知道没有负面评价会提升信用分,但我们依然重复计算这些因素而不是考虑其他信贷因素,这其实是多余的。
大数据处理的问题是这些变量都是分开的,如果把这些变量放在一起,我们能获得很多有意的信息,一旦分开,这些变量就贬值了。
P2P,大数据与P2P借贷:不要被误导存在的问题
数据的应用性很大,以至于你可以搜索星期四一天,加拿大地区,借款人的信用分有750,用于债务合并的贷款。大数据的一个所谓的好处是你可以利用它研究任何有意义或可能有意义的变量。这些变量中,我们在这里讨论的包括FICO信用分,负面评价,公开呈报,所在的州,拥有的住房,工作的时间等等。这些信息是好还是坏呢?好处显而易见,我们可以研究那些我们觉得重要并且能够降低我们风险的因素。
要素3: 大数据各个孤立的因素是相互支撑的
我们的贷款投资组合最大的敌人是早期支付违约(在支付期前6个月内出现的违约)。我们现在有价值20亿美元的贷款在至少6个月后才能看出谁支付晚了,谁早期支付违约了。另外,由于被发布的贷款时间限制,很难从中获取所谓的有意义的数据。
拿Lending Club来说, 从2006年一开始到2012年11月,他们发布的贷款总量第一次达到10亿美元。仅6个月后,在2013年5月,他们的贷款总量上升到了20亿美元。而在2013年11月,在他们首次达到10亿美元贷款总量的一年以后,他们发布的贷款总量又攀升至30亿美元。(相关文章) 这意味着,在不到一年的时间里,他们完成了现在贷款总量的2/3。有些人会说,从这些历史记录中,我们并不能获取有意义的信息,但更多人会认为我们获取到的最有意义的信息是早期支付违约的可能性。贷款资金池的长期数据中我们真正能用得着的很少。
大数据与P2P借贷:不要被误导要素2:贷款资金池可利用数据少且有时间局限
任何一个曾经通过中间商出售过(或尝试出售)共有基金,股票,债券或其他投资的人都听到或看到过这样一个主题“过去的表现不能代表将来的结果”,确实如此。我们从历史记录中获得的借款人的重要信息,比如支付记录,FICO信用分和负面信息 ,只能代表他们过去的表现如何。如果他们曾经按时偿还了贷款,并不意味着他们也会按时将钱还给我们。但是这增加了偿还的可能性,特别是如果没有重大变故(如失业或生了重病等)的情况下。没有人知道未来会发生什么,这些信息并不具有预见性,它们只能反映过去。
要素1:大数据只能代表过去的表现
投身于P2P贷款领域的很多人,也包括我,都喜欢使用借贷平台提供的大数据去分析行业趋势,并帮助我们了解谁是我们的借款人,他们对P2P借贷市场风险控制的表现如何。因为很多早期投资人基于借贷平台的线上性质而面向技术导向,所以可能存在这样的误解——想要成为一个成功的投资人,必须要理解并应用这些大数据。如果你想要学习信贷知识和金融技术,以便在P2P借贷领域做出更好的投资决策,这么做就大错特错了。大数据并非无所不能,你需要了解下面四个关于P2P借贷中大数据的重要因素。
温馨提醒:随时光飞逝,岁月变迁,文章观点,准确性、可靠性、难免有所变动,因此文章观点仅供参考!