软件特点:
1、速度快
基于内存进行计算(当然也有部分计算基于磁盘,比如shuffle)。
2、集成Hadoop
并不是要成为一个大数据领域的“独裁者”,一个人霸占大数据领域所有的“地盘”,而是与Hadoop进行了高度的集成,两者可以完美的配合使用。Hadoop的HDFS、spark大数据平台官网,Hive、HBase负责存储,YARN负责资源调度;复杂大数据计算。实际上,Hadoop+的组合,是一种“double win”的组合。
3、极高的活跃度
目前是Apache基金会的顶级项目,全世界有大量的优秀工程师是的committer。并且世界上很多顶级的IT公司都在大规模地使用。spark软件官方网站、电脑软件、行业软件、其他行业、
4、容易上手开发
的基于RDD的计算模型,比Hadoop的基于Map-Reduce的计算模型要更加易于理解,更加易于上手开发,实现各种复杂功能,比如二次排序、topn等复杂操作时,更加便捷。
温馨提醒:文章观点来源于网络,随岁月变迁,准确性、可靠性、难免有所变动,因此文中资讯仅供参考!删除,修改信息,联糸方式,详见网页底部。