大数据,是数据的集合。
“大量化(Volume)、多样化(Variety)、快速化(Velocity)、价值密度低(Value)”就是“大数据”的显著特征,或者说,只有具备这些特点的数据,才是大数据。
大量化,IDC预计到2020年,全球将总共拥有35ZB的数据量。
多样化,不再是单一的文本形式,订单、日志、音频,多种多样。
快速化,在海量的数据面前,处理数据的效率有着本质的区别。
价值密度低,需要通过强大的算法迅速完成数据的价值提纯。