初识大数据
1Byte = 8 bit、1K=1024KByte、1MB = 1024K、1G = 1024MB、1T = 1024G、1PB = 1024TB
大数据(BIG DATA),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
学习的路线
JAVA =====> 面向对象编程语言
Linux =====> 类Unix操作系统
Hadoop生态
HDFS =====> 解决存储问题
MapReduce =====> 解决计算问题
Yarn =====> 资源协调者
Zookeeper =====> 分布式应用程序协调服务
Flume =====> 日志收集系统
Hive =====> 基于Hadoop的数仓工具
HBase =====> 分布式、面向列的开源数据库
Sqoop =====> 数据传递工具
Scala =====> 多范式编程语言、面向对象和函数式编程的特性
Spark =====> 目
润和丰技术团队
spark
storm
数据仓库