第1节:安装部署大数据软件环境和初识大数据

it2025-05-29  11

初识大数据

1Byte = 8 bit、1K=1024KByte、1MB = 1024K、1G = 1024MB、1T = 1024G、1PB = 1024TB

大数据(BIG DATA),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

学习的路线
JAVA =====> 面向对象编程语言 Linux =====> 类Unix操作系统 Hadoop生态 HDFS =====> 解决存储问题 MapReduce =====> 解决计算问题 Yarn =====> 资源协调者 Zookeeper =====> 分布式应用程序协调服务 Flume =====> 日志收集系统 Hive =====> 基于Hadoop的数仓工具 HBase =====> 分布式、面向列的开源数据库 Sqoop =====> 数据传递工具 Scala =====> 多范式编程语言、面向对象和函数式编程的特性 Spark =====> 目 润和丰技术团队 spark storm 数据仓库
最新回复(0)