学好大数据,这个感觉东西多,看怎么去学吧
首先 必备技能看看
一、Hadoop
Hadoop生态系统安装部署(单机、伪分布式、完全分布式)HDFS及读写原理MapReduce V1、V2框架WordCount编码详解原理 Mapper、Reducer、Combiner、InputFormat、Writable、ComparableHDFS HA原理、部署数据去重、单表关联、多表关联、PageRank、二次排序、倒排索引、TF-IDF二、Hive
Hive安装与配置Hive 内建操作符与函数开发Hive JDBChive参数Hive 高级编程Hive QLHive Shell 基本操作hive 优化Hive体系结构Hive的原理三、PIG
pig的概念及优点关系(relation)、包(bag)、元组(tuple)、字段(field)、数据(data)的关系FLATTEN操作符的作用GROUP操作符数据操作相关多维度组合操作技巧pig脚本四、 Zookeeper
ZooKeeper安装配置Zookeeper命令操作构建ZooKeeper应用管理分布式环境中的数据ZooKeeper机制架构一致性原理ZooKeeper伸缩性五、 HBase
Hbase基础概念hbase数据模型Hbase物理模型Hbase架构Hbase应用六、 Mahout
七、 Sqoop
1、配置Sqoop
2、使用Sqoop把数据从MySQL导入到HDFS中
3、使用Sqoop把数据从HDFS导出到MySQL中八、 Cassandra
Cassandra 的数据存储结构Cassandra 节点的安装和配置常用编程语言使用 Cassandra 来存储数据搭建 Cassandra 集群环境、也是有蛮多的,就上面那张图可以看看,比较清楚。