BD221:大数据技术Hadoop培训

线下课堂时间:4 天实战演练面授
  • 【广州】    2017/10/21、22、28、29周末班
  • 【深圳】    2017/10/7、8、21、22周末班
预约试听
课程介绍
适用对象:对大数据、分布式存储、分析等感兴趣的朋友; Java、PHP、C等任意一门编程语言的开发者; 大型网站、电商网站等运维人员; 云计算、大数据从业者; 熟悉Hadoop生态体系,想了解和学习Hadoop与Spark整合在企业应用实战案例的朋友; 系统架构师、系统分析师、高级程序员、资深开发人员; 牵涉到大数据处理的数据中心运行、规划、设计负责人; 政府机关,金融保险、移动互联网等大数据单位的负责人; 高校、科研院所大数据研究人员,涉及到大数据与分布式数据处理的人员。
学习收获:短短几年间,Cloudera Hadoop从一种边缘技术成为事实上的标准。看来,不仅现在Hadoop是企业大数据的标准,而且在未来,它的地位似乎一时难以动摇。本课程学习基于 Hadoop 的解决方案帮助企业应对多个大数据挑战,包括: 1. 业界有哪些真是落地的Cloudera Hadoop应用 2. Cloudera Hadoop在企业内部到底适用于那些应用场景 3. 如何建设 Cloudera hadoop 集群环境 4. 如何设计 Cloudera hadoop 应用方案 5. 如何使Cloudera Hadoop与传统技术结合,如Greenplum。
详细大纲
1 大数据基础案例分享与基本平台介绍
1.1 互联网大数据
1.1.1 Hadoop在互联网公司的应用案例解析
1.1.2 互联网企业遇到大数据的问题
1.1.3 案例分享:12306 大数据实践
1.1.4 案例分享:微信红包大数据分析
1.2 大数据企业级平台选型方案
1.2.1 开源方案:Hadoop,Spark
1.2.2 企业级方案:Oracle Exdata,IBM Biginsight
1.2.3 国内厂商:华为,浪潮,曙光相关的方案介绍
1.3 中国联通大数据应用案例及商业模式
1.3.1 风控
1.3.2 数据魔方
1.3.3 智慧旅游等
1.4 HDFS原理及高级程序实战演练
1.4.1 HDFS架构及原理HDFS
1.4.2 NameNode、DataNode解析
1.4.3 HDFS 副本机制块机制解析
1.4.4 HDFS 操作方式:DFS,DFSADMIN
1.4.5 HDFS 日志管理
1.4.6 HDFS 服务管理
1.4.7 HDFS HA方案及环境搭建
1.4.8 HDFS Snapshot机制分析及使用
1.4.9 HDFS Cache机制分析及使用
1.5 上机演练
2 Cloudera大数据核心技术-Yarn与MapReduce
2.1 Hadoop Yarn
2.2 Yarn 与MapReduce的不同
2.3 Yarn 原理与架构
2.4 Apache YARN基本框架
2.5 Apache YARN工作流程
2.6 Apache YARN设计细节
2.7 Yarn 核心技术模块原理解析
2.7.1 Yarn ResouceManager原理解析
2.7.2 Yarn NodeManager 原理解析
2.7.3 Yarn ApplicationMaster
2.8 Hadoop MapReduce
2.8.1 使用 Hadoop MapReduce Streaming 编程
2.8.2 MapReduce流程
2.8.3 剖析一个MapReduce程序
2.8.4 基本MapReduceAPI 概念
2.8.5 MapReduce的优化
2.8.6 MapReduce的任务调度
2.8.7 MapReduce编程实战
2.8.8 满足解决实际数据分析问题的高级Hadoop API
2.9 上机演练
3 Cloudera 大数据核心技术NoSQL-HBase
3.1 HBase概念与架构
3.2 HBase 在电信行业的应用
3.3 HBase核心知识点
3.3.1 HBase列族与列
3.3.2 HBase时间戳
3.3.3 HBase物理模型
3.3.4 数据存储结构:LSM
3.3.5 HBase Log
3.3.6 HBase Filter
3.4 HBase 集群安装
3.5 HBase RESTFul 接口
3.6 HBase配置优化综述
3.7 表设计优化相关参数
3.8 监控工具使用方法及注意事项
3.9 常见异常现象级处理方法
3.10 HBase Coprocessor
3.11 上机演练
4 Cloudera大数据核心技术数据仓库- Hive+Impala
4.1 Hive 与 Impala 在电信行业的应用
4.2 Hive基础
4.3 Hive的作用和原理说明
4.4 Hive 数据模型
4.5 Hive SQL语句
4.6 Hadoop仓库和传统数据仓库的协作关系
4.7 Hive与传统数据库的对接使用
4.8 Hadoop/Hive仓库数据数据流
4.9 Hive UDF
4.10 自行编写数据库与Hadoop相互ETL工具的思路
4.11 Impala 基础
4.12 Impala 原理及技术
4.13 Impala 与Hive的关系
4.14 数据导入Flume 讲解
4.15 数据库导入组件Sqoop技术讲解
4.16 上机演练
4.17 Hadoop安全方案:
4.17.1 Hadoop的安全性的重要
4.17.2 Hadoop的安全系统的概念
4.17.3 Kerberos是什么,它如何工作
4.17.4 用Kerberos来守卫Hadoop集群
4.18 管理和计划工作任务
4.18.1 管理正在运行的工作
4.18.2 计划Hadoop工作
4.18.3 配置FairScheduler
4.18.4 Impala的查询计划
4.19 集群的维护
4.19.1 检查HDFS状态
4.19.2 在不同集群间拷贝数据
4.19.3 添加和挪去集群的节点
4.19.4 重新平衡集群
4.19.5 集群升级
4.20 集群的监控和故障诊断
4.20.1 通用系统监控
4.20.2 监控 Hadoop 集群
4.20.3 常见的 Hadoop Clusters 的故障排除
4.20.4 常见的错误配置
4.21 上机演练
课程评价

课程评价({{EvaluationTotal}})

课程满意度

评价

您还没有给课程评分哦

满意度

    追加评价:

课程咨询
内容:

您还没有填写内容!

暂无问答,赶紧去提问吧
{{item.AnswerState==1?"已解决":"未解决"}}
{{item.Content}}
{{item.StudentAskTime}}
{{itemanswer.UserName}}
{{itemanswer.Content}}
{{itemanswer.StudentAskTime}}
同类课程推荐 more
免费大讲堂 more
原创文章 more

您好! 欢迎来到学领未来 !

学领未来提供线上及线下的学习服务,根据您的位置,为您推荐最近的线下培训地点 分站,你选择: