BD231:大数据挖掘与分析

线下课堂时间:4 天实战演练面授
  • 【广州】    2017/10/21、22、28、29周末班
  • 【深圳】    2017/9/26、27、28、29脱产班
预约试听
课程介绍
适用对象:对大数分布式存分析等感兴趣的朋友; JavPHC等任意一门编程语言的开发者; 大型网电商网站等运维人员; 云计大数据从业者; 熟悉Hadoop生态体系,想了解和学习Hadoop与Spark整合在企业应用实战案例的朋友; 系统架构系统分析高级程序资深开发人员; 牵涉到大数据处理的数据中心运规设计负责人; 政府机关,金融保移动互联网等大数据单位的负责人; 高科研院所大数据研究人员,涉及到大数据与分布式数据处理的人员; 数据仓库管理人建模人员,分析和开发人系统管理人数据库管理人员以及对数据仓库感兴趣的其他人员。
学习收获:(1)全面介绍了数据挖掘的标准流程,数据预处理,数据挖掘方法,数据挖掘模型,模型评估,模型参数优化,等等,使得学员掌握数据挖掘的方模工具。 (2)通过本课程的学习,达到如下目的: (3)了解数据分析与数据挖掘的基本知识,理解大数据思维方式。 (4)掌握数据挖掘的基本过程和步骤,掌握数据挖掘的思路和框架。 (5)能够理解分析模型原理,掌握模型应用场景,能够利用模型解决复杂的商业问题。 (6)掌握常用的数据模型,能够根据商业问题选择合适的分析模型。 (7)熟悉SPSS基本操作,掌握分析操作,能够解读分析结果,并转化为业务。
详细大纲
1 大数据基础案例分享与基本平台介绍
1.1 大数据时代已经来临
1.2 大数据的三维理解
1.2.1 理论+技术+实践
1.3 大数据的4V特征
1.3.1 大规模(Volume)
1.3.2 多样性(Variety)
1.3.3 高速度(Velocity)
1.3.4 价值性(Value)
1.4 大数据战略——定位决定你的地位
1.4.1 数据即资产
1.4.2 “数据化运营”转变为“运营数据”
1.4.3 “搜索引擎”转变为“推荐引擎”
1.5 大数据思维——思路决定你的出路
1.5.1 定量思维,一切皆可量化
1.5.2 相关思维,一切皆有联系
1.5.3 实验思维,一切皆可尝试
1.5.4 全样本思维,大数据的简单计算胜过小数据的复杂计算
1.5.5 个性化思维,以消费者为中心
1.5.6 融合思维,全平台大数据帮助你的数据需要整合
1.6 大数据的核心价值——发现规律和预测
1.7 大数据在各行业的解决方案
1.7.1 金融业
1.7.2 旅游业
1.7.3 零售业
1.7.4 电信业
1.8 大数据系统架构及技术简介
1.8.1 云计算与大数据
1.8.2 大数据技术简介
1.9 中国联通大数据应用案例及商业模式
1.9.1 风控
1.9.2 数据魔方
1.9.3 智慧旅游等
1.10 中国电信大数据应用案例及商业模式
1.10.1 智慧旅游
1.10.2 星图-风险控制
1.10.3 星图-精准营销
1.10.4 鲲鹏-咨询报告
1.10.5 鲲鹏-区域洞察
1.11 数据集基础知识:
1.11.1 数据集概述
1.11.2 数据集的类型
1.11.3 数据集属性的类型
1.11.4 数据质量三要素
1.11.5 数据预处理的内容
1.11.6 数据探索性分析
2 数据挖掘流程(基础,决定你的高度)
2.1 数据挖掘概述
2.2 数据挖掘的标准流程(CRISP-DM)
2.2.1 商业理解
2.2.2 数据准备
2.2.3 数据理解
2.2.4 模型建立
2.2.5 模型评估
2.2.6 模型应用
2.3 常用数据统计指标
2.3.1 集中程度:均中位众数
2.3.2 离开程度:方标准极差
2.3.3 分布趋势:偏峰度
2.3.4 理解分布:正态分T分F分布
2.4 SPSS基本操作(预处理)
2.4.1 数据导入
2.4.2 数据排序(排序个案)
2.4.3 重复数据处理(标识重复个案)
2.4.4 缺失值处理(替换缺失值)
2.4.5 生成新变量(计算变重新编码)
2.4.6 数据分组(分类汇总)
2.4.7 数据合并(合并文件)
2.4.8 演练:SPSS基本操作
3 数据挖掘实战
3.1 参数检验分析(样本均值检验)
3.1.1 商业问题:如何验证营销效果的有效性?
3.1.2 参数检验概述
3.1.3 参数检验原理以及步骤
3.1.4 参数检验适用场景
3.2 非参数检验分析(样本分布检验)
3.2.1 商业问题:这些属性数据的分布情况如何?如何从数据分布中看出问题?
3.2.2 非参数检验概述
3.2.3 非参数检验原理
3.2.4 卡方检二项分游程检验的原理及适用场景
3.3 相关分析(相关程度计算)
3.3.1 商业问题:这两个属性是否会相互影响?影响程度大吗?
3.3.2 相关分析概述
3.4 方差分析(影响因素分析)
3.4.1 商业问题:哪些才是影响销量的关键因素?
3.4.2 方差分析原理
3.4.3 方差分析的步骤
3.4.4 方差分析适用场景
3.4.5 如何解读方差分析结果
3.5 回归分析(预测分析)
3.5.1 商业问题:如何预测未来的销售量(定量分析)?
3.5.2 回归分析概述
3.5.3 回归分析适用场景
3.5.4 回归分析拟合度检验
3.5.5 解读回归分析结果
3.5.6 带分类变量的回归分析
3.5.7 如何预测随着季节性变化的销量情况
3.6 逻辑回归分析(预测分析)
3.6.1 商业问题:如果评估用户购买某产品的概率?
3.6.2 逻辑回归分析原理
3.6.3 逻辑回归分析的适用场景
3.7 时间序列分析(预测分析)
3.7.1 商业问题:随着时间变化,未来的销量变化趋势如何?
3.7.2 时序分析概述
3.7.3 时序分析适用场景
4 高级数据挖掘方法
4.1 聚类分析(Clustering)
4.1.1 商业问题:我们的客户有几类?各类特征是什么?
4.1.2 聚类方法原理介绍
4.1.3 聚类方法适用场景
4.1.4 系统聚类(层次聚类)算法原理
4.1.5 如何判定最佳聚类类别数量
4.1.6 K均值聚类(快速聚类)算法原理
4.2 决策树分类分析(Classification)
4.2.1 商业问题:这类客户有什么特征?有什么潜在销售机会?
4.2.2 决策树原理介绍
4.2.3 构建决策树的三个关键问题
4.2.4 选择最优属性
4.2.5 如何分裂变量
4.2.6 修剪决策树
4.2.7 如何评估分类性能
4.3 基于规则的分类
4.3.1 基于规则分类原理介绍
4.3.2 评估规则的质量
4.3.3 构建分类规则:顺序覆盖法
4.3.4 规则增长策略
4.4 最近邻分类
4.5 朴素贝叶斯分类
4.5.1 贝叶斯分类原理
4.5.2 计算类别属性的条件概率
4.5.3 估计连续属性的条件概率
4.5.4 预测分类概率(计算概率)
4.6 人工神经网络(ANN)
4.6.1 神经网络基本原理
4.6.2 神经网络的结构
4.6.3 ANN关键问题
4.6.4 MLP与RBF
4.7 判别分析
4.7.1 判别分析原理
4.7.2 距离判别法
4.7.3 典型判别法
4.7.4 贝叶斯判别法
4.8 关联分析(Association)
4.8.1 商业问题:购买A产品的顾客还常常要购买其他什么产品?
4.8.2 关联规则原理介绍
4.8.3 关联规则的两个关键参数
4.8.4 Apriori算法介绍
4.8.5 FP-Growth算法介绍
4.8.6 关联规则适用场景
4.9 客户价值评估RFM模型
4.9.1 商业问题:如何评估客户的价值?不同价值客户的营销策略有什么区别?
4.9.2 RFM模型介绍
4.9.3 RFM模型用户分类与业务策略
4.9.4 RFM与客户活跃度分析
4.10 主成分分析
4.10.1 主成分分析方法介绍
4.10.2 主成分分析基本思想
4.10.3 主成分分析步骤
课程评价

课程评价({{EvaluationTotal}})

课程满意度

评价

您还没有给课程评分哦

满意度

    追加评价:

课程咨询
内容:

您还没有填写内容!

暂无问答,赶紧去提问吧
{{item.AnswerState==1?"已解决":"未解决"}}
{{item.Content}}
{{item.StudentAskTime}}
{{itemanswer.UserName}}
{{itemanswer.Content}}
{{itemanswer.StudentAskTime}}
同类课程推荐 more
免费大讲堂 more
原创文章 more

您好! 欢迎来到学领未来 !

学领未来提供线上及线下的学习服务,根据您的位置,为您推荐最近的线下培训地点 分站,你选择: