基于R的商业数据分析
01第0讲 数据分析基本概念
0.1 商业数据分析的本质(20分钟) 免费试学
0.2 商业数据分析中心建设(17分钟)
0.3 商业数据分析的阶段与行业运用(8分钟)
0.4 商业数据分析在银行中的运用(8分钟)
0.5 商业数据挖掘通用方法论(11分钟)
0.6 课程安排(8分钟)
02
第1讲 数据挖掘建模流程与R介绍-上
1.1.0引言与课程介绍(16分钟)
1.1.1 Capital One的故事(15分钟)
1.1.2 风险管理的理解(9分钟)
1.1.3 巴塞尔协议介绍(21分钟)
1.1.4 三大类风险(4分钟)
1.1.5 信用评分卡类型(7分钟)
1.1.6 信用风险IT系统(11分钟)
1.2.1 数据挖掘方法分类(8分钟)
1.2.2 分类模型示例(8分钟)
1.3.1 R的身世和特点1(9分钟)
03
第1讲 数据挖掘建模流程与R介绍-下
1.3.2 安装R和包(12分钟)
1.4数据分析流程演示(14分钟)
1.5 参考资料讲解(7分钟)
04
第2讲 R语言编程与数据整合-上
2.1.1 R的基本数据类型(16分钟)
2.1.2 R的数据结构(27分钟)
2.1.3 R程序控制(21分钟)
2.1.4-1 R的函数与包(13分钟)
2.1.4-2 R的函数与包(4分钟)
2.1.5 R的时间与日期类型(12分钟)
2.1.6 在R中读取数据(18分钟)
2.2.1 背景介绍(9分钟)
2.2.2 数据库基础知识(18分钟)
2.2.3 数据介绍(11分钟)
05
第2讲 R语言编程与数据整合-下
2.3.1 SQL语句介绍(28分钟)
2.3.2 纵向连接表(11分钟)
2.3.3 横向连接表(19分钟)
06
第3讲 描述性统计分析和特征选取
3.1 描述性统计与探索型数据分析-1(27分钟)
3.1 描述性统计与探索型数据分析-2(21分钟)
3.2 APPLY函数族(29分钟)
3.3 制图原理(22分钟)
3.4 R基础绘图包(16分钟)
3.5 GGPLOT2绘图(5分钟)
3.6 使用SQL进行汇总(17分钟)
3.7 使用描述性方法做贷款违约特征探索_1(14分钟)
3.7 使用描述性方法做贷款违约特征探索_2(16分钟)
3.7 使用描述性方法做贷款违约特征探索_3(23分钟)
07
第4讲 数据清洗与变量压缩-上
4.1 FRM提取行为变量(15分钟)
4.2 数据重组(14分钟)
4.3 抽样(31分钟)
4.4.0 信息压缩(概述)(9分钟)
4.4.1 分类变量重编码(概化)(12分钟)
4.4.2 基于目标变量的转换-WOE(12分钟)
4.5.1 主成分分析(30分钟)
4.5.2_1 变量聚类(20分钟)
4.5.2_2 变量聚类(9分钟)
4.6 脏数据或数据不正确(6分钟)
08
第4讲 数据清洗与变量压缩-下
4.7 数据重复(5分钟)
4.8 缺失值处理(13分钟)
4.9 噪声值处理(11分钟)
09
第5讲统计推断基础
5.1 参数估计(37分钟)
5.2 假设检验与单样本T检验(34分钟)
5.3 两样本T检验(22分钟)
5.4 方差分析(37分钟)
5.5 相关分析(24分钟)
5.6卡方检验(14分钟)
10
第6讲 使用线性回归进行客户价值预测-上
6.0 内容介绍(7分钟)
6.1 相关性分析(13分钟)
6.2.1简单线性回归_1(24分钟)
6.2.1简单线性回归_2(9分钟)
6.2.1简单线性回归_3(7分钟)
6.2.2 模型解释(13分钟)
6.2.3多元线性回归(12分钟)
6.2.4多元线性回归的变量筛选(14分钟)
6.3.0线性回归的诊断介绍(11分钟)
6.3.1残差分析(16分钟)
11
第6讲 使用线性回归进行客户价值预测-下
6.3.2强影响点分析(8分钟)
6.3.3多重共线性分析(19分钟)
6.4 数值预测评估原理(4分钟)
6.5.0 正则化方法介绍(5分钟)
6.5.1岭回归(16分钟)
6.5.2 LASSO算法(9分钟)
6.6 附录:估计方法(19分钟)
12
第7讲 使用逻辑回归构建初始信用评级
7.0 内容介绍(9分钟)
7.1 分类变量的相关关系(12分钟)
7.2 逻辑回归(25分钟)
7.3 模型评估_1决策类(14分钟)
7.3 模型评估_2排序类介绍(8分钟)
7.3 模型评估_3ROC(17分钟)
7.3 模型评估_4其它排序类(15分钟)
7.3 模型评估_5R的实现(14分钟)
7.4 因果关系建模与取数逻辑(17分钟)
7.5 附录:逻辑回归估计方法(11分钟)
13
第8讲 使用决策树进行流失预警模型
8.1 决策树建模思路(23分钟)
8.2 决策树建模基本原理(8分钟)
8.3 Quinlan系列决策树建模原理_1(28分钟)
8.3 Quinlan系列决策树建模原理_2(21分钟)
8.4 CART决策树建模原理_1(17分钟)
8.4 CART决策树建模原理_2(8分钟)
8.5 模型修剪——以CART为例(11分钟)
8.7 组合算法与随机森林(9分钟)
8.8 汽车贷款违约的模式表述(11分钟)
14
第9讲 使用神经网络进行营销响应预测
9.0前言(5分钟)
9.1基本概念(12分钟)
9.2人工神经网络结构(10分钟)
9.3 感知器与BP网络_1(18分钟)
9.3 感知器与BP网络_2(27分钟)
9.3 感知器与BP网络_3(9分钟)
9.3 感知器与BP网络_4(15分钟)
9.4 径向基神经网络_1(29分钟)
9.4 径向基神经网络_2(19分钟)
9.4 径向基神经网络_3(18分钟)
15
第10讲 分类器入门与支持向量机
10.1.0分类器的概念(11分钟)
10.1.1 KNN算法_1(15分钟)
10.1.1 KNN算法_2(14分钟)
10.1.2 朴素贝叶斯_1(20分钟)
10.2.1 支持向量机概述(9分钟)
10.2.2 支持向量机详述_1(27分钟)
10.2.2 支持向量机详述_2(9分钟)
10.2.2 支持向量机详述_3(8分钟)
16
第11讲 客户聚类与聚类后画像
11.1 基本概念(10分钟)
11.2 层次聚类_1(23分钟)
11.2 层次聚类_2(15分钟)
11.3.1 K-means聚类_1(11分钟)
11.3.1 K-means聚类_2(22分钟)
11.3.1 K-means聚类_3(15分钟)
11.3.2使用决策树做聚类后客户画像(7分钟)
17
第12讲 使用推荐算法提升客户价值
12.1 广告推荐介绍(27分钟)
12.2 购物篮分析与运用_1(23分钟)
12.2 购物篮分析与运用_2(12分钟)
12.3 相关性在推荐中的运用(10分钟)
12.4.1 协同过滤介绍(10分钟)
12.4.2 基于物品的协同过滤(6分钟)
12.5 基于内容的推荐(4分钟)
12.6附:矩阵奇异值分解在协同过滤中的运用(12分钟)
18
第13讲使用时间序列(ARIMA)分析做销售量预测
13.1认识时间序列(7分钟)
13.2简单时间序列分析法:平滑算法(37分钟)
13.3平稳时间序列(ARMA)模型设定与识别_1(22分钟)
13.3平稳时间序列(ARMA)模型设定与识别_2(16分钟)
13.3平稳时间序列(ARMA)模型设定与识别_3(21分钟)
13.4非平稳时间序列(ARIMA)模型_1(4分钟)
13.4非平稳时间序列(ARIMA)模型_2(6分钟)
13.5 实际数据时间序列建模步骤_1(10分钟)
13.5 实际数据时间序列建模步骤_2(6分钟)
13.5 实际数据时间序列建模步骤_3(3分钟)
19
第14讲 汽车金融贷款信用评级模型案例
案例1.1 业务理解(8分钟)
案例1.2 数据理解(21分钟)
案例1.3.1拒绝推断(39分钟)
案例1.3.2 变量粗筛(5分钟)
案例1.3.3 变量细筛与数据清洗_1(6分钟)
案例1.3.3 变量细筛与数据清洗_2(6分钟)
案例1.3.3 变量细筛与数据清洗_3(4分钟)
案例1.3.4 连续变量分箱WOE转换(14分钟)
案例1.4 建模_案例1.5 模型评估(4分钟)
案例1.6 模型监测(16分钟)
页:
[1]