GA小站 分享GA和GTM使用教程和技巧
Google Analytics教程 Google Tag Manager教程 机器学习 Python爬虫与算法 其他 推荐资源 关于作者

机器学习—机器学习概论

       最近在复习机器学习方面的算法,对此做些总结回顾。

        什么是机器学习?
利用算法,是机器具有人一样的学习能力,能够自动分析判别

        机器学习与数据挖掘,人工智能,深度学习的区别?
机器学习是利用算法,让机器具备人一样的学习能力,能够自动分析判别
数据挖掘是只从一大堆数据中寻找模式和特征,需找出有价值的信息
人工智能是指通过人通过电脑实现的智能,机器学习是人工智能的一个分支,人工智能往往会涉及神经网络
深度学习是由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。是机器学习的分支
三者常常在算法上是通用的,结构上:人工智能-机器学习-深度学习,随着时代发展,换个名字

机器学习——因子分析

undefined

undefined
1、加载数据并做主成分分析:

data9.3<- c(1.000, 0.846, 0.805, 0.859, 0.473, 0.398, 0.301, 0.382,
      0.846, 1.000, 0.881, 0.826, 0.376, 0.326, 0.277, 0.277, 
      0.805, 0.881, 1.000, 0.801, 0.380, 0.319, 0.237, 0.345, 
      0.859, 0.826, 0.801, 1.000, 0.436, 0.329, 0.327, 0.365, 
      0.473, 0.376, 0.380, 0.436, 1.000, 0.762, 0.730, 0.629, 
      0.398, 0.326, 0.319, 0.329, 0.762, 1.000, 0.583, 0.577, 
      0.301, 0.277, 0.237, 0.327, 0.730, 0.583, 1.000, 0.539, 
      0.382, 0.415, 0.345, 0.365, 0.629, 0.577, 0.539, 1.000)
names<-c("身高 x1", "手臂长 x2", "上肢长 x3", "下肢长 x4", "体重 x5", 
         "颈围 x6", "胸围 x7", "胸宽 x8")
data<-matrix(data9.3, nrow=8, dimnames=list(names, names))
data.pr<-princomp(data,cor=TRUE)#
summary(data.pr,loadings=TRUE)

机器学习——主成分分析

undefined
1、加载数据做成分分析:

data9.2<-data.frame(
  x1=c(82.9,88.0,99.9,105.3,117.7,131.0,148.2,161.8,174.2,184.7),
  x2=c(92,93,96,94,100,101,105,112,112,112),
  x3=c(17.1,21.3,25.1,29.0,34.0,40.0,44.0,49.0,51.0,53.0),
  x4=c(94,96,97,97,100,101,104,109,111,111),
  y=c(8.4,9.6,10.4,11.4,12.2,14.2,15.8,17.9,19.6,20.8)
)

data9.2.pr=princomp(~x1+x2+x3+x4,data=data9.2,cor=TRUE) #做主成分分析
summary(data9.2.pr,loadings=TRUE)

机器学习——岭回归

undefined         分别使用岭回归和Lasso解决上面回归问题
         当回归存在多重共线性的时候,可以使用最小二乘,岭回归,Lasso回归, 但当X的秩不存在的时候或变量的数量少于样本的数量是,作为无偏差估计的最小二乘就不适用,岭回归和Lasso回归更合适。

 

机器学习——线性回归

      回归建模的主要流程:
1、描述性统计:对数据有个概览
2、异常缺失值处理
3、多重共线性检验:kappa(cor(),exact=TRUE)
4、相关性分析:筛选自变量
5、参数计算方法:最小二乘法,岭回归
6、检验:
拟合度检验:R^2
模型显著性检验:F检验的P-value
参数检验:T检验的P-value
残差正太性检验:shapiro.test
残差检验
7、预测:

 

新文章 → Home ← 旧文章