标签:R语言

R语言

R语言数据分析(1)——R语言数据结构

R语言数据分析(1)——R语言数据结构
最近在复习R,买了两本书,参加一个在线课程,打算系统的过一遍,这一节关注R的数据结构,R中的数据结构主要有向量,矩阵,数组,数据框和列表。向量向量是R中最简单的数据结构了,有数值型,字符型,逻辑型和负数型。可以进行四则运算,函数运算,逻辑运算和切片操作,其中切片操作是最重要的,也是其他几种数据结构进行数据处理时常用的。矩阵矩阵是R中最常用到的数据结构……继续阅读 »

Haran 7年前 (2017-11-16) 4090浏览 0评论0个赞

R语言

机器学习——岭回归

机器学习——岭回归
         分别使用岭回归和Lasso解决上面回归问题当回归存在多重共线性的时候,可以使用最小二乘,岭回归,Lasso回归, 但当X的秩不存在的时候或变量的数量少于样本的数量是,作为无偏差估计的最小二乘就不适用,岭回归和Lasso回归更合适。过程:1、加载数据做中心化后做线性回归:     可以看到线性回归方程很不显著,存在多重共线性,下面做多……继续阅读 »

Haran 8年前 (2016-09-17) 4910浏览 0评论1个赞

R语言

机器学习——线性回归

机器学习——线性回归
回归建模的主要流程:1、描述性统计:对数据有个概览2、异常缺失值处理3、多重共线性检验:kappa(cor(),exact=TRUE)4、相关性分析:筛选自变量5、参数计算方法:最小二乘法,岭回归6、检验:拟合度检验:R^2模型显著性检验:F检验的P-value参数检验:T检验的P-value残差正太性检验:shapiro.test残差……继续阅读 »

Haran 8年前 (2016-08-09) 6293浏览 0评论0个赞