R语言数据分析(2)——数据读入与写入

R语言数据分析(2)——数据读入与写入
这一节介绍数据的读入和写入,要在R中做数据分析,首先需要将相关的数据读入,读入的方法多种多样,即使同一个文件,加载不同的包都有不同的读入方法,这里介绍一些比较常见的。直接编辑可以通过直接输入的方式输入数据,编辑的对象是数据框,如:data1<-data.frame(1,2,2)fix(data1)这里的fix函数是打开表格,你就可以直接……继续阅读 »

Haran 7年前 (2017-12-01) 8040浏览 0评论6个赞

R语言数据分析(1)——R语言数据结构

R语言数据分析(1)——R语言数据结构
最近在复习R,买了两本书,参加一个在线课程,打算系统的过一遍,这一节关注R的数据结构,R中的数据结构主要有向量,矩阵,数组,数据框和列表。向量向量是R中最简单的数据结构了,有数值型,字符型,逻辑型和负数型。可以进行四则运算,函数运算,逻辑运算和切片操作,其中切片操作是最重要的,也是其他几种数据结构进行数据处理时常用的。矩阵矩阵是R中最常用到的数据结构……继续阅读 »

Haran 7年前 (2017-11-16) 4160浏览 0评论0个赞

机器学习——岭回归

机器学习——岭回归
         分别使用岭回归和Lasso解决上面回归问题当回归存在多重共线性的时候,可以使用最小二乘,岭回归,Lasso回归, 但当X的秩不存在的时候或变量的数量少于样本的数量是,作为无偏差估计的最小二乘就不适用,岭回归和Lasso回归更合适。过程:1、加载数据做中心化后做线性回归:     可以看到线性回归方程很不显著,存在多重共线性,下面做多……继续阅读 »

Haran 8年前 (2016-09-17) 4964浏览 0评论1个赞

机器学习——线性回归

机器学习——线性回归
回归建模的主要流程:1、描述性统计:对数据有个概览2、异常缺失值处理3、多重共线性检验:kappa(cor(),exact=TRUE)4、相关性分析:筛选自变量5、参数计算方法:最小二乘法,岭回归6、检验:拟合度检验:R^2模型显著性检验:F检验的P-value参数检验:T检验的P-value残差正太性检验:shapiro.test残差……继续阅读 »

Haran 9年前 (2016-08-09) 6389浏览 0评论0个赞