最近在复习R,买了两本书,参加一个在线课程,打算系统的过一遍,这一节关注R的数据结构,R中的数据结构主要有向量,矩阵,数组,数据框和列表。向量向量是R中最简单的数据结构了,有数值型,字符型,逻辑型和负数型。可以进行四则运算,函数运算,逻辑运算和切片操作,其中切片操作是最重要的,也是其他几种数据结构进行数据处理时常用的。矩阵矩阵是R中最常用到的数据结构……继续阅读 » Haran 7年前 (2017-11-16) 4090浏览 0评论0个赞
1 自行寻找在R中实现bagging和adaboost的包,然后分别用来对iris数据集进行分类观察效果install.packages("ipred")install.packages("adabag")library(ipred)model.bagging=bagging(Species~.,data=iris,)pre.baggi……继续阅读 » Haran 8年前 (2016-10-08) 4837浏览 0评论0个赞
1、加载数据并做主成分分析:data9.3<- c(1.000, 0.846, 0.805, 0.859, 0.473, 0.398, 0.301, 0.382, 0.846, 1.000, 0.881, 0.826, 0.376, 0.326, 0.277, 0.277, 0.805, 0.881, 1.000, ……继续阅读 » Haran 8年前 (2016-10-03) 4999浏览 0评论0个赞
1、加载数据做成分分析:data9.2<-data.frame( x1=c(82.9,88.0,99.9,105.3,117.7,131.0,148.2,161.8,174.2,184.7), x2=c(92,93,96,94,100,101,105,112,112,112), x3=c(17.1,21.3,25.1,29.0,3……继续阅读 » Haran 8年前 (2016-09-27) 4241浏览 0评论0个赞
分别使用岭回归和Lasso解决上面回归问题当回归存在多重共线性的时候,可以使用最小二乘,岭回归,Lasso回归, 但当X的秩不存在的时候或变量的数量少于样本的数量是,作为无偏差估计的最小二乘就不适用,岭回归和Lasso回归更合适。过程:1、加载数据做中心化后做线性回归: 可以看到线性回归方程很不显著,存在多重共线性,下面做多……继续阅读 » Haran 8年前 (2016-09-17) 4910浏览 0评论1个赞
回归建模的主要流程:1、描述性统计:对数据有个概览2、异常缺失值处理3、多重共线性检验:kappa(cor(),exact=TRUE)4、相关性分析:筛选自变量5、参数计算方法:最小二乘法,岭回归6、检验:拟合度检验:R^2模型显著性检验:F检验的P-value参数检验:T检验的P-value残差正太性检验:shapiro.test残差……继续阅读 » Haran 8年前 (2016-08-09) 6293浏览 0评论0个赞