变量间的关系
不确定:相关关系,通常用相关系数表示,相关系数的取值范围是[-1,1],大于0 表示正相关,小于0表示负相关;绝对值接近于1,表示相关性越强
确定:函数关系,通常用公式表示:Y=a+bX,通常也叫线性回归
线性回归
一元线性回归:Y=a+bX
求解参数通常是通用最小线性二乘法求解参数a和b
检验通常包含:方程检验,拟合度用R^2,RSS,……继续阅读 »
Haran
9年前 (2016-11-23) 7013浏览 0评论
2个赞
建模的流程大三步:数据清理处理,模型选择,检验,下面以线性回归为例:
导入数据
import matplotlib.pyplot as plt
import numpy as np
from sklearn import datasets,linear_model
diabetes=datasets.load_diabetes() #加载数据……继续阅读 »
Haran
9年前 (2016-09-23) 9280浏览 0评论
3个赞
数据集 ex14.csv 是关于中国各个省份的三项指标数值。
请根据这些指标数值,将各个省份分为3类,并尝试归纳出各个类别的特点
查看数据图形分布:
# coding=utf-8
import os
import pandas as pd
from sklearn.cluster import AgglomerativeClustering
fr……继续阅读 »
Haran
9年前 (2016-09-07) 11285浏览 0评论
7个赞
1、 读入数据做时序图
# -*- coding: UTF-8 -*-
import pandas as pd
import matplotlib.pyplot as plt
from statsmodels.graphics.tsaplots import plot_acf
from statsmodels.tsa.stattools ……继续阅读 »
Haran
9年前 (2016-09-04) 11611浏览 0评论
5个赞
data2 是关于重伤病人的一些基本资料。自变量X是病人的住院天数,因变量Y是病人出院后长期恢复的预后指数,指数数值越大表示预后结局越好。
尝试对数据拟合合适的线性或非线性模型
过程:
1、通过散点图可以判断可能可以使用的模型有:线性回归,对数,指数和冥指数回归
# -*- coding: utf-8 -*-
import pandas as pd
fr……继续阅读 »
Haran
10年前 (2016-08-10) 7988浏览 0评论
0个赞