1、11.3 变量间的相关关系、统计案例 第十一章 统计与统计案例 基础知识 自主学习 课时作业 题型分类 深度剖析 内容索引 基础知识 自主学习 1.两个变量的线性相关 (1)正相关 在散点图中 , 点散布在从 到 的区域 , 对于两个变量的这种相关关系 , 我们将它称为正相关 . (2)负相关 在散点图中 , 点散布在从 到 的区域 , 两个变量的这种相关关系称为负相关 . (3)线性相关关系 、 回归直线 如果散点图中点的分布从整体上看大致在 , 就称这两个变量之间具有线性相关关系 , 这条直线叫做回归直线 . 知识梳理 左下角 右上角 左上角 右下角 一条直线附近 2.回归方程 (1)最小
2、二乘法 求回归直线 , 使得样本数据的点到它的 的方法叫做最小二乘法 . 距离的平方和最小 (2)回归方程 方程 y bx a是两个具有线性相关关系的变量的一组数据 ( x 1 , y 1 ) , ( x 2 ,y 2 ) , ? , ( x n , y n ) 的回归方程,其中 a, b是待定参数 . ni 1? x i x ? y i y ?ni 1? x i x ?2ni 1x i y i n x yni 1x2i n x2y bx b a . 3.回归分析 (1)定义:对具有 的两个变量进行统计分析的一种常用方法 . (2)样本点的中心 对于一组具有线性相关关系的数据 (x1, y1)
3、, (x2, y2), ? , (xn, yn), 其中 称为样本点的中心 . ( x , y ) 相关关系 (3)相关系数 当 r0时 , 表明两个变量 ; 当 r0时 , 表明两个变量 . r的绝对值越接近于 1, 表明两个变量的线性相关性 .r的绝对值越接近于 0, 表明两个变量之间 .通常 |r|大于 时 , 认为两个变量有很强的线性相关性 . 4.独立性检验 (1)分类变量:变量的不同 “ 值 ” 表示个体所属的 , 像这样的变量称为分类变量 . 正相关 负相关 越强 几乎不存在线性相关关系 0.75 不同类别 构造一个随机变量 K 2 ,其中 n 为 样本容量 . (2)列联表:列出的两个分类变量的 , 称为列联表 .假设有两个分类变量 X和 Y, 它们的可能取值分别为 x1, x2和 y1, y2, 其样本频数列联表 (称为 2 2列联表 )为 2 2列联表 y1 y2 总计 x1 a b a b x2 c d c d 总计 a c b d a b c d a b c d 频数表 n ? ad bc ? 2? a b ? c d ? a c ? b d ? (3)独立性检验 利用 随机变量 来 判断 “ 两个分类 变量 ” 的方法称为独立性检验 . K2 有关系