1、描述性统计学 作者 xxx(北北卡罗来纳州立大学兽医学院微生物学、病理学和寄生虫学系)翻译 xx1感谢你的观看2019年8月23描述性统计学 变量的类型 概括性统计学 分布 图形描述对所得数据有一个总体“感觉”评价数据的质量2感谢你的观看2019年8月23变量的类型 连续型:温度、心率等 高斯分布(Gaussian distribution),钟罩形 离散变量、分类变量 定序型数据(Ordinal):腹痛的程度、肿瘤大小 定类型数据(Nominal):品种、性别 二项数据(Binominal):是或否、出席或缺席3感谢你的观看2019年8月23正态和偏态分布l对称l均值、众数、中位数l单峰l偏
2、向左侧l众数、中位数l单峰尾部(tail)双峰4感谢你的观看2019年8月23变量或分布的类型决定了所使用的统计方法使用非参数检验使用连续型变量的检验连续型连续型定序型定序型定义新的变量或者进行转变5感谢你的观看2019年8月23集中趋势和离散 集中趋势的测度 均值(Mean)、中位数(Median)、众数(Mode)离散程度的测度 标准差(Standard deviation)、百分位数(percentiles)6感谢你的观看2019年8月23集中趋势的测度:均值(Mean)均值(Mean):对于连续型数据而言此处,X1,X2,Xn是独立的值并且N是测量的总数。7感谢你的观看2019年8月2
3、3均值、中位数、众数 呼吸频率 甲组=(11,12,13,14,15);均值=13 乙组=(11,12,13,13,14,25);均值=15 均值为极端值所影响 中位数是13:分割数据成50:50的值(数据按升序或降序排列)众数是13:出现最多的数8感谢你的观看2019年8月23集中趋势的测度9感谢你的观看2019年8月23离散程度的测度 标准差(Standard deviation)1sd,2sd,3sd 百分位数(Percentiles)25,50,75,90,95 极差(Range)最大值-最小值10感谢你的观看2019年8月23标准差方差11感谢你的观看2019年8月23百分位数70%
4、下侧30%上侧第70个百分位数值四分之一分位数=25%四分之二分位数=50%12感谢你的观看2019年8月23白细胞计数茎叶图(Stem Leaf)大猩猩属(Gorilla gorilla)N:29个大猩猩平均白细胞数:10.3 SD 5.02中位数:8.313感谢你的观看2019年8月23大猩猩属佛罗里达海牛(Florida Manatee)淋巴细胞单核细胞总蛋白质重量14感谢你的观看2019年8月23均值的置信区间(Confidence Interval for the Mean)置信区间置信区间更多样本15感谢你的观看2019年8月23分类数据 肿瘤大小 小,中,大 甲组:1,1,2,2,2,2,2,3 1,2,3 乙组:1,2,2,3,3,3,3,3 均值=NO!同时,中位数=YES!频数 众数=YES!比例 直方图16感谢你的观看2019年8月23交叉列联表和图表说明 组别组别甲甲 乙乙肿瘤大小肿瘤大小频数表比例:肿瘤大小为1,甲组中占2/3每个细胞观察到的数目17感谢你的观看2019年8月23联系 联系并不意味着因果关系 因果关系是联系的一种特殊形式 标准包括力度、短暂性、生物梯度、一致性等 联系的检验定义假设 零假设想要拒绝的 备择假设18感谢你的观看2019年8月23