1、描述性统计学 作者 xxx(北北卡罗来纳州立大学兽医学院微生物学、病理学和寄生虫学系) 翻译 xx1谢谢欣赏2019-8-29描述性统计学 变量的类型 概括性统计学 分布 图形描述对所得数据有一个总体“感觉”评价数据的质量2谢谢欣赏2019-8-29变量的类型 连续型:温度、心率等 高斯分布(Gaussian distribution),钟罩形 离散变量、分类变量 定序型数据(Ordinal):腹痛的程度、肿瘤大小 定类型数据(Nominal):品种、性别 二项数据(Binominal):是或否、出席或缺席3谢谢欣赏2019-8-29正态和偏态分布l对称l均值、众数、中位数l单峰l偏向左侧l众
2、数、中位数l单峰尾部(tail)双峰4谢谢欣赏2019-8-29变量或分布的类型决定了所使用的统计方法使用非参数检验使用连续型变量的检验连续型连续型定序型定序型定义新的变量或者进行转变5谢谢欣赏2019-8-29集中趋势和离散 集中趋势的测度 均值(Mean)、中位数(Median)、众数(Mode) 离散程度的测度 标准差(Standard deviation)、百分位数(percentiles)6谢谢欣赏2019-8-29集中趋势的测度:均值(Mean)均值(Mean):对于连续型数据而言此处,X1,X2,Xn是独立的值并且N是测量的总数。7谢谢欣赏2019-8-29均值、中位数、众数 呼
3、吸频率 甲组=(11,12,13,14,15) ;均值=13 乙组=(11,12,13,13,14,25);均值=15 均值为极端值所影响 中位数是13: 分割数据成50:50的值(数据按升序或降序排列) 众数是13:出现最多的数8谢谢欣赏2019-8-29集中趋势的测度9谢谢欣赏2019-8-29离散程度的测度 标准差(Standard deviation) 1sd,2sd,3sd 百分位数(Percentiles) 25,50,75,90,95 极差(Range) 最大值-最小值10谢谢欣赏2019-8-29标准差方差11谢谢欣赏2019-8-29百分位数70%下侧30%上侧第70个百分位
4、数值四分之一分位数=25%四分之二分位数=50%12谢谢欣赏2019-8-29白细胞计数茎叶图(Stem Leaf)大猩猩属(Gorilla gorilla )N:29个大猩猩平均白细胞数:10.3 SD 5.02中位数:8.313谢谢欣赏2019-8-29大猩猩属佛罗里达海牛(Florida Manatee)淋巴细胞单核细胞总蛋白质重量14谢谢欣赏2019-8-29均值的置信区间(Confidence Interval for the Mean)置信区间置信区间更多样本15谢谢欣赏2019-8-29分类数据 肿瘤大小 小,中,大 甲组:1,1,2,2,2,2,2,3 1, 2, 3 乙组:1,2,2,3,3,3,3,3 均值=NO! 同时, 中位数=YES! 频数 众数=YES! 比例 直方图16谢谢欣赏2019-8-29交叉列联表和图表说明 组别组别甲甲 乙乙肿瘤大小肿瘤大小频数表比例:肿瘤大小为1,甲组中占2/3每个细胞观察到的数目17谢谢欣赏2019-8-29联系 联系并不意味着因果关系 因果关系是联系的一种特殊形式 标准包括力度、短暂性、生物梯度、一致性等 联系的检验定义假设 零假设想要拒绝的 备择假设18谢谢欣赏2019-8-29