ImageVerifierCode 换一换
格式:PPT , 页数:32 ,大小:221KB ,
文档编号:2986330      下载积分:25 文币
快捷下载
登录下载
邮箱/手机:
温馨提示:
系统将以此处填写的邮箱或者手机号生成账号和密码,方便再次下载。 如填写123,账号和密码都是123。
支付方式: 支付宝    微信支付   
验证码:   换一换

优惠套餐
 

温馨提示:若手机下载失败,请复制以下地址【https://www.163wenku.com/d-2986330.html】到电脑浏览器->登陆(账号密码均为手机号或邮箱;不要扫码登陆)->重新下载(不再收费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录  
下载须知

1: 试题类文档的标题没说有答案,则无答案;主观题也可能无答案。PPT的音视频可能无法播放。 请谨慎下单,一旦售出,概不退换。
2: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
3: 本文为用户(三亚风情)主动上传,所有收益归该用户。163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

1,本文(第八讲:单变量描述统计分析.课件.ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!

第八讲:单变量描述统计分析.课件.ppt

1、第八讲:单变量描述统计分析第八讲:单变量描述统计分析本讲关注的主要问题本讲关注的主要问题o 1.什么是单变量分析?o 2.变量分布特征;o 3.如何制作统计图表?o 4.集中趋势分析法;o 5.离散趋势分析法;第一节:什么是单变量分析?第一节:什么是单变量分析?o 1.单变量分析就是针对一个变量或多个独立的变量进行的分析,以了解某一现象的本质和发展规律;例如:o 同济大学每年招收多少学生?o 同济大学共有多少个专业?每个专业各有多少人?o 某城市每天出生多少婴儿?等等。o 2.对于单变量而言,一般需要研究它的分布特征,集中趋势和离散趋势。第二节:单变量分布特征第二节:单变量分布特征o 通常收集

2、到的原始资料(数据、变量)是杂乱无章的;在分析数据之间,通常我们会对数据进行一定整理。最简单的就是了解变量的分布特征。o 1.所谓分布,就是在一次调查中,某变量的每一个取值所呈现的状态。包括频次分布和频率分布。o 2.频次分布:变量取值及其对应的频次的集合;o 3.频率分布:变量取值及其对应的频率的集合。o 4.分布可以用表格来表示(分布表),也可以用图形来表示(分布图)6.变量分布示例变量分布示例o 某班级学生性别分布(男生,100人)(女性,150人);o 某学校学生父亲的职业分布(干部,110人)(工人,152人)(农民,288人);o 2010年上海市常住人口年收入分布(5000元以下

3、,5%)(5000元-20000元,20%)(20000元-50000元,45%)(5000元及以上,30%)7.分布表分布表o 变量的取值要具有完备性(不能遗漏)和互斥性(不能重复)。为了满足这两个要求,在制作分布表时,会对原始数据有些修改。o 对于分组资料的上下限有所约定:规则“含下不含上”,即nxm;7.1 定类变量分布表定类变量分布表7.2 定序变量分布表定序变量分布表o 掌握累积频次的概念:cf(向上累加,一组数据从小到大排列)小于当前值的累积频次(或所占比例)。总体生活感觉1342.32.361910.512.8292649.862.6189632.394.92995.1100.0

4、5874100.0非 常 不 幸 福不 幸 福一 般幸 福非 常 幸 福总 计频 次比 例累 积 百 分 比7.2.1 向上累加向上累加cf与向下累加与向下累加cf7.3 定距变量分布表定距变量分布表o 假如某定距变量有100个取值,如100个儿童的身高;将其制作成分布表;o 思路:进行分组统计,转化为定类变量再进行统计。o 方法:确定组数确定组距确定分点精度(比原始数据提高一位精度)频次统计。第三节:如何制作分布图?第三节:如何制作分布图?o 不同类型变量,可以制作不同类型的图。o 1.定类变量:条形图,饼状图;o 2.定序变量:条形图;o 3.定距变量:直方图;o 利用excel作图。1

5、定类变量条形图与饼状图定类变量条形图与饼状图2 定序变量条形图:按序排列,可分散定序变量条形图:按序排列,可分散3 定距变量直方图定距变量直方图第四节:集中趋势测量法第四节:集中趋势测量法o 1. 所谓集中趋势(central tendency),是指运用一个或多个特征值来代替样本的某一个变量的情况。当运用这个值来预测或概括样本时,所犯的错误最小。从而达到简化资料的目的。o 2. 对于不同层次的变量,可以采用不同的集中趋势测量法。2.1 定类变量的集中趋势测量定类变量的集中趋势测量o 有一组关于中国人口婚姻状况的资料(分为未婚、已婚、离婚和丧偶四种类型)。现从中再随机抽取一人,试预测其婚姻状况

6、是哪种类型?当知道中国人口婚姻状况分布之后,又如何预测?两种结果哪个精确?婚姻状况116019.720.0444075.395.31342.597.71502.6100.05894100.0未 婚已 婚离 婚丧 偶TotalValid频 次比 例累 积 比 例2.1.1 众值测量法众值测量法o 对于定类变量而言,一般采用众值(mode)来测量它们的集中趋势;o 众值:在一组数据中,出现频次最多的值;o 对于分组资料而言,众值是出现频次最多的组的中心值。o 右图,众值=?某大学学生各年级人数13518.318.319025.844.122430.474.518825.5100.0737100.0

7、一年级二年级三年级四年级TotalValid频次比例累积百分比2.2 定序变量的集中趋势测量定序变量的集中趋势测量o 某班级21人的社会统计学考试成绩分为四个等级,依次为:及格,中,良,优;现从中任意抽取一人,猜测其成绩;在得知该21人成绩的分布之后,再预测其成绩,比较两次预测的结果有何差异?o 如果用众值的话 会有什么损失?2.2.1 中位值测量法中位值测量法o 对于定序变量而言,采用中位值(mean)测量它们的集中趋势;o 所谓中位值,是指将一组数据从小到大(或从大到小)排序后,中间位置所对应的值。o 中位值表示一组数据中,有半数的取值小于或等于该值,有半数的取值大于或等于该值;比众值来预

8、测更加精确,利用了变量的排序特征。2.2.2 中位值的原始算法中位值的原始算法o 对于原始数据(n较小)可以直接排序,求中位值。n为奇数时,中位值为(n+1)/2位置对应的值;n为偶数时,中位值为(n+1)/2相邻两个位置对应的数的平均数;o 对于原始数据(n较大)时,根据变量的累积频次分布计算(n+1)/2位置对应的取值。o 例:例:9个人的日工资分别如下:个人的日工资分别如下:47,42,50,51,92,112,71,83,108;3. 定距变量的集中趋势定距变量的集中趋势o 对于定距变量而言,采用均值(mean)来代替他们最为精确,利用信息最多。o 均值计算有三种情况:原始数据(n较小

9、):求和取平均值原始数据(n较大):根据频次分布分组数据(n较大):取组中值比例数据:ixXNi ix fXNi ib fXNii1122iiXx px px px p+3.1 求下列数据的平均值求下列数据的平均值您的家庭人均月收入88.01010.03939.03131.01212.0100100.00500元5001000元10003000元30005000元500010000元ValidTotalFrequencyPercent3.2 众值、中位值、均值的比较众值、中位值、均值的比较o 1.三个设计的目的是共同的,只是适用的测量层次不同 。o 2.均值是最灵敏的。o 3.只有单峰和基本对

10、称的图形,用均值作为集中趋势才是合理的。o 4.偏态和三值的关系。由于对称图形,众值、中位数和均值的位置重叠。当图形正偏或负偏时,均值变化最快,中位数次之,众值不变。第五节:离散趋势测量法第五节:离散趋势测量法o 1. 所谓离散趋势,是指用一个或几个值来测量不同样本(个案)之间的差异情况;与集中趋势测量法相互补充,反映集中趋势测量的代表性程度大小。o 2. 与集中趋势相同的是,不同层次的变量有不同的离散趋势测量法。2.1 定类变量的离散趋势测量定类变量的离散趋势测量o 对于定类变量,可以采用异众比例来测量个案之间的离散性程度。o 公式: fmo是指众值的频次o 异众比例越大,说明众值的代表性越

11、低;当运用众值来预测变量时,所犯的错误会越大monfvn2.2 定序变量的离散趋势测量定序变量的离散趋势测量o 对于定序变量,可以采用四分位差来测量个案之间的离散性程度。o 四分位差Q=Q75-Q25o Q75、Q25分别表示75%位置和25%位置所对应的值,算法同中位值;练习:原始数据的四分位差计算练习:原始数据的四分位差计算o 例:调查甲乙两个农村的家庭人数,甲有11户人家,每户人数:2,2,3,4,6,9,10,10,11,13,15。试求中位值及四分位差;2.3 定距变量的离散趋势测量法定距变量的离散趋势测量法o 对于定距变量而言,采用方差2或标准差来测量。反映均值的离散程度;o 方差

12、表示某变量的每个样本取值与均值之间离差的平方和。公式为:2()ixxN2222()iixxxxNN2.3.1 原始变量的方差与标准差计原始变量的方差与标准差计算算o 例:调查甲地的十个乡的卫生情况,发现每例:调查甲地的十个乡的卫生情况,发现每个乡的卫生户比率是(个乡的卫生户比率是(%):):8,18,14,14,8,15,12,17,12,19。平均。平均每个乡有百分之几是卫生户?各乡之间的差每个乡有百分之几是卫生户?各乡之间的差异有多大?异有多大?2222(8 1819)/10 13.7()8 13.718 13.719 13.73.610ixx xN ()() ()2.3.2 频次分布数据求方差和标准频次分布数据求方差和标准差差222222()()iii ii ii if x xfxfxfxxNNNN222()iiiif xxf xxNN2.3.3 分组资料求方差和标准差分组资料求方差和标准差o 用组中值bi来代替个案取值。222222()()iiiiiiiif bxf bf bf bxNNNN222()iiiif bxf bxNN2.4 集中趋势集中趋势&离散趋势对比离散趋势对比

侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|