1、 统计数据的收集整理与显示统计数据的收集整理与显示2.1 2.1 原始数据的收集方法原始数据的收集方法2.2 2.2 次级资料的收集次级资料的收集2.3 2.3 统计调查误差统计调查误差2.4 2.4 统计整理与统计分组统计整理与统计分组2.5 2.5 分布数列的编制分布数列的编制2.6 2.6 统计图表统计图表2021/8/172.1 2.1 原始数据的收集方法原始数据的收集方法一、统计调查概述一、统计调查概述二、统计调查方案二、统计调查方案三、问卷设计三、问卷设计2021/8/17指直接从各调查指直接从各调查单位收集的用来单位收集的用来反映反映个体个体特征的特征的数据资料数据资料收集收集原
2、始数据资料原始数据资料 的统计活动过程的统计活动过程2021/8/17按调查单位的范围大小分为按调查单位的范围大小分为按调查时间是否连续分为按调查时间是否连续分为按调查的组织方式不同分为按调查的组织方式不同分为普查普查抽样调查抽样调查典型调查典型调查重点调查重点调查2021/8/17 指按照国家统一规定的各项要求,指按照国家统一规定的各项要求,地定期向国家和主管部门地定期向国家和主管部门报送基本统计资料的一种报告制度报送基本统计资料的一种报告制度2021/8/17总体单位总体单位调查单位调查单位2021/8/17总体单位总体单位调查单位调查单位报表制度报表制度可以全面调查,但可以全面调查,但通
3、常是调查限定规通常是调查限定规模以上的总体单位模以上的总体单位2021/8/172021/8/17总体单位总体单位调查单位调查单位普普 查查对全部单位对全部单位进行调查进行调查2021/8/172021/8/17总体单位总体单位调查单位调查单位重点调查重点调查只调查重点单位(单位只调查重点单位(单位数不多但其标志量占标数不多但其标志量占标志总量比重较大的单位)志总量比重较大的单位)2021/8/172021/8/17总体单位总体单位调查单位调查单位典型调查典型调查对典型单位进行调对典型单位进行调查,典型单位的选查,典型单位的选择并不一定按规模择并不一定按规模2021/8/172021/8/17
4、总体单位总体单位调查单位调查单位抽样调查抽样调查按随机原则选择调按随机原则选择调查单位,各单位被查单位,各单位被选中的机会相同。选中的机会相同。2021/8/17抽样调查研究抽样调查研究Sampling Study为什么要抽样?为什么要抽样?1.涉及破坏受试对象涉及破坏受试对象质量控制质量控制2.取得精确可靠的结果取得精确可靠的结果3.实际情况的约束实际情况的约束时间,成本等时间,成本等2021/8/17关于抽样方法 v抽样方法主要有两种:概率抽样和非概率抽样。2021/8/17(一)概率抽样v1简单随机抽样(Simple random sampling)。是最基本的抽样形式,它是完全随机地选
5、择样本。此法要求有一个完美的抽样框,或者总体中有一个个体的详尽名单。v2分层抽样(Reduced sampling)。分两个步骤:首先将总体分成不同的“层”,然后在每一层内进行抽样。分层抽样可防止简单随机抽样造成的样本构成与总体构成不成比例的现象。v3整群抽样(Cluster sampling)。首先将全部总体分为若干部分,每一部分称为一个群,把每一群做为一个抽样单位,在群地进行抽样;然后,在被抽中的群中做全面调查。例如,在市场调查的入户调查中,可以对被选作抽样单位的某个大院的每家每户进行调查。v4等距抽样。又称系统抽样(Systematic sampling),是在样本框中每隔一定距离抽选一
6、个被调查者。这一方法也比较常用,有时还可与整群抽样法和分层抽样法结合使用。例如,可采用系统抽样去抽取选择“群”或个体,也可在某一“层”的范围内进行系统采样。2021/8/17(二)非概率抽样v不是完全按随机原则选取样本。非概率抽样有三种形式。v1主要是由调查人员自由选择被调查者的非随机选样。例如在购物中心采访100位妇女,这100位被调查者可以随机选择。v2通过某些条件过滤选择某些被调查者参与调查的判断抽样法。在许多情况下,由于研究对象可能仅限于一部分居民,因而有时采用这种方法能节省大量经费。v3大多数种类的研究产品测试、街访、座谈会,只要不是属于要进行总体推论的大多数项目都可使用非概率抽样法
7、。2021/8/172021/8/17观察记录法观察记录法2021/8/17调查者调查者强制、约束强制、约束报告法报告法2021/8/17访问调查访问调查调查者调查者被调查者被调查者 平等合作平等合作2021/8/172.2 2.2 原始数据的收集方法原始数据的收集方法一、统计调查概述一、统计调查概述二、统计调查方案二、统计调查方案三、问卷设计三、问卷设计2021/8/17统计调查方案统计调查方案调查目的;调查目的;调查对象调查对象与与调查单位调查单位;调查项目与调查项目与调查表调查表;调查时间;调查时间;制定调查工作的组织实施计划。制定调查工作的组织实施计划。2021/8/172.2 2.2
8、 原始数据的收集方法原始数据的收集方法一、统计调查概述一、统计调查概述二、统计调查方案二、统计调查方案三、问卷设计三、问卷设计2021/8/17主要指非政府性统计机构或个人所主要指非政府性统计机构或个人所从事的对人的主观意见的调查工作,从事的对人的主观意见的调查工作,也称作民意调查或民意测验也称作民意调查或民意测验表头表头表体表体表脚表脚解释调查意解释调查意义、表达感激之情等义、表达感激之情等被调查者被调查者基本情况、调查项目基本情况、调查项目时间、操时间、操作者等作者等2021/8/17危害自身健康危害自身健康影响他人健康影响他人健康浪费钱财浪费钱财容易引起火灾容易引起火灾破坏家庭团结破坏家
9、庭团结容易控制,容易控制,但不易全面但不易全面容易滋生腐败容易滋生腐败不易控制,不易控制,但内容丰富但内容丰富您认为吸烟有您认为吸烟有哪些害处?哪些害处?危害自身健康危害自身健康影响他人健康影响他人健康浪费钱财浪费钱财容易引起火灾容易引起火灾破坏家庭团结破坏家庭团结其他其他 。2021/8/172021/8/17问卷设计问卷设计 Questionnaire Design 问卷的长度问卷的长度(Questionnaire Length)尽可能简短,只保留调查所必须的关键问尽可能简短,只保留调查所必须的关键问题题 调查方式调查方式(Mode of Response)面谈面谈回答率较高,费用较高回答
10、率较高,费用较高电话访问电话访问居中居中信函调查信函调查回答率较低,费用较低回答率较低,费用较低 问题设计问题设计(Formulating Questions)语言简明易懂,避免含糊其词语言简明易懂,避免含糊其词考虑完备而避免重复考虑完备而避免重复2021/8/17您是否吸烟(如果选,则跳过您是否吸烟(如果选,则跳过2、3题)题)吸烟不吸吸烟不吸您每天大约吸多少支烟您每天大约吸多少支烟5支以下支以下5-10支支 10-15支支 15-20 20-25支支 25支以上支以上您的吸烟历史大约有多长您的吸烟历史大约有多长 1年以下年以下1-5年年5-10年年10年以上年以上您是否认为吸烟有害健康(请
11、写出理由)您是否认为吸烟有害健康(请写出理由)调查单位中吸调查单位中吸烟人所占比例烟人所占比例吸烟人群日吸吸烟人群日吸烟数量情况烟数量情况吸烟人群吸烟吸烟人群吸烟历史情况历史情况调查对象对吸调查对象对吸烟的看法烟的看法2021/8/172.3 2.3 次级资料的收集次级资料的收集指已经被收集、加工整理成型的指已经被收集、加工整理成型的数据信息数据信息查阅公开出版物;查阅公开出版物;向政府统计机构咨询;向政府统计机构咨询;向其他机构咨询;向其他机构咨询;网上查询。网上查询。2021/8/17传统的二手信息数据 v传统的外部的次级信息数据来源非常广泛,有各级政府、非营利机构、贸易组织和行业机构、商
12、业性出版物等等。其中政府机构所编辑出版的统计资料是宏观、微观信息数据的主要来源。v国家统计局出版的统计资料汇编刊物主要有:中国统计年鉴、国民收入统计资料汇编、中国物价统计年鉴、全国城镇居民家庭收支调查、中国农村统计年鉴、中国劳动工资统计年鉴、中国证券期货统计摘要、世界经济年鉴、中国金融年鉴、中国证券期货统计年鉴、中国经济年鉴等等。2021/8/17v除了国内出版的刊物外,也可以利用国际和外国组织机构公开发表的资料汇编,如:联合国统计年鉴、世界发展报告、世界经济展望、美国统计摘要、日本统计月报等。2021/8/17二手信息数据的新纪元在线信息数据库及其各个机构等网站v联网的和不联网的信息数据库都
13、可以进一步分成参考文献、统计数字、全文、名录和其他信息数据库。参考文献信息数据库由刊物、杂志、报纸、市场研究、技术报告、政府文件等方面的引文组成,还常常可以提供资料的摘要或小结。统计数字信息数据库包括各种数字的统计资料。全文信息数据库包括一些文献的全文,如报纸的全文搜索服务。名录信息数据库提供关于个人、机构和服务单位的名单、地址和联系电话等等,如著名的Yahoo。2021/8/17常用的统计数据来源v美国经济分析局美国经济分析局http:/www.bea.doc.govv美国人口普查局美国人口普查局http:/www.census.govv美国劳工统计局美国劳工统计局http:/stats.b
14、ls.govv美联储经济数据库美联储经济数据库http:/www.stls.frb.org/fredv美国联邦统计美国联邦统计http:/www.fedstats.govv世界银行世界银行http:/www.worldbank.orgv国际货币基金组织国际货币基金组织http:/www.imf.orgvOECD http:/www.oecd.org2021/8/172021/8/172021/8/172.4 2.4 统计整理与统计分组统计整理与统计分组2021/8/17统计整理统计整理 统计资料的分组、汇总及制表统计资料的分组、汇总及制表 数据的传输、贮存、更新及输出数据的传输、贮存、更新及输
15、出2021/8/172021/8/172.4 2.4 统计整理与统计分组统计整理与统计分组2021/8/172021/8/17选择分选择分组标志组标志确定分确定分组体系组体系总体单总体单位归类位归类科学性科学性:组间差异组间差异大,组内大,组内差异小。差异小。完备性和互斥完备性和互斥性性:每个单位每个单位均能且只能归均能且只能归到某个组中。到某个组中。2021/8/17按家庭收入水平按家庭收入水平分组;分组;按城乡分组;按城乡分组;按性别分组;按性别分组;按年龄分组。按年龄分组。单亲下岗;单亲下岗;双亲下岗;双亲下岗;双亲在岗。双亲在岗。2021/8/172021/8/17对教师对教师的分类的
16、分类按性别分类按性别分类男性男性女性女性按职称分类按职称分类按年龄分类按年龄分类高级高级中级中级初级初级青年青年中年中年共计共计7组组 2+3+22021/8/17按性别按性别分类分类按职称按职称分类分类按年龄按年龄分类分类男男女女高级高级中级中级初级初级青年青年中年中年共计共计12组组232对教师对教师的分类的分类2021/8/172.5 2.5 分布数列的编制分布数列的编制2021/8/172021/8/17指每个组值只用一个具体的指每个组值只用一个具体的变量值表现的数列变量值表现的数列己知某车间有己知某车间有24名工人,他们的日产量(件)名工人,他们的日产量(件)分别是:分别是:20,2
17、3,20,24,23,21,22,25,26,20,21,21,22,22,23,22,22,24,25,21,22,21,24,23.要求根据以上资料编制变量数列。要求根据以上资料编制变量数列。2021/8/172021/8/17指每个组的变量值用一个区指每个组的变量值用一个区间来表现的变量数列间来表现的变量数列变量值变动区间的长度相等变量值变动区间的长度相等2021/8/17指每组两端表示各组界限的变量值,指每组两端表示各组界限的变量值,各组的最小值为各组的最小值为下限下限,最大值为,最大值为上限上限每组变量值变动区间的长度,为上每组变量值变动区间的长度,为上下限之差下限之差每组变量取值范
18、围的中点数值每组变量取值范围的中点数值 2下限上限 组中值=2021/8/17销售额销售额(万元)(万元)商店数商店数(个)(个)每百元商品销每百元商品销售额中支付的售额中支付的流通费(元)流通费(元)50以下以下50100100200200300300以上以上102030251514.211.410.19.28.5上组限上组限U下组限下组限L如:组距如:组距d=U-L=100-50=50(万元)(万元)如:组中值如:组中值x=(U+L)/2 =(100+200)/2=150(万元)(万元)2021/8/17适用于总体单位的标志值适用于总体单位的标志值变动比较均匀的情况变动比较均匀的情况202
19、1/8/17百万元)(27229minmaxXXRq要能区分各组的性质差异要能区分各组的性质差异q要能反映总体资料的分布特征要能反映总体资料的分布特征q为方便计算,尽可能为为方便计算,尽可能为5 5或或1010的整数倍的整数倍R组距组距(d)组数(组数(m)2021/8/17组)(615271dRm1dRmdRmdRdR2021/8/17q对于离散变量,相邻组组限可以对于离散变量,相邻组组限可以间断间断,也,也可可重叠重叠;q对于连续变量,相邻组组限对于连续变量,相邻组组限必须重叠必须重叠;q符合符合“上组限不计入上组限不计入”原则;原则;q首末两组可使用首末两组可使用“以下以下”及及“以以上
20、上”的开口组。的开口组。2021/8/17 销售额销售额(百万元)(百万元)组中值组中值 商店数商店数5以下以下51010151520202525以上以上2.57.512.517.522.527.5410161343合计合计50fX(5+(5-5))/2=2.5(25+(25+5))/2=27.52021/8/17茎叶表示茎叶表示 Stem-and-Leaf Display将每一观测值分解为茎值和叶值(用直线隔开)垂直线左边的数字称为“茎”,确定组别 垂直线右边的数字“叶”,确定频数(计数)Xi2 1446773 0284 12021/8/17先计算开口组的假定上、下限:先计算开口组的假定上、
21、下限:22相邻组组距上限首组首组假定下限首组上限22相邻组组距下限末组末组假定上限末组下限2021/8/17各组单位数占总体单位总数的比重各组单位数占总体单位总数的比重 从变量值从变量值低低的组开始,将各组次数的组开始,将各组次数(频率)逐次向变量值(频率)逐次向变量值高高的组累计,的组累计,说明某一组说明某一组上限以下各组的累计次数上限以下各组的累计次数(频率)(频率)。从变量值从变量值高高的组开始,将各组次数的组开始,将各组次数(频率)逐次向变量值(频率)逐次向变量值低低的组累计,的组累计,说明某一组说明某一组下限以上各组的累计次数下限以上各组的累计次数(频率)(频率)。2021/8/17
22、VAR0000111.21.21.222.42.43.622.42.46.044.84.810.811.21.212.022.42.414.522.42.416.91214.514.531.378.48.439.889.69.649.444.84.854.233.63.657.889.69.667.556.06.073.533.63.677.178.48.485.511.21.286.756.06.092.822.42.495.233.63.698.811.21.2100.083100.0100.0152.00154.00155.00156.00157.00158.00159.00160.00
23、161.00162.00163.00164.00165.00166.00167.00168.00169.00170.00171.00172.00174.00TotalValidFrequencyPercentValidPercentCumulativePercent有效有效数据数据频数频数频率频率有效有效频率频率累计累计频率频率约约2/3的人身高不超过的人身高不超过165cm2021/8/17 销售额销售额(百万元)(百万元)商店商店数数频率频率()累计次数累计次数累计频率累计频率()5以下以下51010151520202525以上以上410161343820322686合计合计50100ff
24、f2021/8/17 销售额销售额(百万元)(百万元)商店商店数数频率频率()累计次数累计次数累计频率累计频率()向上向上累计累计向上向上累计累计5以下以下51010151520202525以上以上41016134382032268641430434750828608694100合计合计50100fff2021/8/17 销售额销售额(百万元)(百万元)商店商店数数频率频率()累计次数累计次数累计频率累计频率()向上向上累计累计向下向下累计累计向上向上累计累计向下向下累计累计5以下以下51010151520202525以上以上4101613438203226864143043475050463
25、62073828608694100100927240146合计合计50100fff2021/8/172.6 2.6 统计图表统计图表2021/8/17一一.分类数据的整理与显分类数据的整理与显示示二二.顺序数据的整理与显顺序数据的整理与显示示2021/8/17数据的整理与显示(基本问题)1.要弄清所面对的数据类型,因为不同类型的数据,所采取的处理方式和方法是不同的2.对分类数据和顺序数据主要是做分类整理3.对数值型数据则主要是做分组整理4.适合于低层次数据的整理和显示方法也适合于高层次的数据;但适合于高层次数据的整理和显示方法并不适合于低层次的数据2021/8/17分类数据的整理与图示2021
26、/8/17分类数据的整理(基本过程)v1.列出各类别分类分类频数频数比例比例百分比百分比比率比率ABCDE2021/8/17分类数据的整理(可计算的统计量)1.频数频数(frequency):落在各类别中的数据个数2.比例比例(proportion):某一类别数据占全部数据的比值3.百分比百分比(percentage):将对比的基数作为100而计算的比值4.比率比率(ratio):不同类别数值的比值2021/8/17分类数据整理频数分布表(例题分析)2021/8/17分类数据的图示条形图(bar Chart)1.用宽度相同的条形的高度或长短来表示各类别数据的图形2.有单式条形图、复式条形图等形
27、式3.主要用于反映分类数据的频数分布4.绘制时,各类别可以放在纵轴,称为条形图,也可以放在横轴,称为柱形图2021/8/17分类数据的图示条形图(例题分析)15119690481216频数可口可乐旭日升冰茶百事可乐汇源果汁露露品牌不同品牌饮料的频数分布不同品牌饮料的频数分布2021/8/17分类数据的图示饼图(pie Chart)1.也称圆形图,是用圆形及圆内扇形的角度来表示数值大小的图形2.主要用于表示总体或样本中各组成部分所占的比例,对于研究结构性问题十分有用3.绘制圆形图时,总体中各部分所占的百分比用园内的各个扇形角度表示,这些扇形的中心角度,是按各部分数据百分比占3600的相应比例确定
28、的2021/8/17分类数据的图示饼图(例题分析)不同品牌饮料的构成不同品牌饮料的构成可口可乐30%旭日升冰茶22%汇源果汁12%百事可乐18%露露18%2021/8/17顺序数据的整理与图示2021/8/17顺序数据的整理(可计算的指标)v1.累积频数累积频数(cumulative frequencies):各类别频数的逐级累加v2.累积频率累积频率(cumulative percentages):各类别频率(百分比)的逐级累加2021/8/17顺序数据的频数分布表(例题分析)甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数(户户)百分
29、比百分比(%)向上累积向上累积 向下累积向下累积 户数户数(户户)百分比百分比(%)户数户数(户户)百分比百分比(%)非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意24108934530836311510241322252703008.044.075.090.0100.03002761687530100.092562510合计合计300100.02021/8/17顺序数据的频数分布表(例题分析)乙城市家庭对住房状况评价的频数分布乙城市家庭对住房状况评价的频数分布回答类别回答类别乙城市乙城市户数户数(户户)百分比百分比(%)向上累积向上累积 向下累积向下累积 户数户数(
30、户户)百分比百分比(%)户数户数(户户)百分比百分比(%)非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意21997864387.033.026.021.312.7211201982623007.040.066.087.3100.030027918010238100.093.060.034.012.7合计合计300100.02021/8/17顺序数据的图示累计频数分布图(例题分析)243001322252700100200300400 非常不满意 不满意 一般 满意 非常满意累积户数(户)(a)向上累积向上累积27616830300750100200300400 非常不
31、满意 不满意 一般 满意 非常满意累积户数(户)(b)向上累积向上累积2021/8/17环形图(annular chart)1.环形图中间有一个“空洞”,总体中的每一部分数据用环中的一段表示2.环形图与圆形图类似,但又有区别圆形图只能显示一个总体各部分所占的比例环形图则可以同时绘制多个总体的数据系列,每一个总体的数据系列为一个环3.环形图可用于结构比较研究 4.环形图主要用于展示分类和顺序数据2021/8/17环形图(例题分析)8%36%31%15%7%33%26%21%13%10%非常不满意 不满意 一般 满意 非常满意 甲乙两城市家庭对住房状况的评价甲乙两城市家庭对住房状况的评价2021/
32、8/17一一.数据分组数据分组二二.数值型数据的图示数值型数据的图示2021/8/17频数分布表的编制(例题分析)2021/8/17频数分布表的编制(步骤)1.确定组数:根据 Sturges 提出的经验公式得组数K为:108)2lg()120lg(1K2021/8/17等距分组表(上下组限重叠)2021/8/17等距分组表(上下组限间断)2021/8/17等距分组表(使用开口组)2021/8/17组距分组与不等距分组(在表现频数分布上的差异)1.等距分组各组频数的分布不受组距大小的影响可直接根据绝对频数来观察频数分布的特征2.不等距分组各组频数的分布受组距大小不同的影响各组绝对频数的多少不能反
33、映频数分布的实际状况需要用频数密度(频数密度=频数/组距)反映频数分布的实际状况2021/8/17数值型数据的图示2021/8/17分组数据直方图(histogram)1.用矩形的宽度和高度来表示频数分布的图形,实际上是用矩形的面积面积来表示各组的频数分布2.在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图3.直方图下的总面积等于12021/8/17分组数据的图示(直方图的绘制)直方图下的面积之和等于12021/8/17分组数据直方图(直方图与条形图的区别)1.条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的2.直
34、方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义3.直方图的各矩形通常是连续排列,条形图则是分开排列4.条形图主要用于展示分类数据,直方图则主要用于展示数值型数据2021/8/17分组数据折线图(frequency polygon)1.折线图也称频数多边形图2.是在直方图的基础上,把直方图顶部的中点(组中值)用直线连接起来,再把原来的直方图抹掉3.折线图的两个终点要与横轴相交,具体的做法是第一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴折线图下所围成的面积与直方图的面积相
35、等,二者所表示的频数分布是一致的2021/8/17分组数据的图示(折线图的绘制)折线图与直方图下的面积相等!2021/8/17数值型数据的图示2021/8/17未分组数据茎叶图(stem-and-leaf display)1.用于显示未分组的原始数据的分布2.由“茎”和“叶”两部分构成,其图形是由数字组成的3.以该组数据的高位数值作树茎,低位数字作树叶4.树叶上只保留一位数字5.对于n(20 n 300)个数据,茎叶图最大行数不超过v L=10 lg(n)v6.茎叶图类似于横置的直方图,但又有区别直方图可观察一组数据的分布状况,但没有给出具体的数值茎叶图既能给出数据的分布状况,又能给出每一个原
36、始数值,保留了原始数据的信息2021/8/17未分组数据茎叶图(例题分析)2021/8/17未分组数据茎叶图(扩展的茎叶图)2021/8/17未分组数据箱线图(box plot)1.用于显示未分组的原始数据的分布2.箱线图由一组数据的5个特征值绘制而成,它由一个箱子和两条线段组成3.其绘制方法是:首先找出一组数据的5个特征值,即最大值最大值、最最小值小值、中位数中位数Me 和两个四分位数四分位数(下四分位数QL和上四分位数QU)连接两个四分(位)数画出箱子,再将两个极值点与箱子相连接 2021/8/17未分组数据单批数据箱线图(箱线图的构成)2021/8/17未分组数据单批数据箱线图(例题分析
37、)2021/8/17分布的形状与箱线图2021/8/17未分组数据多批数据箱线图(例题分析)11名学生各科的考试成绩数据名学生各科的考试成绩数据课程名称课程名称学生编号学生编号1234567891011英语英语经济数学经济数学西方经济学西方经济学市场营销学市场营销学财务管理财务管理基础会计学基础会计学统计学统计学计算机应用基础计算机应用基础766593746870558590958187757391789751768570926881717488698465739570786690737884709363798060878167869183777690708283829284817069727
38、875789188669480857186746879628181557870756871772021/8/17未分组数据多批数据箱线图(例题分析)Min-Max25%-75%Median value455565758595105英语经济数学西方经济学市场营销学财务管理基础会计学统计学计算机应用基础2021/8/17Min-Max25%-75%Median value455565758595105学生1学生2学生3学生4学生5学生6学生7学生8学生9学生10学生11未分组数据多批数据箱线图(例题分析)2021/8/17数值型数据的图示2021/8/17时间序列数据线图(line plot)v
39、绘制线图时应注意以下几点绘制线图时应注意以下几点1.时间一般绘在横轴,指标数据绘在纵轴2.图形的长宽比例要适当,其长宽比例大致为10:73.一般情况下,纵轴数据下端应从“0”开始,以便于比较。数据与“0”之间的间距过大时,可以采取折断的符号将纵轴折断2021/8/17时间序列数据线图(例题分析)19912000年城乡居民家庭人均收入年城乡居民家庭人均收入年份年份城镇居民城镇居民农村居民农村居民19911992199319941995199619971998199920001700.62026.62577.43496.24283.04838.95160.35425.15854.06280.070
40、8.6 784.0 921.61221.01577.71926.12091.12162.02210.32254.42021/8/17时间序列数据线图(例题分析)城乡居民家庭人均收入 城乡居民家庭人均收入020004000600080001991199219931994199519961997199819992000年份收入城镇居民农村居民2021/8/17数值型数据的图示2021/8/171.显示多个变量的图示方法2.在显示或对比各变量的数值总和时十分有用3.假定各变量的取值具有相同的正负号,总的绝对值与图形所围成的区域成正比4.可用于研究多个样本之间的相似程度多变量数据雷达图(radar c
41、hart)2021/8/17v 设有n组样本S1,S2,Sn,每个样本测得P个变量X1,X2,Xp,要绘制这P个变量的雷达图,其具体做法是多变量数据雷达图(雷达图的制作)2021/8/17多变量数据雷达图(例题分析)2000年城乡居民家庭平均每人生活消费支出构成年城乡居民家庭平均每人生活消费支出构成(%)项项 目目城镇居民城镇居民农村居民农村居民 食品食品 衣着衣着 家庭设备用品及服务家庭设备用品及服务 医疗保健医疗保健 交通通讯交通通讯 娱乐教育文化服务娱乐教育文化服务 居住居住 杂项商品与服务杂项商品与服务39.1810.018.796.367.9012.5610.015.17 49.30
42、5.754.525.245.5811.1815.473.142021/8/17多变量数据雷达图(例题分析)2000年城乡居民家庭人均消费支出构成2000年城乡居民家庭人均消费支出构成01020304050食品衣着家庭设备用品及服务医疗保健交通通讯娱乐教育文化服务居住杂项商品与服务城镇居民 农村居民2021/8/17数据类型及图示(小结)条条 形形 图图 饼饼 图图 环环 形形 图图汇汇 总总 表表品品 质质 数数 据据直直 方方 图图折折 线线 图图分分 组组 数数 据据茎茎 叶叶 图图箱箱 线线 图图原原 始始 数数 据据线线 图图时时 序序 数数 据据雷雷 达达 图图多多 元元 数数 据据
43、数数 值值 型型 数数 据据数数 据据 的的 类类 型型2021/8/17频数分布的类型2021/8/17频数分布的类型2021/8/172.6 统计表一一.统计表的构成统计表的构成二二.统计表的设计统计表的设计2021/8/17统计表的结构19992000年城镇居民家庭抽样调查资料年城镇居民家庭抽样调查资料项目项目单位单位1999年年 2000年年 调查户数调查户数 平均每户家庭人口平均每户家庭人口 平均每户就业人口平均每户就业人口 平均每户就业面平均每户就业面 平均一就业者负担人数平均一就业者负担人数 平均每人全部年收入平均每人全部年收入 可支配收入可支配收入 平均每人消费性支出平均每人消
44、费性支出户户人人人人%元元元元元元元元 400443.141.7756.431.775888.775854.024615.91 4222.0 3.13 1.68 53.67 1.86 6316.81 6279.98 4998.00资料来源:中国统计年鉴2001,中国统计出版社,2001,第305页。注:本表为城市和县城的城镇居民家庭抽样调查材料。2021/8/171.合理安排统计表的结构2.总标题内容应满足3W 要求(When、Where、What)3.数据计量单位相同时,可放在表的右上角标明,不同时应放在每个指标后或单列出一列标明4.表中的上下两条横线一般用粗线,其他线用细线5.通常情况下,统计表的左右两边不封口6.表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统一7.对于没有数字的表格单元,一般用“”表示8.必要时可在表的下方加上注释统计表的设计2021/8/17统计表的设计(比较与选用)2021/8/17统计表的设计(比较与选用)2021/8/17统计表的设计(比较与选用)2021/8/17结结 束束2021/8/17