1、第第 一一 章章 导导 论论 统计是什么?统计是什么?我们接触过吗?我们接触过吗?提起统计大家会想到什么?提起统计大家会想到什么?请大家举出与统计有关的例子请大家举出与统计有关的例子第一章 统计学的概念我们经常在报刊中看到以下叙述:我们经常在报刊中看到以下叙述:n新住房的销售速度是每年703000套。n原油的平均价格是每桶17.37美元。n失业率下降到5.9%。n通用汽车37%的销售额来自于北美地区。n道-琼斯工业股平均指数接近8909.43点。n主要航空公司中1997年最好的正点记录是西北航空公司81.9%的正点率。n2006年我国进出口总额达到5098亿美元,是1989年的4.6倍,年均增
2、长13.6%,远高于同期世界贸易6.1%的增长水平,也超过我国国内生产总值9.3%的增速。n2006年我国实际吸收外资469亿美元,比1989年增长了12.8倍,年均增速达24%。13年来全国累计实际使用外资超过4000亿美元,占改革开放以来吸收外资总额的97%以上。据中国人民银行的最新统计数字,2006年1月份,我国企业商品价格总水平环比上涨0.7%,同比上涨0.6%。其中投资品价格环比上升0.7%,同比上涨1.3%;消费品价格环比上升0.9%,同比下降1%。 中新网2002年10月10日电 日本东京股市周四再受重挫。日经指数下跌1.17%,收盘报8,439.62点,为自1983年6月10日
3、以来的最低点位,同时也再次刷新周三所创下最低纪录。 20032003年年2 2月月2121日深沪股市行情日深沪股市行情n上海综合指数今日以上海综合指数今日以1508.081508.08点开盘,最高点开盘,最高1508.131508.13点,最点,最低低1476.421476.42点,报收于点,报收于1478.871478.87点,跌点,跌30.6130.61点,成交点,成交 817201.8 817201.8万元。上涨家数为万元。上涨家数为2727,平盘家数为,平盘家数为1414,下跌家数为,下跌家数为749749。n深证成份指数今日以深证成份指数今日以3040.873040.87点开盘,最高
4、点开盘,最高3040.873040.87点,最点,最低低2984.672984.67点,报收于点,报收于2990.012990.01点,跌点,跌51.8951.89点,成交点,成交501782.7501782.7亿元。上涨家数为亿元。上涨家数为3030,平盘家数为,平盘家数为1414,下跌家数,下跌家数为为588588。究竟什么是统计? 统计是以数据为食物的动物统计是以数据为食物的动物 统计的本业是消化数据,并产生有统计的本业是消化数据,并产生有营养的结果。它的本质,和母牛相营养的结果。它的本质,和母牛相差不多。差不多。 Data Statistics Information GrassCow
5、Milk统计的三种含义统计工作统计工作统计数据统计数据统计学统计学对统计数据进行搜集、整理、分析的过程对统计数据进行搜集、整理、分析的过程。统计工作产生的结果,用以描述所研究统计工作产生的结果,用以描述所研究现象的属性和特征。现象的属性和特征。如:统计图表、统计分析报告、如:统计图表、统计分析报告、统计资料汇编、统计年鉴等统计资料汇编、统计年鉴等是一门研究总体数量特征的方法论科学,是一门研究总体数量特征的方法论科学,它来源于统计工作,又反过来指导统计工作它来源于统计工作,又反过来指导统计工作统计学概念举例n统计学是关于数据资料的搜集、整理、显示分析统计学是关于数据资料的搜集、整理、显示分析和推
6、论的科学,目的在于帮助人们做出更有效的和推论的科学,目的在于帮助人们做出更有效的决定;决定;n统计学是一门关于大量数据资料的搜集、整理、统计学是一门关于大量数据资料的搜集、整理、描述和分析的学科,目的在于探索数据内在的数描述和分析的学科,目的在于探索数据内在的数量规律性;量规律性;n统计学是在面对不确定情况下,提供人们做出聪统计学是在面对不确定情况下,提供人们做出聪明决策的科学方法,其过程包括资料的搜集、整明决策的科学方法,其过程包括资料的搜集、整理、陈列、解释和分析,并可进而加以推论,从理、陈列、解释和分析,并可进而加以推论,从而可获得合理的推断与有效的结论而可获得合理的推断与有效的结论统计
7、学特征n统计学研究的对象是群体现象;统计学研究的对象是群体现象;n统计学探索的是群体现象数量表现的规律性统计学探索的是群体现象数量表现的规律性数量性数量性规律性规律性n统计学要对群体现象的数量特征进行描述、分析、统计学要对群体现象的数量特征进行描述、分析、推论推论统计学的分类统计学的分类n描述统计学描述统计学(Descriptive StatisticsDescriptive Statistics) 用图形、表格和数值方法用图形、表格和数值方法来汇总数据的统计学。来汇总数据的统计学。n推断统计学推断统计学(Inference StatisticsInference Statistics) 用样
8、本数据对总体的某些用样本数据对总体的某些特征进行估计和假设检验的特征进行估计和假设检验的统计学。统计学。描述统计学举例交易所频数百分比()NYSE312AMEX520OTC1768总计25100某企业年产量趋势图描述统计学举例总体单位总体单位调查单位调查单位可以全面调查,但可以全面调查,但通常是调查限定规通常是调查限定规模以上的总体单位模以上的总体单位推断统计学举例描述统计与推断统计的关系第二节 统计数据n什么是统计数据什么是统计数据n对现象进行计量的结果对现象进行计量的结果 n不是指单个的数字,而是由多个数据构成的数据不是指单个的数字,而是由多个数据构成的数据集集 n不仅仅是指数字,它可以是
9、数字的,也可以是文不仅仅是指数字,它可以是数字的,也可以是文字的字的 统计数据分类调查数据调查数据实验数据实验数据定类数据定类数据定序数据定序数据定距数据定距数据定比数据定比数据按计量层次按计量层次按收集方法按收集方法按时间状况按时间状况 截面数据截面数据时间序列数据时间序列数据定定类类尺尺度度按现象性质差异进行的辨别按现象性质差异进行的辨别与区分。测量结果形成定类与区分。测量结果形成定类变量或定类指标。变量或定类指标。定类变量或指标确切的值是定类变量或指标确切的值是以文字表述的,可以用数值以文字表述的,可以用数值标识,但仅起标签作用。标识,但仅起标签作用。定类变量或指标的各类别间定类变量或指
10、标的各类别间是平等的,没有高低、大小、是平等的,没有高低、大小、优劣之分。优劣之分。性别性别种族种族运动项目运动项目定定序序尺尺度度对现象顺序差异进行的辨别对现象顺序差异进行的辨别与区分。测量结果形成定序与区分。测量结果形成定序变量或定序指标。变量或定序指标。定序变量或指标确切的值是定序变量或指标确切的值是以文字表述的,也可以用数以文字表述的,也可以用数值标识,也仅起标签作用。值标识,也仅起标签作用。定序变量或指标各类别间有定序变量或指标各类别间有高低优劣之分,不能随意排高低优劣之分,不能随意排列,但差异无法准确计量。列,但差异无法准确计量。大学生大学生中学生中学生小学生小学生定定距距尺尺度度
11、按现象绝对数量差异进行的按现象绝对数量差异进行的辨别与区分。测量结果形成辨别与区分。测量结果形成定距变量或定距指标。定距变量或定距指标。定距变量或指标的值以数字定距变量或指标的值以数字表述,有计量单位,可以进表述,有计量单位,可以进行加减运算。行加减运算。定距变量或指标各类别间自定距变量或指标各类别间自然有大小之分,但没有绝对然有大小之分,但没有绝对的零点,不能进行乘除运算。的零点,不能进行乘除运算。天气预报:沈阳:最高温度天气预报:沈阳:最高温度33,最低,最低77 大连:最高温度大连:最高温度66,最低,最低22两地最高温度相差两地最高温度相差33沈阳最低温度较大连最低温度低沈阳最低温度较
12、大连最低温度低55大连最高温度是沈阳最高温度的大连最高温度是沈阳最高温度的2 2倍倍 温度温度时间起点时间起点公元公元 2003 2003 年年?19711971年出生年出生 3232岁岁19861986年出生年出生 1717岁岁甲甲乙乙二人年龄二人年龄 之差:之差:198619861971=151971=15岁岁 或或 323217=1517=15岁岁二人年龄之比:二人年龄之比:323217=1.882417=1.8824(倍)(倍) 198619861971=1.00761971=1.0076(倍)(倍) 定定比比尺尺度度对现象绝对差异与相对差异对现象绝对差异与相对差异进行的辨别与区分。测
13、量结进行的辨别与区分。测量结果形成定比变量或定比指标。果形成定比变量或定比指标。定比变量或指标确切的值也定比变量或指标确切的值也以数字表述,有计量单位以数字表述,有计量单位 ,可以进行加减运算。可以进行加减运算。定比变量或指标有绝对意义定比变量或指标有绝对意义上的零点,既可以加减运算,上的零点,既可以加减运算,也可以乘除运算。也可以乘除运算。零高度零高度零重量零重量零体积零体积零面积零面积零人口零人口零产量零产量零资产零资产真正的零:真正的零:一无所有一无所有数据度量尺度数据度量尺度Data Measured by ScalesData Measured by Scales3. 定距尺度定距尺
14、度Interval 没有真正的零点没有真正的零点 例如,例如,温度温度4. 定比尺度定比尺度Ratio 存在真正的零点存在真正的零点 倍数有意义倍数有意义例,身高、体重例,身高、体重1. 定类尺度定类尺度Nominal 无等级次序排列无等级次序排列 例如:男例如:男-女女从事工作的行业从事工作的行业2. 定序尺度定序尺度Ordinal 可作等级次序排列可作等级次序排列 例如:公司职位例如:公司职位产品满意度产品满意度数据度量与信息含量数据度量与信息含量Data Measurement and InformationData Measurement and Information 度量尺度的信息
15、含量度量尺度的信息含量由弱到强由弱到强排列:排列:定类尺度定类尺度定序尺度定序尺度定距尺度定距尺度定比尺度定比尺度 定类尺度和定序尺度用于定类尺度和定序尺度用于属性属性数据数据信息量低信息量低 定距尺度定距尺度和和定比尺度用于定比尺度用于数值数值数据数据信息量高信息量高统计数据的其他常见分类统计数据的其他常见分类 反映每一个体属性的标签或者名称。反映每一个体属性的标签或者名称。可以用定类尺度,也可以用定序尺度度量可以用定类尺度,也可以用定序尺度度量品质型数据品质型数据数值型数据数值型数据是表示大小多少的数值。是表示大小多少的数值。可以用定居尺度也可用定比尺度度量可以用定居尺度也可用定比尺度度量
16、统计数据的其他常见分类统计数据的其他常见分类 离散型的数据是可列的。离散型的数据是可列的。在统计中,离散型数据取整数。在统计中,离散型数据取整数。离散型变量离散型变量连续型变量连续型变量连续型的数据可以取介于两个连续型的数据可以取介于两个 数值之间的任意数值数值之间的任意数值品质型数据只能是离散的;数值型数据可以是品质型数据只能是离散的;数值型数据可以是离散的,也可以是连续的。离散的,也可以是连续的。有些连续型变量在具体整理分析时,有些连续型变量在具体整理分析时,可以进行离散化处理可以进行离散化处理思考题思考题 Thinking ChallengeThinking Challenge它们是属性
17、数据还是数值数据?它们是属性数据还是数值数据? 是离散的还是连续的是离散的还是连续的? ?属于哪一种度量尺度属于哪一种度量尺度? ?3. 兄弟姐妹个数兄弟姐妹个数0-1, 2-3, 4+4. 成绩成绩A, B, C 1. 汽车速度汽车速度78, 64, 452. 温度温度 C C78, 64, 85统计数据的分类统计数据的分类( (按收集方法按收集方法) )1 调查的数据(observational data) n通过调查或观测而收集到的数据n在没有对事物人为控制的条件下而得到的n有关社会经济现象的统计数据几乎都是观测数据2 试验的数据(experimental data) n在试验中控制试验
18、对象而收集到的数据n比如,对一种新药疗效的试验,对一种新的农作物品种的试验等n自然科学领域的数据大多数都为试验数据统计数据的分类(按时间状况)1.1.截面数据截面数据(cross-sectional data) n在相同或近似相同的时间点上收集的数据n描述现象在某一时刻的变化情况n比如,2002年我国各地区的国内生产总值数据2.2.时间序列数据时间序列数据(time series data) n在不同时间上收集到的数据n描述现象随时间变化的情况n比如,1996年至2002年国内生产总值数据截面数据与时间序列数据截面数据与时间序列数据举例举例截面数据与时间序列数据截面数据与时间序列数据举例举例统
19、计数据来源统计数据来源间接来源:间接来源:系统外部数据系统外部数据系统内部数据系统内部数据直接来源:直接来源:调查数据调查数据实验数据实验数据统计数据统计数据系统外部的数据中国统计出版社1.1.统计部门和政府部门公布的有关资料,如各统计部门和政府部门公布的有关资料,如各类统计年鉴类统计年鉴2.2.各类经济信息中心、信息咨询机构、专业调各类经济信息中心、信息咨询机构、专业调查机构等提供的数据查机构等提供的数据3.3.各类专业期刊、报纸、书籍所提供的资料各类专业期刊、报纸、书籍所提供的资料4.4.各种会议,如博览会、展销会、交易会及专各种会议,如博览会、展销会、交易会及专业性、学术性研讨会上交流的
20、有关资料业性、学术性研讨会上交流的有关资料5.5.从互联网或图书馆查阅到的相关资料从互联网或图书馆查阅到的相关资料 系统内部的数据中国统计出版社1.1.业务资料,如与业务经营活动有业务资料,如与业务经营活动有关的各种单据,记录关的各种单据,记录2.2.经营活动过程中的各种统计报表经营活动过程中的各种统计报表3.3.各种财务,会计核算和分析资料各种财务,会计核算和分析资料等等第四节第四节 统计学中的一些基本概念统计学中的一些基本概念总体和总体单位总体和总体单位标志和指标标志和指标统计总体和总体单位统计总体和总体单位总体、总体单位总体、总体单位总体、总体单位总体、总体单位总体或总体单位的区分不是固
21、定的:同一个总体或总体单位的区分不是固定的:同一个研究对象,在一种情况下是总体,在另一种研究对象,在一种情况下是总体,在另一种情况下可能成了总体单位。情况下可能成了总体单位。品质标志品质标志数量标志数量标志标志和指标标志和指标统计指标统计指标标志和指标标志和指标统计指标一般包括六个要素:指标名称、计量单位、统计指标一般包括六个要素:指标名称、计量单位、计量方法、时间限制、空间限制、指标数值计量方法、时间限制、空间限制、指标数值 统计指标特点:数量性;综合性;具体性统计指标特点:数量性;综合性;具体性统计指标的分类统计指标统计指标统计指标统计指标数量指标质量指标绝对数指标相对数指标平均数指标数量
22、指标是反映社会经济现象发展总规模、总水平或工作总量的统计指标 ,用绝对数表示质量指标是反映社会经济现象发展相对水平或工作总量的统计指标,用平均数或相对数表示。 它们从不同角度反映总体的综合数量特征。它们从不同角度反映总体的综合数量特征。数量指标是计算质量指标的基础,数量指标是计算质量指标的基础,而质量指标往往是相应的数量指标进行对比的结果。而质量指标往往是相应的数量指标进行对比的结果。 标志和指标的关系标志和指标的关系联系联系区别区别汇总关系:指标值是由众多的总体单位的汇总关系:指标值是由众多的总体单位的数量标志值汇总而来的数量标志值汇总而来的转换关系:取决于总体和总体单位之间的转换,转换关系
23、:取决于总体和总体单位之间的转换,总体单位转换为总体时,数量标志也转换为指标总体单位转换为总体时,数量标志也转换为指标说明对象不同。指标是说明总体特征的,说明对象不同。指标是说明总体特征的,而标志是说明总体单位特征的而标志是说明总体单位特征的表现形式不同:统计指标都是用数值表示的,表现形式不同:统计指标都是用数值表示的,而统计标志可以用数值表示也可用文字表示而统计标志可以用数值表示也可用文字表示指标名称指标名称指标值指标值标志名称标志名称标志值标志值工业企业工业企业总数总数1千万千万工业企业工业企业职工数职工数3亿人亿人某企业某企业职工数职工数7000人人工业总产值工业总产值5千亿千亿某企业某
24、企业总产值总产值8000万万平均工资平均工资7000元元/年人年人某企业平均某企业平均工资工资5500元元/年人年人总体工业企业 总体单位每个工业企业总体总体总体单位总体单位指标指标数量标志数量标志条件:研究目的不同条件:研究目的不同转换转换转换转换变异与变量变异与变量变异变异变异是指标表现在各总体单位之间的变化现象变异是指标表现在各总体单位之间的变化现象属性变异:品质标志的标志值变化属性变异:品质标志的标志值变化数量变异:数量标志的标志值变化数量变异:数量标志的标志值变化变量变量将可变的数量标志称为变量,将可变的数量标志称为变量,不变的数量标志称为常量不变的数量标志称为常量变量值为变量的具体数值表现变量值为变量的具体数值表现离散变量离散变量连续变量连续变量确定性变量:变量的值受某些确定性因素影响,确定性变量:变量的值受某些确定性因素影响, 其变化能够事先确定其变化能够事先确定随机性变量随机性变量:变量的值受某些不确定因素影响,事先无法确定变量的值受某些不确定因素影响,事先无法确定