1、自考数量方法课件演示文稿第一部分:各讲学习概要v第一章:数据的整理与描述v第二章:随机事件及其概率v第三章:随机变量及其分布v第四章:抽样方法与抽样分布v第五章:参数估计v第六章:假设检验v第七章:相关分析与回归分析v第八章:时间数列分析v第九章:指数第一章 数据整理与描述 在商务管理和金融管理中,对数据进行收集、分析、列示和解释的一个主要原因,是它可以使经理和决策者们更好地理解商业和经济环境,得到更多的信息,做出更好的决策。在当代全球性商务和经济环境中,最成功的管理者和决策者,是那些能够理解和有效地运用数据信息的人。v(一)会计 当会计师事务所为其客户进行审计时,他们要利用抽样方法。例如,假
2、定一家会计师事务所想要确定某客户资产负债表中所显示的应收账款余额是否公允地反映了其真实的应收账款余额。通常,审计人员抽取一个样本。在对被抽取账户的正确性进行了审查后,审计人员就可以得出关于该客户资产负债表中所列示的应收账款余额是否属实的结论。v(二)金融 金融顾问们利用各种数据来引导投资。拿股票投资来说,顾问们检查包括市盈率和红利在内的一系列金融数据。通过将某只个股的数据与股票市场平均数进行比较,金融顾问们就能够判断该只股票的价值是被高估还是低估了。将帮助顾问们做出买入、卖出还是继续持有该股的建议。v(三)经济 人们经常要求经济学家们对将来的经济以及其他方面进行预测。在进行这些预测时,他们要用
3、到各种各样的统计信息。例如,在预测通货膨胀率时,经济学家们就要用到诸如生产者价格指数、失业率和生产利用能力等方面的统计住处通常这些统计住处指标被输入到计算预测模型中来预测通货膨胀率。根据描述事物所采用的不同度量尺度,数据可分为分类型数据和数量型数据。分类型数据描述的是事物的品质特征。例如,人的性别、民族、职业等。数量型数据说明的是事物的数量特征。例如,产品的产量和寿命、企业的营业额、股票的价格、产品的市场占有率、国民总产值、国家的人口等等,都是数量型数据。数量型数据用数值形式表示。第一节 数据的类型 数据按照被描述的对象与时间的关系分为截面数据、时间序列数据与平行数据。截面数据描述的是事物在某
4、一时刻的变化情况,即所谓横向数据。时间序列数据描述的是事物在一定的时间范围内的变化情况,即所谓纵向数据。平行数据是截面数据与时间序列数据的组合。在统计中,我们把对事物现象特征的描述称为变量。如果它是分类型数据,称为分类型变量;如果它是数量型数据,则称为数量型变量。很多情况下,我们所研究的变量都是数量型变量,大多数的统计分析方法也都是对于数量型变量的分析,因此有时把数量型变量简称为变量。(一)数据的分组与频率直方图 统计分组是数据整理的一项初步工作,它是根据实际需要,将数据按照数据的某种特征或标准分成不同的组别。按照数据的某种特征对数据进行分组后,再计算出所有类别或数据在各组中出现的次数或频数,
5、就形成了频数分布表。我们称全部数据在各组内的分配状况为数据的频数分布,分配在各组内的数据个数为频数,频数与全体数据个数之比称为频率。分类型数据按类计算出各类的频数或频率,就形成了频数或频率分布表。分类型数据按类分组时,一定要注意既不能重数也不能漏数,这应要求所有类别必须有明确的界定。对于数量型数据,我们只简单介绍两种方法单变量值分组法和组距分组法。第二节 数据的整理与图表显示 单变量值分组法就是把每一个变量值作为一个组。v例:某单位有职工20人,下面是六月份该单位职工请假天数的记录:0,0,1,0,2,1,0,0,0,1,2,0,5,1,1,0,0,0,10,0 观察这个记录,我们不难发现,所
6、有不同的请假天数一共只有5个,即0、1、2、5和10。因此,采用单变量值分组方法分组的话,应该发成5个组。请假天数 频数(人)频率(%)累积频率(%)0 11 55 55 1 5 25 80 2 2 10 90 5 1 5 95 10 1 5 100 合计 20 100 在数据较多且比较分散的情况下,单变量值分组法由于组数过多,不便于观察数据的分布特征和规律。因此,单变量值分组方法适用于数据较少或分布比较集中的情形。对于变量值较多的情况,可以采用组距分组法。确定组数的一般原则为:数据个数n 分组数 50以下 56 50100 610 100250 712 250以上 10203.2.1阅读面试
7、记录投影下图:3、如果触电人倒卧的地面上有水或潮湿,因为水或潮湿的地面导电,所以千万不能踩踏。要穿上厚胶底鞋或站在干的厚书本、厚报纸上,用上述2的办法救助。小提示98:为避免混乱,需要与应聘者书面确认工作待遇。面试的座位安排有几种不同的方式。面对面的坐比较正式,而肩并肩坐会创造一种更随意、更合作的气氛。如果面试是面对面的,中间最好放一张桌子,因为应聘者的膝部暴露在你的视线之内会使他们感到尴尬和脆弱。除非你故意安排,否则不要让应聘者坐在比你的椅子矮的椅子上,这样会让他们感觉自惭形秽而且不自在。7成交资讯 第四个,怎样管理来店的客户;教学过程:小提示64:被面试者紧张时,你自己需要保持镇静。4、同
8、学们,如何吃蔬菜可是一门大学问,你们知道吗?稍不留神,也会造成中毒,甚至危害生命。教学要求:第二,客户担心他的要求和想法不能得到满足,这也很正常。比如,客户要求现货交易,而有的时候专卖店没有现货,客户不得不等两天,有时客户需要的颜色也没有,要等两天;客户有时还会要求价格再降低一些,有的时候也不能够得到满足。我国各地区2000年死亡率频率分布表组号 分组界限 频数 频率(%)组中值 1 4.9,5.6)3 10.00 5.25 2 5.6,6.3)8 26.67 5.95 3 6.3,7.0)12 40.00 6.65 4 7.0,7.7)5 16.67 7.35 5 7.7,8.4)1 3.3
9、3 8.05 6 8.4,9.1 1 3.33 8.75v(二)、数据的图形显示 除去频率直方图以外,还有许多数据的图形显示方法。我们在这里主要介绍饼形图、条形图、柱形图、散点图、折线图、曲线图和茎叶图。v1.饼形图 饼形图一般用来描述和表现各成分或某一成分占全部的百分比。使用饼形图时必须注意以下三点:第一,饼形图中的成分最好不要多于6个,如果成分多于6个的话,一般的做法是从这些成分中选出5个最重要的,然后把剩下的成分全部合并成一个称做“其他”的成分。第二,各成分份额的和必须是100%。第三,成分比例必须与扇形区域的面积比例一致。本科专业饼型图45%26%12%17%工程人文与社科自然科学其他
10、v2.条形图和柱形图 条形图是用来对各项数据进行比较的。对于条形图来说,它的纵坐标没有尺度,只用来标注各项信息的名称,比如:国家、行业、公司等等。v例:2001年日本、美国、韩国和港澳台地区来某市旅游的人数(单位:10万人)如下:地区013245日本美国韩国港澳台v例:下表列出的是2004-2010年某市接待的旅游人数(包括外国人、华侨、港澳台胞)(单位:万人),用柱形图显示这些数据。年份2004200520062007200820092010人数10.0113.2117.4820.2720.2920.6921.89252015105004050607080910 2004-2010年某市接待
11、的旅游人数 v3.折线图 由柱形图,我们可以大致地看出纵坐标变量随横坐标变量变化的趋势。一个更明显的表示趋势的图示方法是折线图法。2004-2010年来某市旅游人数的折线图。折线图的优点是简单、容易理解,并且对于同一组数据,折线图具有唯一性(两点间有且只有一条直线)。92321171304050607080910v4.曲线图 商务和金融领域中许多事物不但其自身是逐渐变化的,而且连其变化的速度也是逐渐变化的。折线图虽然展示了变量间变化的趋势,但是我们不难发现,在各实心点处,数据变化的速度(线段的倾斜程度)会发生突变。曲线图弥补了折线图的这一不足,采用光滑的曲线段连接各实心点,形成一条整体光滑的曲
12、线。曲线图虽然有更加自然的特点,但是“光滑地连接各实心点”的方法很多,因此带有一定的随意性,即不是唯一的。v5.散点图 散点图一般表现两个变量之间的相互关系。两个变量的任何一对取值都在平面直角坐标系上代表一个点。在平面坐标系上将所有这样的点描画出来便形成了散点图。下面将介绍数据集中趋势(即数据集的中心位置)以及离散趋势(即数据集的分散程度)的各种度量。这些度量是反映数据集主要特点的一些综合数据,掌握这些方法的定义和优缺点就能使我们在大量的数据中抓住事物的本质,不至于毫无头绪地迷失在数据的海洋中。数据集中趋势主要介绍平均数,中位数,众数的定义(计算),以及它们的应用。v(一)、平均数v1.数据未
13、分组时(简单平均数)数据集中趋势的最常用的度量就是平均数,即若数据为,则这组数据的平均数,记为为:niinxnnxxxx1211第三节 数据集中趋势的度量v【例1】某工商管理硕士班30名学生“管理统计分析方法”课期末考试成绩如下:866584957269697063968773828885678186837772739370718290828787求他们的平均成绩。解:这些学生的平均成绩为 平均数的优点在于它容易理解,易于计算;它不偏不倚地对待数据集中的每一个数据;它是数据集的“重心”,即:如果我们在数轴上各数据点处放置一个单位的重量,则平均数所处的位置正好是平衡点。平均数的一个主要缺点是它对
14、极端值十分敏感。所谓极端值就是和数据集中大部分数据相比,特别大或特别小的那些(个别)数据。下面的例子说明了这一点。5.7930876586x职位实际收入(元)财务部经理60 000市场部经理325 000人事部经理45 000研发部经理70 000生产部经理55 000【例2】下表列出的是某公司中层干部2009年的实际收入:不难注意到,市场部经理的收入是一个极端值(与其他人的收入相比,它特别大)。我们来看看它对平均数的影响。解:如果计算上述5位经理的平均收入,得到 平均收入=111 000(元)但是,如果不考虑市场部经理的收入,只计算其余 4人的平均收入,则平均收入为57 500元。因此,市场
15、部经理收入的加入使得平均收入增加了近一倍。v2.分组数据的平均数(加权平均)前面我们已经讲过,一个数据集的平均数是数据集中全体数据的和除以数据的个数。但是如果数据是以频率分布表的形式出现的,我们就不知道每一个原始数据的数值。这时,我们可以利用频率分布表近似地计算平均数。具体做法是:平均数 v【例6】某大学管理学院管理科学与工程系有25名教师,下表是他们在该院任教年数的频率分布数据。求该系教师在该院任教的平均年数。fxf频数的和的和组中值(频数)任教年数人数组中值15年610年1115年1620年2125年2630年3135年95530123813182328332740655402866总和2
16、5 280 平均任教年数 (年)。不同的权重反映了数值所具有的不同重要性:重要的数据其权重比较大,不那么重要的数据其权重比较小。因此,分组数据的平均值就是把频数作为组中值的权重的加权平均。2.1125280v(二)、中位数 将数据集按上升顺序排列,位于数列正中间的数值成为该数据集的中位数。v【例3】以上例中的数据,计算全班期末考试成绩的中位数。解:将原数据按上升顺序排列,得到 63656769697070717272737377818282828384858686878787889093959682,82,301615xxn822828221615xx中位数 售后服务站外来的保有客户。比如,奔
17、驰汽车的维修站也会修沃尔沃、宝马车等,而这些客户也是我们开发的对象。(7)口、鼻、呼吸道烫伤后,要马上送到医院,在送医院的途中,要注意保持呼吸道通畅。客户在哪里,是专营店乃至每一个汽车销售人员所面临的一个非常重要的问题。对于这个产品和客户,我们应怎么去定位?走出去是指利用各种形式的广告、参加车展、召开新闻发布会、进行新车介绍、进行小区巡展、参加各类汽车文化活动、发送邮件、进行大客户的专访、参与政府或一些企业的招标采购等。(4)不闯红灯,拐弯减速慢行;不准双手离把,不准追逐打闹。【案例】小提示12:如果你在别的地方有理想人选,鼓励他们申请。教学目标:今天,我们仍要学习与大家健康有关的内容:食物中
18、毒的防和治。小提示74:询问内部应聘者要调换岗位的原因。收音机观察上图后可以发现,不管单线触电还是双线触电,都是人体直接或间接地与火线相连。那么我们如何来区分火线与零线呢?请大家通过看书来了解试电笔的结构及正确使用方法。并简单解释氖管发光的原理。想一想,如果高电阻丢失了,能不能任意用别的电阻来代替?v【例4】计算5位经理年收入的中位数。解:将5位经理的收入按上升顺序排列得到 45 000 55 000 60 000 70 000 325 000 则中位数为60 000。中位数将整个数据集一分为二,正好有一半的数据比中位数小,也正好有一半的数据比中位数大。从数据的个数来说,中位数正好位于数据集的
19、中间。用中位数描述数据的集中趋势的优点是它对极端值不像平均数那么敏感,因此,对于包含极端值的数据集来说,用中位数来描述集中趋势比用平均数更为恰当。v(三)、众数 众数是数据集中出现次数最多的数值。众数的英文是mode,它具有时尚、流行等含义,也就是说,有普及和常见的意思。众数的主要缺点是一个数据集可能没有众数,或众数可能不唯一,而数据集的平均数和中位数都是存在且唯一的。如果一个数据集中每一个数值都只出现一次,则该数据集没有众数;如果一个数据集中只有一个数值出现的次数最多,则该数据集具有唯一的众数;如果有两个数值出现的次数最多,则称该数据集具有双众数;如果有两个以上的数值出现的次数最多,则称该数
20、据集具有多众数。众数的优点在于它反映了数据集中最常见的数值,即最普遍的数值。众数的另一个优点是它不仅对数量型数据集(数据都是数值)有意义,它对分类型数据集也有意义,下面的例子可以说明这一点。v【例5】某房地产开发公司2010年售出的住房情况如下(单位:套):54615296五室两厅两卫四室两厅两卫三室两厅两卫两室一厅一卫求该数据集的众数。解:在这里,数据集不是数量型的,而是分类型的,并且已经按类分组。由于有152户购买了三室两厅两卫型住房,购买其他户型的住户都少于152,因此,三室两厅两卫户型是这组数据的众数。众数的另一个优点是能够告诉我们最普遍、最流行的款式、尺寸、色彩等产品特征,从而帮助我
21、们进行生产计划决策。如例5中,由于众数是“三室两厅两卫”,说明这一户型是当前最受欢迎的,在未来计划中应当考虑多建造三室两厅两卫户型的住房。【例7】为了考察灯泡质量,随机地从两种品牌的灯泡中各抽取了10只,测得寿命如下(单位:小时):品牌19951 0101 0059901 0159851 0101 0109751 005品牌21 0208901 1301 0509208701 1009301 0701 020 灯泡质量的一个重要指标就是灯泡的平均寿命。通过计算这两组灯泡的平均寿命都是1 000小时。因此,仅从平均寿命上看,这两组品牌的灯泡质量难分上下。但是不难发现,第一组灯泡的寿命数据变化幅度
22、不大,而第二组灯泡的寿命数据变化幅度很大,说明第二组灯泡的质量不如第一组那么稳定。从例子可以看出,一个数据集各数据的分散情况,或离散的程度是该数据集的另一个重要特征,为此,在这里介绍度量数据离散程度的几种方法,如方差、标准差。第四节 数据离散趋势的度量v(一)、极差 最简单、最直观的度量数据离散程度的方法或许应当是数据集中最大数值的差,称为极差(或全距),记为R,即:极差R=最大值最小值 很明显,极差越大,说明数据散布的范围越广,即数据越分散;极差越小,说明数据越集中。但是它也极易受极端值的影响。如果数据存在着极端值,极差就不能反映数据一般性的离散趋势,这是它的主要缺点。v(二)、四分位点和四
23、分位极差 四分位点是把数据集等分为四部分的那些数值。四分位点共有三个,分别称为第一四分位点(记为Q1),第二四分位点(记为Q2),第三四分位点(记为Q3)。在计算四分位点之前,应先将数据集按上升顺序重新排列。由四分位点的定义,我们知道,有25%的数据小于Q1,有25%的数据大于Q3。四分位点的定义是:第二四分位点Q2就是整个数据集的中位数;第一四分位点是所有小于Q2的数据所组成的数据集的中位数;第三四分位点是所有大于Q2的数据所组成的数据集的中位数。第三四分位点Q3与第一四分位点Q1的差Q3Q1称为四分位极差。也就是说有50%的数据散布在跨度为Q3-Q1的范围内。v【例8】某商场经理在分析近1
24、7周内收到的顾客投诉数据时,希望得到以下信息:星期1234567891011121314151617投诉次数13151091238497181671012615 (1)求四分位点,投诉次数15落在什么范围?(2)求四分位极差。解:(1)首先将数据按上升顺序重新排列,然后计算四分位点。排列后的数据为:3 4 6 7 7 8 9 9 10 12 10 12 13 15 15 1 6 18 即Q1=7,Q2=10,Q3=14。投诉次数15落在上25%(大于Q3)的范围内。(2)四分位极差Q3Q1=147=7。v(三)、方差和标准差 方差记为)()()(1222212xxxxxxnn21)(1xxni
25、niv例如例7中两组灯泡寿命的方差分别为 10121 (995-1 000)2+(1 010-1 000)2+(1 005-1 000)2=15510122 (1020-1 000)2+(890-1 000)2+(1 020-1 000)2=7 540 很显然,远大于 ,说明第二组灯泡寿命的分散程度大于第一组灯泡。注意到灯泡寿命方差的单位为平方小时,为了使离散度量的单位与原数据一致,我们令22212并称为标准差。第一组灯泡寿命的标准差=12.45(小时)第二组灯泡寿命的标准差=86.83(小时)(四)、变异系数 前面讲到的方差、标准差、极差和四分位极差都只能用来比较同一属性(具有相同单位)的两
26、组数据的离散程度,特别是当两组数据的平均数相等时,我们可以直接用方差或标准差说明数据的离散程度,。但是,如果两组数据具有不同的平均数,我们就不能直接用方差或标准差进行比较,因为方差(标准差)是根据平均数计算出来的,它是数据本身的离散程度有关,还与平均数的大小有关。此时,应当计算变异系数。变异系数是标准差与平均数的比值,即 表示数据相对于其平均数的分散程度。【例10】某工厂生产两种包装的儿童膨化食品,一种是规定净重50克的小袋装,另一种是规定净重500克的大袋装。每种包装各取10袋测得其实际净重如下:%100 xV%100 xV小 袋装49485053484952515150大 袋装510498
27、496493505508515490510502 由以上数据可以计算出:小袋装平均净重为50.1克,标准差为1.663 3克;大袋装平均净重为502.7克,标准差为8.260 3克。从标准差的比较来看,我们可以认为大袋装是食品净重变化比较大。但是,大袋装平均净重几乎是小袋装平均净重的10倍,如果两种包装的离散程度相同,大袋装食品净重的标准差应当是小袋装净重标准差的10倍。所以,这时用标准差作为衡量两种包装净重的离散程度谁大谁小,就不合理了。若采用变异系数,计算结果为:小袋装食品净重的变异系数 3.32%1.506633.1小V5.个人办公桌上的钥匙要随身携带,人离时注意关锁门窗。有报警器装置的
28、要接通电源,并落实专人负责此项工作。雾化器结构安装:对旋转式雾化器运转时要防止振动。惰性溶剂:即与化合物不起任何化学反应的溶剂。最常用的是水,其次为乙醇,有时也用甲醇、苯、氯仿、乙酸乙脂、丙酮等。学校的安全工作直接关系到办学质量,学校的信誉和学生的健康成长,也关系到家庭的幸福、社会的稳定。因此,我们必须增强广大师生的安全意识,强化学校安全教育力度,普及安全防范知识,加大学校安全管理措施,做到安全工作警钟长鸣,确保师生平安。4.严禁任何人在学校网上使用来历不明或有毒软件。11.建立住宿学生安全管理制度,配备专人负责住宿学生的生活管理和安全保卫工作。3.领用危险品须经部门负责人批准,实验多余的应及
29、时退还给保管人员入库。4学生进入宿舍区,要严加看护,防止陌生人趁机混入;学生带物出门,要注意观察,发现可疑之物要严加盘问。3.实验室要做好防火、防暴、防触电、防中毒、防创伤等工作,要配备灭火机、砂箱等消防器材及化学实验急救器材等防护用品。但是中药材中有效成分大多是不耐热成分或挥发性成分,生物活性极易受到破坏,浸取温度高会使之分解、变质或挥发散失。例如浸取鞣质时,若温度超过100C,部分鞣质分解,收率反而降低。同时高温度浸取时无效杂质增多,冷却后会出现沉淀或浑浊,影响制剂质量和稳定性。因此浸提过程中,浸出温度以较低度为好。5不得组织学生参加抢险等应当由专业人员或者成人从事的活动,不得组织学生参与制作烟花爆竹、有毒化学品等具有危险性的活动,不得组织学生参加商业性活动。1.学校应在各类灾害发生前做好信息收集和预测工作,化被动为主动,实行全员监控。谢谢观看!