1、第六章统计1获取数据的途径必备知识必备知识自主学习自主学习1.1.直接获取与间接获取数据直接获取与间接获取数据概念概念数据名称数据名称直接获取直接获取通过社会调查或通过社会调查或_、_等途径获取数据等途径获取数据. .直接数据或直接数据或_数据数据间接获取间接获取借助各种媒介借助各种媒介, ,包括报纸杂志、包括报纸杂志、统计报表和年鉴、广播、电视统计报表和年鉴、广播、电视或互联网等获取数据或互联网等获取数据. .间接数据或间接数据或_数据数据观察观察试验试验一手一手二手二手【思考思考】“间接数据可以直接使用间接数据可以直接使用, ,不用调查不用调查, ,省时省力省时省力”, ,这种说法对吗这种
2、说法对吗? ?为什么为什么? ?提示提示: :不对不对. .间接数据来历和渠道多样间接数据来历和渠道多样, ,质量参差不齐质量参差不齐, ,使用时要进行核实使用时要进行核实, ,确保确保数据真实、准确数据真实、准确. .2.2.普查和抽查普查和抽查(1)(1)调查方调查方法概念法概念 普查普查抽查抽查定义定义为了掌握调查对象的整为了掌握调查对象的整体情况体情况, ,对对_进行研究的一种调查进行研究的一种调查方式方式. .从全体调查对象中按照一定的从全体调查对象中按照一定的方法抽取方法抽取_作为代表作为代表进行调查分析进行调查分析, ,并以此推断全并以此推断全体调查对象的状况的调查方式体调查对象
3、的状况的调查方式. .全体调查对象全体调查对象一部分对象一部分对象(2)(2)本质本质: :普查与抽查是两种不同的调查方式普查与抽查是两种不同的调查方式, ,具体采用哪种方法取决于调查对具体采用哪种方法取决于调查对象的范围象的范围, ,各有利弊各有利弊. .(3)(3)应用应用: :根据具体情境确定选用的调查方式根据具体情境确定选用的调查方式. .【思考思考】普查与抽查的优、缺点分别有哪些普查与抽查的优、缺点分别有哪些? ?提示提示: :普查普查抽查抽查优点优点所取得的资料更加全面、系统所取得的资料更加全面、系统; ;调查特定时段的社会经济现象总调查特定时段的社会经济现象总体的信息体的信息迅速
4、、及时迅速、及时; ;节约人力、物力、财力节约人力、物力、财力, ,对个体信息的了解更详细对个体信息的了解更详细缺点缺点耗费大量的人力、物力、财力耗费大量的人力、物力、财力, ,时时间长、任务重间长、任务重获取的信息不够全面、系统获取的信息不够全面、系统3.3.总体和样本总体和样本名称名称定义定义总体总体调查对象的调查对象的_样本样本从总体中抽取的从总体中抽取的_样本容量样本容量( (样本量样本量) )样本中个体的样本中个体的_抽取抽取从总体中抽取的从总体中抽取的_总体的分布总体的分布总体中各类数据的总体中各类数据的_全体全体部分部分数目数目部分的过程部分的过程百分比百分比【基础小测基础小测】
5、1.1.辨析记忆辨析记忆( (对的打对的打“”“”, ,错的打错的打“”)”)(1)(1)直接获取的数据称为二手数据直接获取的数据称为二手数据. .( () )(2)(2)获取数据的方式一般有两种获取数据的方式一般有两种: :普查和抽查普查和抽查. .( () )(3)(3)要想准确知道全班同学的平均身高要想准确知道全班同学的平均身高, ,可以抽查一个小组的同学可以抽查一个小组的同学. (. () )提示提示: :(1)(1). .直接获取的数据称为一手数据直接获取的数据称为一手数据. .(2).(2).普查和抽查是获取数据的常用方式普查和抽查是获取数据的常用方式. .(3)(3). .要想准
6、确知道全班同学的平均身高要想准确知道全班同学的平均身高, ,应调查每个同学应调查每个同学. .2.2.下列哪些数据一般是通过试验获取的下列哪些数据一般是通过试验获取的 ( () )A.2019A.2019年上海市的降雨量年上海市的降雨量B.B.截至截至20202020年年5 5月月1515日全世界感染新型冠状病毒肺炎人口的数量日全世界感染新型冠状病毒肺炎人口的数量C.C.新华中学高一学生的数学测试成绩新华中学高一学生的数学测试成绩D.D.某种特效中成药的疗效某种特效中成药的疗效【解析解析】选选D.D.某种特效中成药的疗效的数据一般通过试验获得某种特效中成药的疗效的数据一般通过试验获得. .3.
7、(3.(教材二次开发教材二次开发: :例题改编例题改编) )医生要检验人血液中血脂的含量医生要检验人血液中血脂的含量, ,采取的调查方法采取的调查方法应该是应该是 ( () )A.A.普查普查B.B.抽样调查抽样调查C.C.既不能普查也不能抽样调查既不能普查也不能抽样调查D.D.普查与抽样调查都可以普查与抽样调查都可以【解析解析】选选B.B.要检验人血液中血脂的含量要检验人血液中血脂的含量, ,只能对研究的总体进行抽样调查只能对研究的总体进行抽样调查, ,不不可能普查可能普查. .关键能力关键能力合作学习合作学习类型一个体、总体、样本、样本量的概念辨析类型一个体、总体、样本、样本量的概念辨析(
8、 (数学抽象数学抽象) )【题组训练题组训练】1.1.某市选考科目模拟考试共有某市选考科目模拟考试共有70 00070 000多名学生参加多名学生参加, ,市教研室为了了解市教研室为了了解30 00030 000名地理考生的成绩名地理考生的成绩, ,从中抽取从中抽取300300名考生的地理成绩进行统计分析名考生的地理成绩进行统计分析, ,在这个问题在这个问题中有以下说法中有以下说法, ,正确的是正确的是( () )A.30 000A.30 000名考生是总体的一个样本名考生是总体的一个样本B.30 000B.30 000名考生的地理成绩是总体名考生的地理成绩是总体C.C.样本容量是样本容量是3
9、0 00030 000D.D.抽取的抽取的300300名考生是总体的一个样本名考生是总体的一个样本2.2.若对某校若对某校1 2001 200名学生的耐力做调查名学生的耐力做调查, ,抽取其中抽取其中120120名学生名学生, ,测试他们测试他们1 5001 500米米跑的成绩跑的成绩, ,得出相应的数值得出相应的数值, ,在这项调查中在这项调查中, ,样本是指样本是指( () )A.120A.120名学生名学生B.1 200B.1 200名学生名学生C.120C.120名学生的成绩名学生的成绩D.1 200D.1 200名学生的成绩名学生的成绩3.20203.2020年年2 2月月2020日
10、日, ,欧盟特别峰会在布鲁塞尔举行欧盟特别峰会在布鲁塞尔举行, ,主要讨论主要讨论20212021年至年至20272027年长年长期预算期预算, ,有有2727个国家代表参加个国家代表参加, ,最终因各方分歧太大最终因各方分歧太大, ,未达成协议未达成协议. .会后某记者从会后某记者从每个国家与会人员中采访了两名成员每个国家与会人员中采访了两名成员, ,调查得到各成员国在预算总量、主要政调查得到各成员国在预算总量、主要政策领域分配额、欧盟收入来源以及激励机制等多方面都存在分歧策领域分配额、欧盟收入来源以及激励机制等多方面都存在分歧. .在这个问题在这个问题中样本容量是中样本容量是( () )A
11、.2A.2B.27B.27C.54C.54D.D.不确定不确定【解析解析】1.1.选选B.B.总体是总体是30 00030 000名考生的地理成绩名考生的地理成绩, ,样本是抽取的样本是抽取的300300名考生的地名考生的地理成绩理成绩, ,样本容量是样本容量是300.300.2.2.选选C.C.本题抽取的是本题抽取的是120120名学生的成绩名学生的成绩, ,因此每个学生的成绩是个体因此每个学生的成绩是个体, ,这这120120名学名学生的成绩构成一个样本生的成绩构成一个样本. .3.3.选选C.C.样本容量是样本容量是27272=54.2=54.【解题策略解题策略】解决此类问题要明确概念的
12、实质解决此类问题要明确概念的实质, ,尤其注意两个问题尤其注意两个问题: :(1)(1)调查对象是什么调查对象是什么. .(2)(2)样本量是样本中个体的数目样本量是样本中个体的数目, ,无单位无单位. .【补偿训练补偿训练】从一批零件中抽取从一批零件中抽取1010个个, ,测得它们的长度测得它们的长度( (单位单位:cm):cm)如下如下: :22.3622.3622.3522.3522.3322.3322.3522.3522.3722.3722.3422.3422.3822.3822.3622.3622.3222.3222.3522.35由此估计这批零件的平均长度由此估计这批零件的平均长度
13、. .在此统计活动中在此统计活动中: :(1)(1)总体为总体为: :_;(2)(2)个体为个体为: :_;(3)(3)样本为样本为: :_;(4)(4)样本容量为样本容量为: :_.答案答案: :(1)(1)这批零件的长度这批零件的长度(2)(2)每个零件的长度每个零件的长度(3)(3)抽取的抽取的1010个零件的长度个零件的长度(4)10(4)10类型二普查与抽查类型二普查与抽查( (数学抽象数学抽象) )【典例典例】下列问题下列问题: :调查全国中小学生每天的体育运动时间调查全国中小学生每天的体育运动时间; ;日本厚生劳动省对钻石公主号游轮内乘客和船员日本厚生劳动省对钻石公主号游轮内乘客
14、和船员3 7003 700人进行检疫人进行检疫; ;调查武汉闭城解封后市民的心理健康状况调查武汉闭城解封后市民的心理健康状况; ;调查某篮球队中调查某篮球队中1212位球员的收入情况位球员的收入情况. .适合普查的是适合普查的是, ,适合抽样调查的是适合抽样调查的是.(.(填序号填序号)【思路导引思路导引】紧扣题意紧扣题意, ,依据普查与抽查的特点解题依据普查与抽查的特点解题. .【解析解析】依据普查与抽样调查各自的特点进行判断选取依据普查与抽样调查各自的特点进行判断选取. .中必须对所有乘客中必须对所有乘客和船员进行隔离、检查和船员进行隔离、检查, ,必须做到普查必须做到普查. .中共中共1
15、212名球员名球员, ,数量较少数量较少, ,可采用普查可采用普查方式方式. .而因数量大而因数量大, ,普查难以做到普查难以做到, ,故采用抽样调查的方式故采用抽样调查的方式. .答案答案: :【解题策略解题策略】对普查与抽样调查的理解对普查与抽样调查的理解(1)(1)普查要对所有的对象进行调查普查要对所有的对象进行调查, ,当检验对象很大或检验对象具有破坏性时当检验对象很大或检验对象具有破坏性时, ,采用普查的方法是行不通的采用普查的方法是行不通的, ,要进行抽样调查要进行抽样调查. .(2)(2)普查与抽样调查的适用条件是不同的普查与抽样调查的适用条件是不同的, ,在具体问题中在具体问题
16、中, ,用普查还是抽样调查用普查还是抽样调查的方式的方式, ,要根据它们的特点和适用范围进行判断要根据它们的特点和适用范围进行判断. .【跟踪训练跟踪训练】下列调查方式中下列调查方式中, ,可用可用“普查普查”方式的是方式的是( () )A.A.调查某品牌电视机的市场占有率调查某品牌电视机的市场占有率B.B.调查某电视连续剧在全国的收视率调查某电视连续剧在全国的收视率C.C.调查某校高一一班的男女同学的比例调查某校高一一班的男女同学的比例D.D.调查某型号炮弹的射程调查某型号炮弹的射程【解析解析】选选C.C.调查某校高一一班的男女同学的比例调查某校高一一班的男女同学的比例, ,总体有限且总体数
17、量较小总体有限且总体数量较小, ,适宜采用适宜采用“普查普查”. .类型三抽样调查中样本的抽取问题类型三抽样调查中样本的抽取问题( (数学建模数学建模) ) 【题组训练题组训练】角度角度1 1判断样本是否具有代表性判断样本是否具有代表性【典例典例】下列调查所抽取的样本具有代表性的是下列调查所抽取的样本具有代表性的是( () )A.A.利用某地利用某地1212月份的月平均降雨量估计该地全年的平均降雨量月份的月平均降雨量估计该地全年的平均降雨量B.B.在农村调查居民的平均消费在农村调查居民的平均消费C.C.利用长江入海口的水质估计沱沱河的水质利用长江入海口的水质估计沱沱河的水质D.D.为了了解一批
18、大米的质量情况为了了解一批大米的质量情况, ,从仓库中任意抽取从仓库中任意抽取100100袋进行检验袋进行检验【思路导引思路导引】考量样本能否反映总体考量样本能否反映总体. .【解析解析】选选D.AD.A项中某地项中某地1212月份的月平均降雨量不能代表全年的平均降雨量月份的月平均降雨量不能代表全年的平均降雨量;B;B项中在农村调查得到的平均消费水平不能代表全民的平均消费水平项中在农村调查得到的平均消费水平不能代表全民的平均消费水平;C;C项中长江项中长江入海口的水质状况与沱沱河的水质相差较大入海口的水质状况与沱沱河的水质相差较大, ,只有只有D D项正确项正确. .角度角度2 2抽样调查方案
19、的设计抽样调查方案的设计【典例典例】20202020中央电视台春节联欢晚会全面改版中央电视台春节联欢晚会全面改版, ,由任鲁豫、尼格买提、佟丽由任鲁豫、尼格买提、佟丽娅、尹颂、张舒越担任北京主会场主持人娅、尹颂、张舒越担任北京主会场主持人, ,主会场舞台营造出盛世满园的景象主会场舞台营造出盛世满园的景象, ,让观众仿佛置身于大红灯笼下让观众仿佛置身于大红灯笼下, ,感受春晚的磅礴大气感受春晚的磅礴大气. .演员选择、节目筛选上也演员选择、节目筛选上也颇为下功夫颇为下功夫, ,老中青演员配搭合理老中青演员配搭合理, ,歌舞欢快愉悦歌舞欢快愉悦, ,动感十足动感十足, ,语言类节目情感浓语言类节目
20、情感浓度与思想深度并重度与思想深度并重, ,寓教于乐寓教于乐, ,金句频出金句频出. .为了调查晚会播出的收视率为了调查晚会播出的收视率, ,节目组设置了节目组设置了春节联欢晚会收视率调查表春节联欢晚会收视率调查表, ,并并向社会广泛征求调查意见向社会广泛征求调查意见. .某校有两名同学为电视台设计了调查方案某校有两名同学为电视台设计了调查方案: :同学同学A:A:我把我把春节联欢晚会收视率调查表春节联欢晚会收视率调查表放在互联网上放在互联网上, ,只要上网登录该网只要上网登录该网址的人就可以看到这张表址的人就可以看到这张表, ,他们填表的信息可以很快反馈到我的电脑中他们填表的信息可以很快反馈
21、到我的电脑中. .这样这样, ,我就可以很快统计出收视率了我就可以很快统计出收视率了. .同学同学B:B:我在电话号码本上随机地选出一定数量的电话号码我在电话号码本上随机地选出一定数量的电话号码, ,然后逐个给他们打然后逐个给他们打电话电话, ,问一下他们是否收看了中央电视台春节联欢晚会问一下他们是否收看了中央电视台春节联欢晚会, ,我不出家门就可以统计我不出家门就可以统计出中央电视台春节联欢晚会的收视率了出中央电视台春节联欢晚会的收视率了. .请问上述两个同学设计的调查方案能够获得比较准确的收视率吗请问上述两个同学设计的调查方案能够获得比较准确的收视率吗? ?为什么为什么? ?【思路导引思路
22、导引】方案的设计要保证样本具有代表性方案的设计要保证样本具有代表性. .【解析解析】调查的总体是所有可能看电视的人群调查的总体是所有可能看电视的人群. .同学同学A A的设计方案考虑的人群是的设计方案考虑的人群是: :上网而且登录某网址的人群上网而且登录某网址的人群, ,那些不能上网的人群那些不能上网的人群, ,或者不登录该网址的人群就或者不登录该网址的人群就被排除在外了被排除在外了. .因此同学因此同学A A设计的方案抽取样本的代表性差设计的方案抽取样本的代表性差, ,不能较好的估计总不能较好的估计总体分布体分布. .同学同学B B的设计方案考虑的人群是的设计方案考虑的人群是: :在电话号码
23、本上统计电话的人群在电话号码本上统计电话的人群, ,也有一定的也有一定的片面性片面性, ,因此同学因此同学B B设计的方案抽取样本的代表性也差设计的方案抽取样本的代表性也差, ,也不能较好的估计总体也不能较好的估计总体分布分布. .【变式探究变式探究】你认为怎样设计调查方案你认为怎样设计调查方案, ,能得到较有说服力的数据能得到较有说服力的数据? ?提示提示: :发放调查问卷或打电话询问都要考虑不同的人群发放调查问卷或打电话询问都要考虑不同的人群, ,要根据人口比例分别对要根据人口比例分别对农村、城市分成不同的群体调查农村、城市分成不同的群体调查, ,对各个不同群体中最好要按年龄、职业等属对各
24、个不同群体中最好要按年龄、职业等属性再细化性再细化. .【解题策略解题策略】设计抽样调查的方案应遵循的原则设计抽样调查的方案应遵循的原则(1)(1)要合理地获取样本要合理地获取样本, ,以确保其典型性、代表性以确保其典型性、代表性. .(2)(2)要保证调查内容的真实性要保证调查内容的真实性. .【题组训练题组训练】1.(1.(多选题多选题) )下列调查的样本不合理的是下列调查的样本不合理的是 ( () )A.A.在校内发出一千张印有全校各班级的选票在校内发出一千张印有全校各班级的选票, ,要求被调查学生在其中一个班级要求被调查学生在其中一个班级旁画旁画“”“”, ,以了解最受欢迎的教师是谁以
25、了解最受欢迎的教师是谁B.B.从一万多名工人中从一万多名工人中, ,经过选举经过选举, ,确定确定100100名代表名代表, ,然后投票表决然后投票表决, ,了解工人们对了解工人们对厂长的信任情况厂长的信任情况C.C.到老年公寓进行调查到老年公寓进行调查, ,了解全市老年人的健康状况了解全市老年人的健康状况D.D.为了了解全班同学每天的睡眠时间为了了解全班同学每天的睡眠时间, ,在每个小组中各选取在每个小组中各选取3 3名学生进行调查名学生进行调查【解析解析】选选AC.AC.因为因为A A中样本不符合有效性原则中样本不符合有效性原则, ,在班级前面画在班级前面画“”与了解最与了解最受欢迎的老师
26、没有关系受欢迎的老师没有关系.C.C中样本缺少代表性中样本缺少代表性,BD,BD都是合理的样本都是合理的样本. .2.2.为了缓解城市的交通拥堵情况为了缓解城市的交通拥堵情况, ,某城市准备出台限制私家车的政策某城市准备出台限制私家车的政策, ,为此要进为此要进行民意调查行民意调查, ,某个调查小组调查了一些拥有私家车的市民某个调查小组调查了一些拥有私家车的市民, ,你认为这样的调查结你认为这样的调查结果会怎样果会怎样? ?【解析解析】由于要出台限制私家车的政策由于要出台限制私家车的政策, ,抽样调查的市民又是拥有私家车的市抽样调查的市民又是拥有私家车的市民民, ,因此调查结果倾向于反对出台限
27、制私家车的政策因此调查结果倾向于反对出台限制私家车的政策. .如果要调查出社会公民对政策的真实意见如果要调查出社会公民对政策的真实意见, ,需要对市民的各个群体进行抽样调需要对市民的各个群体进行抽样调查查, ,还包括对一些社会团体还包括对一些社会团体( (比如公交公司、消防、医院等比如公交公司、消防、医院等) )的运营状况进行调的运营状况进行调查查, ,这样才能比较真实地反映出社会的实际情况这样才能比较真实地反映出社会的实际情况, ,获得市民的心声获得市民的心声. .课堂检测课堂检测素养达标素养达标1.1.现从现从8080件产品中随机抽出件产品中随机抽出2020件进行质量检验件进行质量检验.
28、.下列说法正确的是下列说法正确的是 ( () )A.80A.80件产品是总体件产品是总体B.20B.20件产品是样本件产品是样本C.C.样本容量是样本容量是8080D.D.样本容量是样本容量是2020【解析解析】选选D.D.总体是总体是8080件产品的质量件产品的质量; ;样本是抽取的样本是抽取的2020件产品的质量件产品的质量; ;样本容量样本容量是是20.20.2.2.要得到某乡镇的贫困人口数据要得到某乡镇的贫困人口数据, ,应采取的方法是应采取的方法是( () )A.A.通过调查获取数据通过调查获取数据B.B.通过试验获取数据通过试验获取数据C.C.通过观察获取数据通过观察获取数据D.D
29、.通过查询获得数据通过查询获得数据【解析解析】选选A.A.某乡镇的贫困人口数据属于有限总体问题某乡镇的贫困人口数据属于有限总体问题, ,所以可以通过调查获所以可以通过调查获取数据取数据. .3.(3.(多选题多选题) )如图是全国新型冠状病毒肺炎疫情实时数据报告中如图是全国新型冠状病毒肺炎疫情实时数据报告中20202020年年5 5月月1515日日1717时时2424分黑龙江的数据报告分黑龙江的数据报告, ,图中数据是图中数据是( () )A.A.一手数据一手数据B.B.二手数据二手数据C.C.通过普查获取的通过普查获取的D.D.通过抽查获取的通过抽查获取的【解析解析】选选AC.AC.新型冠状
30、病毒肺炎疫情是关系到我国乃至全世界人民的头等大新型冠状病毒肺炎疫情是关系到我国乃至全世界人民的头等大事事, ,新型冠状病毒肺炎疫情数据都是通过普查获取的一手数据新型冠状病毒肺炎疫情数据都是通过普查获取的一手数据. .4.4.学校兴趣小组要对本市某社区的居民睡眠时间进行研究学校兴趣小组要对本市某社区的居民睡眠时间进行研究, ,得到了以下得到了以下1010个数个数据据( (单位单位:h):h):5.6,7.8,8.0,7.3,3.2,7.9,6.8,7.5,8.6,7.8,5.6,7.8,8.0,7.3,3.2,7.9,6.8,7.5,8.6,7.8,去掉数据去掉数据能很好地提高样本数据的代表性能
31、很好地提高样本数据的代表性.【解析解析】因为数据因为数据3.23.2明显低于其他几个数据明显低于其他几个数据, ,是极端值是极端值, ,所以去掉这个数据所以去掉这个数据, ,能能够更好地提高样本数据的代表性够更好地提高样本数据的代表性. .答案答案: :3.23.25.(5.(教材二次开发教材二次开发: :练习改编练习改编) )国家统计局、国家残联决定对国家残疾人生活、国家统计局、国家残联决定对国家残疾人生活、就业等情况进行调查就业等情况进行调查, ,某同学设计的调查方案是在国家残联的网站上设立一个某同学设计的调查方案是在国家残联的网站上设立一个调查表调查表, ,根据网站上的数据进行分析根据网站上的数据进行分析. .你认为他的方案你认为他的方案( (填填“合理合理”或或“不合理不合理”).).【解析解析】很多残疾人不具有上网条件很多残疾人不具有上网条件, ,因此获取的数据不具有代表性因此获取的数据不具有代表性. .答案答案: :不合理不合理