1、. 专题十专题十 算法与统计算法与统计 自查网络 核心背记 一、算法与程序框图 1算法是解决某类问题的一系列步骤或程序,只要按照这些步骤执行,都能使问题得到解 决其基本思想是 一 2作为一个算法,应具有以下五个特点:_、_ 3. -般来说,算法有下列三种描述方法:_、_、_ 4.通常用一些通用 构成一张图来表示算法,这种图叫程序框图(简称框图)一个程序 框图包括以下几个部分:,表示相应操作的程序框;带箭头的流程线;程序框外必要的文字 说明常用的表示算法步骤的图形符号如下: 5按照步骤依次执行的一个算法,称为具有”顺序结构”的算法,或者称为算法的 6条件分支结构是依据_选择执行不同指 令的控制结
2、构 7在科学计算中,经常会遇到许多有规律的重复计 算如果一个计算过程,要重复一系 列的计算步骤若干次, 每次计算步骤完全相同,则这种算法过程称为循环过程常见的循 环结构有_(WHILE 型)循环 和_ 型(UNTIL 型)循环 二、基本算法语句 1赋值语句的一般格式为 ,赋值语句的作 用是将表达式所代表的值赋给变量,在赋值 . 语句中,一个 变量对应唯一一个值 2输入语句的一般格式是_ 3输出语句的功能是以某种形式把_ “输 出”出来,输出语句中的“PRINT”的一般格 式为 PRINT“提示内容”;表达式 4条件语句共有三种格式,分别是_一、_ _、 5.循环语句有两种,它们是 、_ 三、中
3、国古代数学中的算法案例 (一)求两个正整数的最大公约数的算法 1.等值算法n) 的最大公约数为例 算 法步骤和其程序框图如下: S1 输入两个正整数 m,n(mn); S2 r-m-n; S3 如果 r体,用循环结构就可 . 以实现其算法以求正整数 n,6(a6)的最大公约数为例算法步骤和其程序框图如下: Sl 输入两个正整数 a,6(a6); S2 计算 a 除以 6 所得的余数 r; S3 a-b,b=r;S4 若 r-0,则 a,6 的最大公约数等于 6输出 6;否则返回 S2 (二)割圆术割圆术是我国魏晋时期的数学家刘徽在注九章算术中采用正多边形面积 逐渐逼近圆面积的算法计算圆周率 K
4、 的方法,“割圆术”的具体操作步骤如下: Sl 从半径为 1 的圆内接正六边形开始,计算它的面积 Sb S2 逐步加倍圆内接正多边形的边数,分别计算圆内接正十二边形、正二十四边形、正四十 八边形、的面 . 四、随机抽样 1总体和样本一般把所考查对象的某一数值全体构成的集合看做总体,构成总体的每一个 元素作为个体,从总体中抽出的若干个个体所组成的集合叫 做 ,样本中个体的个数叫 做 2-一般地,从元素个数为 N 的总体中 一地抽;取容量为咒的样本,如果每一次抽取时总 体币的否个个体 有一 的可能性被抽到,这种抽样方法叫做简单随 机抽样,这样抽取 的样本叫做简单随机样本 3简单随机抽样常用的方法:
5、 4将总体分成均衡的若干部分,然后按照 的法则,从每一部分抽取 个体,得到所需 要的样本,这种抽样的方法叫做系统抽样,也称作 5一般的,在抽样时,将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部 分叫做层,在各层中按层在总体中所占 进行简单随机抽样,这种抽样的方法就叫做分层 抽样,有时也抽样 6简单随机抽样、系统抽样和分层抽样都是抽样,每个个体被抽到的可能性都是- 五、用样本估计总体 1用_估计总体,是研究统计问题的一个基本思想方法 2列频率分布表、绘制频率分布直方图的步骤 (1)求_(也称全距,即一组数据中最大值与最小值的差) (2)决定组距与组数,组数= (3)决定一 ,将数据
6、分组分组 时,通常对组内数值所在区间取左的右开区间,最后一组 取闭区间当然也可以采用其他分组方法 (4)登记频数,计算频率,列出频率分布表频率一 一 表 (5)绘制频率分布直方图,各小矩形的示相应各组的频率,这样,频率分布直方图就以 面积的形式反映了数据落在各个小组内的频率大小 在频率分布直方图中, 各小矩形的面积 之和等于 3总体密度曲线把频率分布直方图各个长方形上边的 用线 段连接起来,就得到频 率分布折线图为了方便看图;一般 习惯于把频率分布折线图画成与横轴相连,所以横轴 上的 左右两端点没有实际的意义如果样本容量越大,所分组数越多,频率分布就越接近 于总体在各个小组内所取值的个数与总数
7、比值的大小, 设想如果样本容量不断增大, 分组的 组距不断缩小, 则频率分布直方图实际上越来越接近于总体的分布, 它可以用一条光滑曲线 y=f(z)来描绘,这条光滑曲线就叫做 它精确地反映了一个总体在各个区域内取值的规 律 4茎叶图茎是指中间的一列数,叶就是从茎的旁边生长出来的数,茎叶图通常用来记录两 位数的数据,把两位数的十位数字作为“ ”,个位数字作为“_”,茎叶图可用来分析单 组数据,也可以对两组数据进行比较茎叶图不仅能够保留原始数据,而且能够展示数据的 分布情况 5用样本平均数估计总体平均数 (1)设容量为 n 的样本数据分别为 z ,zz,岛,则称 为这 n 个数据的平均数平均数 与
8、样本数据之间的偏差最小,是与样本数据最接近、最理想的近似值 (2)平均数是频率分布直方图的“重心”由于平均数与样本的每一个数据都有关,所以任何 一个样本数据的改变都会引起平均数的改变 所以在频率分布直方图中, 平均数是直方图的 平衡点 6用样本标准蓁估计总体标准差 . 六、变量的相关性 1变量与变量之间的关系常见的有两类:一类 是 的函数关系;另一类是变量间确实存 在关系, 但又不具备函数关系所要求的确定性,它们的关系是带 有 的,也就是说: 自变量取值一定时,因变量的取 值带有一定 ,这两个变量之间的关系叫相关关系 2.样本中 n 个 数据点(x,yi)(i-l,2,n)描在平面 直角坐标系
9、中,以表示具有_ 关系的两个变量的 一组数据的图形叫做散点瓯一从散点图可以看到点散布的位置是从左 下角到右上 角的区域,即一个变量的值由小变大时,另一个变量的值 也由小变大,这种 相关称为 相关反之,如果两 个变量的散点图中点散布的位置是从左上角到右下角 的 区域,即一个变量的值由小变大时,另一个变量的值由大 变小,这种相关称为 相 关3从散点图上可以看出如果变量之间存在着某种关 系,这些点会有一个集中的大致 趋势 这种趋势通常可以 用一条光滑的曲线来近似描述, 这种近似的过程称为曲线 拟合, 在两个变量 z 和 y 的散点图中,所有点看上去都在 一条 附近波动,则称变量间是线性 相关的此 时
10、,我们可以用一条直线来拟合,这条直线叫 . 5顺序结构 6指定条件 7当型直到 二、1-变量一表达式 2INPUT“提示内容”;变量 3求解的结果 4IF- ELSE- END 格式 IF- END 格式 条件语句的嵌套 5UNTIL 循环语句 WHILE 循环语句 四、1样本样本容量 2不放回相同 3抽签法随机数表法 4预先指定一个等距抽样 . 5比例 规律探究 1在具体画程序框图时,要注意的问题:流程线上要有标志执行顺序的箭头;判断框后边 的流程线应根据情况标注“是”或“否”; 在循环结构中, 要注意根据条件设计合理的计数变量、 累加变量等 2关于三种抽样方法的使用,不管采取哪一种抽样方法
11、,必须保证整个抽样过程中每个个 体被抽到的机会相同有比较才有选择, 在解决具体问题时, 要根据抽样方法的特点及其适 用范围恰当选择,可通过下表加深理解 3简单随机抽样、系统抽样、分层抽样的共同特点是: 在抽样过程中每一个个体被抽取的可能性相等, 体现了这些抽样方法的客观性和公平性 其 实简单随机抽样是最简单和最基本的抽样方法, 在进行系统抽样和分层抽样时都要用到简单 . 随机抽样方法,抽样方法经常交叉起来应用对于个体数量很大的总体,可采用系统抽样, 系统中的每一均衡部分,又可采用简单随机抽样,对于个体差异明显的总体,可采用分层 抽样,各层抽样时采用简单随机抽样或系统抽样 4画频率分布直方图,一
12、般分为以下几个步骤:先求样本数据中的最大值和最小值(称为 极差) ,再确定合适的组数和组距,决定分点(每个分点只属于一组,故一般采用半开半闭 区间) ,然后列出频率分布表(准确,查数据容易) ,画频率分布直方图(直观) 实际应用 1如果执行下面的框图,输入 N-5,则输出的数等于 ( ) 2从某小学随机抽取 100 名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方 图(如图) 由图中数据可知 a-一一_若要从身高在120,130),130,140),140,150 三组内的学生中,用分层抽样的方法选取 18 人参加一项活动,则从身高在140,150内的 学生中选取的人数应为 3为了对某课题进行研究,用分层抽样方法从三所 校 A,B,C 的相关人员中,抽取若干 . 人组成研究小组,有 数据见下表(单位:人)