1、2023-5-5 案例背景案例背景 案例描述案例描述 描述性统计量描述性统计量 统计图统计图 频数和频率分布表频数和频率分布表主要内容:主要内容:2023-5-5第一节第一节 案例背景案例背景2023-5-5 从一封情书开始说起从一封情书开始说起亲爱的莲:亲爱的莲:我们的感情,在组织的亲切关怀下、在领导的亲自过我们的感情,在组织的亲切关怀下、在领导的亲自过问下,一年来正沿着健康的道路蓬勃发展。这主要表现在:问下,一年来正沿着健康的道路蓬勃发展。这主要表现在:(一)我们共通信(一)我们共通信121121封,平均封,平均3.013.01天一封。其中你给天一封。其中你给我的信我的信5151封,占封,
2、占42.1%42.1%;我给你的信;我给你的信7070封,占封,占57.9%57.9%。每封。每封信平均信平均15021502字,最长的达字,最长的达52155215字,最短的也有字,最短的也有624624字。字。(二)约会共(二)约会共9898次,平均次,平均3.73.7天一次。其中你主动约我天一次。其中你主动约我3838次,占次,占38.7%38.7%;我主动约你;我主动约你6060次,占次,占61.3%61.3%。每次约会平。每次约会平均均3.83.8小时小时,最长达最长达6.46.4小时,最短的也有小时,最短的也有1.61.6小时。小时。(三)我到你家看望你父母(三)我到你家看望你父母
3、3838次,平均每次,平均每 9.49.4天一次;天一次;你到我家看望我父母你到我家看望我父母3636次,平均次,平均1010天一次。以上充分证明天一次。以上充分证明一年来的交往我们已形成了恋爱的共识,我们爱情的主流一年来的交往我们已形成了恋爱的共识,我们爱情的主流是互相了解、互相关心、互相帮助,是平等互利的。是互相了解、互相关心、互相帮助,是平等互利的。当然,任何事物都是一分为二的,缺点的存在是不可避免当然,任何事物都是一分为二的,缺点的存在是不可避免的。我们二人虽然都是积极的,但从以上的数据看,发展还不的。我们二人虽然都是积极的,但从以上的数据看,发展还不太平衡,积极性还存在一定的差距,这
4、是前进中的缺点。太平衡,积极性还存在一定的差距,这是前进中的缺点。相信在新的一年里,我们一定会发扬成绩、克服缺点、携手前相信在新的一年里,我们一定会发扬成绩、克服缺点、携手前进,开创我们爱情的新局面。因此,我提出三点意见供你参考:进,开创我们爱情的新局面。因此,我提出三点意见供你参考:(一)要围绕一个(一)要围绕一个“爱爱”字,字,(二)要狠抓一个(二)要狠抓一个“亲亲”字,字,(三)要落实一个(三)要落实一个“合合”字。字。让我们弘扬团结拼搏的精神,共同振兴我们的爱情,争取让我们弘扬团结拼搏的精神,共同振兴我们的爱情,争取达到一个新高度,登上一个新台阶。本着达到一个新高度,登上一个新台阶。本
5、着“我们的婚事我们办,我们的婚事我们办,办好婚事为我们办好婚事为我们”的精神,共创辉煌。的精神,共创辉煌。你的憨哥你的憨哥2023-5-5 统计学家当奶爸统计学家当奶爸 有个从未管过自己孩子的统计学家,在一个星期六下午有个从未管过自己孩子的统计学家,在一个星期六下午妻子要外出买东西时,勉强答应照看一下四个年幼好动的妻子要外出买东西时,勉强答应照看一下四个年幼好动的孩子。当妻子回家时,他交给妻子一张纸条,上面写着:孩子。当妻子回家时,他交给妻子一张纸条,上面写着:“擦眼泪擦眼泪1111次;系鞋带次;系鞋带1515次;给每个孩子吹玩具气球各次;给每个孩子吹玩具气球各5 5次;次;每个气球的平均寿命
6、每个气球的平均寿命1010秒钟;警告孩子不要横穿马路秒钟;警告孩子不要横穿马路2626次;次;孩子坚持要穿马路孩子坚持要穿马路2626次;我还要再过这样的星期六次;我还要再过这样的星期六0 0次。次。”2023-5-5第二节第二节 案例描述案例描述2023-5-5【例例17.2-1】现有现有某两个班的某门课程的考试成绩,某两个班的某门课程的考试成绩,如如下下表表所示。试对成绩数据进行统计分析(计算描述性统计量,绘所示。试对成绩数据进行统计分析(计算描述性统计量,绘制统计图),分析成绩是否服从正态分布。制统计图),分析成绩是否服从正态分布。序号序号学号学号姓名姓名成绩成绩序号序号学号学号姓名姓名
7、成绩成绩序号序号学号学号姓名姓名成绩成绩16010101陈亮63186010118肖君扬80356010211尹浩天9026010102李旭73196010119徐欣露69366010212曾松涛8036010103刘鹏飞*206010120杨姗姗81376010213张小兵8046010104任时迁82216010121姚丽娜49386010214奚才7356010105苏宏宇80226010122张萌91396010215郭以纯7366010106王海涛70236010123张婷婷76406010216黄惠雯7276010107王洋88246010124褚子贞76416010217刘丽79
8、86010108徐靖磊80256010201曹不凡72426010218聂茜茜8096010109阎世杰92266010202付程远89436010219苏红妹81106010110姚前树84276010203李林森77446010220唐芸82116010111张金铭95286010204李强64456010221王飞燕73126010112朱星宇82296010205林志远94466010222徐思漫83136010113韩宏洁75306010206盛世74476010223许佳慧87146010114刘菲71316010207宋天清98486010224杨雨婷*156010115苗艳红7
9、0326010208王润泽89496010225曾亦可90166010116宋佳艺80336010209吴鹏辉49506010226张阳85176010117王峥瑶78346010210徐佳80516010227张梓涵922023-5-5第三节第三节 描述性统计量描述性统计量2023-5-5一、均值一、均值 定义:定义:11niiXXn 一首打油诗:张村有个张千万,隔壁一首打油诗:张村有个张千万,隔壁9个穷光蛋,平均个穷光蛋,平均起来算一算,人人都是张百万。起来算一算,人人都是张百万。报纸上报道有个人在一条河中淹死了,这条河的平均深报纸上报道有个人在一条河中淹死了,这条河的平均深度仅度仅10c
10、m,你信吗?,你信吗?来自国家统计局天津调查总队最新的数据显示,今年上来自国家统计局天津调查总队最新的数据显示,今年上半年天津城市居民人均可支配收入半年天津城市居民人均可支配收入12861元,北京元,北京17068元、上海元、上海18382元、重庆元、重庆11134元。元。2023-5-5二、方差和标准差二、方差和标准差 方差:方差:2211()1niiSXXn 标准差:标准差:211()1niiSXXn最常用最常用三、最大值和最小值三、最大值和最小值 最大值:最大值:()12max,nnXXXX 最小值:最小值:(1)12min,nXXXX2023-5-5四、极差四、极差 极差:极差:()(
11、1)nRangeXX五、中位数五、中位数(1)/2)(/2)(1/2),1(),2nnnXnXXXn为奇数为偶数六、六、p分位数分位数(1)()(1),12nppnpnpXnpmXXnp若不是整数,若是整数七、众数:七、众数:样本数据中出现最频繁的数样本数据中出现最频繁的数2023-5-5八、变异系数八、变异系数covarS X九、九、k k阶原点矩阶原点矩11,1,2,nkkiiAXkn十、十、k k阶中心矩阶中心矩11(),2,3,nkkiiBXXkn十一、偏度十一、偏度331.5312()(1)(2)nisiBXXnbBnnS十二、峰度十二、峰度4223kBbB2023-5-5十三、第一
12、四分位数:十三、第一四分位数:0.251Qm 样本数据中小于等于此数的数据占整个数据集的样本数据中小于等于此数的数据占整个数据集的25%十四、第三四分位数:十四、第三四分位数:0.753Qm 样本数据中小于等于此数的数据占整个数据集的样本数据中小于等于此数的数据占整个数据集的75%十五、四分位间距:十五、四分位间距:31IQRQQ最稳健最稳健2023-5-5【例例17.3-1】根据根据表表17.2-1中数据中数据,计算描述性统计,计算描述性统计量量。%求均值求均值score=xlsread(examp7_1_1.xls,Sheet1,G2:G52);score=score(score 0);s
13、core_mean=mean(score)%求方差和标准差求方差和标准差SS1=var(score)%计算计算(17.3-1)式的方差式的方差SS1=var(score,0)%也是计算也是计算(17.3-1)式的方差式的方差SS2=var(score,1)%计算计算(17.3-2)式的方差式的方差s1=std(score)%计算计算(17.3-3)式的标准差式的标准差s1=std(score,0)%也是计算也是计算(17.3-3)式的标准差式的标准差s2=std(score,1)%计算计算(17.3-4)式的标准差式的标准差%求最大值和最小值求最大值和最小值score_max=max(scor
14、e)score_min=min(score)%求极差求极差score_range=range(score)%求中位数求中位数score_median=median(score)%求分位数求分位数score_m1=quantile(score,0.25,0.5,0.75)score_m2=prctile(score,25,50,75)%求众数求众数score_mode=mode(score)%求变异系数求变异系数score_cvar=std(score)/mean(score)%求原点矩求原点矩A2=mean(score.2)%求中心矩求中心矩B1=moment(score,1)B2=momen
15、t(score,2)%求偏度求偏度score_skewness=skewness(score)%求峰度求峰度score_kurtosis=kurtosis(score)2023-5-5第四节第四节 统计图统计图一、一、样本的频数分布与频率分布样本的频数分布与频率分布将样本观测值将样本观测值12,nx xx从小到大排列得:从小到大排列得:,列出样本频率分布表如下,列出样本频率分布表如下(1)(2)()lxxx观测值观测值x(1)x(2)x(l)总计总计频数频数n1n2nln频率频率111nfn22nfnllnfn 称称函数函数(1)()(1)1()0()1,2,11inkiiklxxF xfxx
16、xilxx为样本分布函数(或为样本分布函数(或经验分布函数经验分布函数)。它满足分)。它满足分布函数所具有的性质。布函数所具有的性质。二、样本经验分布函数图二、样本经验分布函数图1.定义定义2.格里汶科定理格里汶科定理设总体设总体X 的的分布函数为分布函数为F(x),样本,样本limsup|()()|01nnxPF xF x 此定理表明:当样本容量此定理表明:当样本容量n n相当大时,经验分布函相当大时,经验分布函数是总体分布函数的一个良好的近似。数是总体分布函数的一个良好的近似。12,nXXX的经验的经验分布函数为分布函数为Fn(x),则有,则有3.MATLAB实现实现 cdfplot和和e
17、cdf函数函数函数函数调用方式:调用方式:cdfplot(X)f,x=ecdf(y)功能:功能:绘制经验分布函数图绘制经验分布函数图40506070809010000.10.20.30.40.50.60.70.80.91xF(x)Empirical CDF 经验分布函数理论正态分布2023-5-5【例例17.4-1】根据根据表表17.2-1中数据中数据,绘制经验分布函数图。,绘制经验分布函数图。%经验分布函数图经验分布函数图score=xlsread(examp7_1_1.xls,Sheet1,G2:G52);score=score(score 0);figure;h,stats=cdfplo
18、t(score)set(h,color,k,LineWidth,2);x=40:0.5:100;y=normcdf(x,stats.mean,stats.std);hold onplot(x,y,:k,LineWidth,2);legend(经验分布函数经验分布函数,理论正态分布理论正态分布,Location,NorthWest);(1)(1)找出样本观测值的最小值找出样本观测值的最小值x(1)和最大值和最大值x(l);011kkattttb(2)(2)取取ax(1)和和bx(l),将区间,将区间a,b分成分成k个子区间;个子区间;01121,(,(,kkt tt ttt(3)(3)计算样本观
19、测值落入各子区间内的频数计算样本观测值落入各子区间内的频数ni 和频率和频率 ;iinfn(4)(4)在在x 轴上以各子区间为底边,以轴上以各子区间为底边,以ni(或(或 )为高)为高 作小矩形即得频数(或频率)直方图。作小矩形即得频数(或频率)直方图。1()iiiftt三、频数与频率直方图三、频数与频率直方图1.1.步骤步骤2.MATLAB实现实现 hist、ecdf和和ecdfhist函数函数函数函数调用方式:调用方式:%频数直方图频数直方图hist(Y,nbins)%频率直方图频率直方图f,x=ecdf(y)ecdfhist(f,x)功能:功能:hist函数,用来绘制频数直方图函数,用来
20、绘制频数直方图 ecdf和和ecdfhist函数,用来绘制频率直方图函数,用来绘制频率直方图40506070809010000.0050.010.0150.020.0250.030.0350.040.0450.05考试成绩f(x)频率直方图正态分布密度曲线2023-5-5【例例17.4-2】根据根据表表17.2-1中数据中数据,绘制频率直方图。,绘制频率直方图。%频数(率)直方图频数(率)直方图figure;f,xc=ecdf(score);ecdfhist(f,xc,7);xlabel(考试成绩考试成绩);ylabel(f(x);x=40:0.5:100;y=normpdf(x,mean(s
21、core),std(score);hold onplot(x,y,k,LineWidth,2)legend(频率直方图频率直方图,正态分布密度曲线正态分布密度曲线,Location,NorthWest);四、箱线图四、箱线图 设设 为总体为总体X 的一个样本,样本观测值为:的一个样本,样本观测值为:12,nXXX则可得出如下箱线图。则可得出如下箱线图。(1)(2)()nxxx11Column NumberValueslox1Q(0.5)m3Qupx(1)max 1 1.5,loxQIQRx()min 3 1.5,upnxQIQRx2023-5-51.1.定义定义2.MATLAB实现实现 box
22、plot函数函数调用方式:调用方式:boxplot(X)功能:功能:用来绘制箱线图用来绘制箱线图50556065707580859095100考试成绩箱线图考试成绩2023-5-5【例例17.4-3】根据根据表表17.2-1中数据中数据,绘制箱线图。,绘制箱线图。%箱线图箱线图figure;boxlabel=考试成绩箱线图考试成绩箱线图;boxplot(score,boxlabel,notch,on,orientation,horizontal)xlabel(考试成绩考试成绩);五、正态概率图五、正态概率图 正态概率图用于正态分布的检验,实际上就是纵坐标经正态概率图用于正态分布的检验,实际上就
23、是纵坐标经过变换后的正态分布的分布函数图,正常情况下,正态分布过变换后的正态分布的分布函数图,正常情况下,正态分布的分布函数曲线是一条的分布函数曲线是一条S S形曲线,而在正态概率图上描绘的形曲线,而在正态概率图上描绘的则是一条直线。则是一条直线。如果采用手工绘制正态概率图的话,可以在正态概率纸如果采用手工绘制正态概率图的话,可以在正态概率纸上描绘,正态概率纸上有根据正态分布构造的坐标系,其横上描绘,正态概率纸上有根据正态分布构造的坐标系,其横坐标是均匀的,纵坐标是不均匀的,以保证正态分布的分布坐标是均匀的,纵坐标是不均匀的,以保证正态分布的分布函数图形是一条直线。函数图形是一条直线。1.1.
24、定义定义2.MATLAB实现实现 normplot函数函数调用方式:调用方式:h=normplot(X)功能:功能:用来绘制正态概率图用来绘制正态概率图2023-5-5【例例17.4-4】根据根据表表17.2-1中数据中数据,绘制正态概率图。,绘制正态概率图。%正态概率图正态概率图figure;normplot(score);505560657075808590950.01 0.02 0.05 0.10 0.25 0.50 0.75 0.90 0.95 0.98 0.99 DataProbabilityNormal Probability Plot六、六、p-p图图 p-pp-p图用来检验样本
25、观测数据是否服从指定的分布,是图用来检验样本观测数据是否服从指定的分布,是样本经验分布函数与指定分布的分布函数的关系曲线图。通样本经验分布函数与指定分布的分布函数的关系曲线图。通常情况下,一个坐标轴表示样本经验分布,另一个坐标轴表常情况下,一个坐标轴表示样本经验分布,另一个坐标轴表示指定分布的分布函数。每一个样本观测数据对应图上的一示指定分布的分布函数。每一个样本观测数据对应图上的一个个“+”+”号,图中有一条参考直线,若图中的号,图中有一条参考直线,若图中的“+”+”号都集中号都集中在这条参考线附近,说明样本观测数据近似服从指定分布,在这条参考线附近,说明样本观测数据近似服从指定分布,偏离参
26、考线的偏离参考线的“+”+”号越多,说明样本观测数据越不服从指号越多,说明样本观测数据越不服从指定分布。定分布。1.1.定义定义2.MATLAB实现实现 probplot函数函数调用方式:调用方式:h=probplot(distribution,Y)功能:功能:用来绘制用来绘制 p-p 图图2023-5-5【例例17.4-5】根据根据表表17.2-1中数据中数据,绘制对数正态概率图。,绘制对数正态概率图。%对数正态概率图对数正态概率图figure;probplot(lognormal,score);101.7101.8101.90.010.050.10.250.50.750.90.950.99
27、DataProbabilityProbability plot for Lognormal distribution七、七、q-q图图 q-qq-q图也可用来检验样本观测数据是否服从指定的分布,图也可用来检验样本观测数据是否服从指定的分布,是样本分位数与指定分布的分位数的关系曲线图。通常情况是样本分位数与指定分布的分位数的关系曲线图。通常情况下,一个坐标轴表示样本分位数,另一个坐标轴表示指定分下,一个坐标轴表示样本分位数,另一个坐标轴表示指定分布的分位数。每一个样本观测数据对应图上的一个布的分位数。每一个样本观测数据对应图上的一个“+”+”号,号,图中有一条参考直线,若图中的图中有一条参考直线
28、,若图中的“+”+”号都集中在这条参考号都集中在这条参考线附近,说明样本观测数据近似服从指定分布,偏离参考线线附近,说明样本观测数据近似服从指定分布,偏离参考线的的“+”+”号越多,说明样本观测数据越不服从指定分布。号越多,说明样本观测数据越不服从指定分布。1.1.定义定义2.MATLAB实现实现 qqplot函数函数调用方式:调用方式:h=qqplot(X,Y)功能:功能:用来绘制用来绘制 q-q 图图2023-5-5【例例17.4-6】根据根据表表17.2-1中数据中数据,绘制,绘制q-q图。图。banji=xlsread(examp7_1_1.xls,Sheet1,B2:B52);sco
29、re=xlsread(examp7_1_1.xls,Sheet1,G2:G52);score=score(score 0);banji=banji(score 0);score1=score(banji=60101);score2=score(banji=60102);qqplot(score1,score2)2023-5-5第五节第五节 频数和频率分布表频数和频率分布表一、调用一、调用tabulate函数作频数和频率分布表函数作频数和频率分布表 tabulate函数函数调用方式:调用方式:TABLE=tabulate(x)功能:功能:用来作频数和频率分布表用来作频数和频率分布表2023-5-
30、5【例例17.5-1】统计数值型数组中各元素出现的频数、统计数值型数组中各元素出现的频数、频率。频率。x=2 2 6 5 2 3 2 4 3 4 3 4 4 4 4 2 2 6 0 4 7 2 5 8 3 1 3 2 5 3 6 2 3 5 4 3 1 4 2 2 2 3 1 5 2 6 3 4 1 2 5;tabulate(x(:)Value Count Percent 0 1 1.96%1 4 7.84%2 14 27.45%3 10 19.61%4 10 19.61%5 6 11.76%6 4 7.84%7 1 1.96%8 1 1.96%2023-5-5【例例17.5-2】统计字符串中
31、各字符出现的频数、频率。统计字符串中各字符出现的频数、频率。x=If x is a numeric array,TABLE is a numeric matrix.;tabulate(x)Value Count Percent I 1 2.44%f 1 2.44%x 2 4.88%i 5 12.20%s 2 4.88%a 5 12.20%n 2 4.88%u 2 4.88%2023-5-5【例例17.5-3】统计字符型数组中各行元素出现的频数、统计字符型数组中各行元素出现的频数、频率频率.x=崔家峰崔家峰;孙乃喆孙乃喆;安立群安立群;王洪武王洪武;王玉杰王玉杰;高纯静高纯静;崔家峰崔家峰;叶叶
32、 鹏鹏;关泽满关泽满;谢中华谢中华;王宏志王宏志;孙乃喆孙乃喆;崔家峰崔家峰;谢中华谢中华;tabulate(x)Value Count Percent 崔家峰崔家峰 3 21.43%孙乃喆孙乃喆 2 14.29%安立群安立群 1 7.14%王洪武王洪武 1 7.14%王玉杰王玉杰 1 7.14%高纯静高纯静 1 7.14%叶叶 鹏鹏 1 7.14%关泽满关泽满 1 7.14%谢中华谢中华 2 14.29%王宏志王宏志 1 7.14%2023-5-5【例例17.5-4】统计字符串元胞数组中各字符串出现统计字符串元胞数组中各字符串出现的频率。的频率。x=崔家峰崔家峰;孙乃喆孙乃喆;安立群安立群;
33、王洪武王洪武;王玉杰王玉杰;高纯静高纯静;崔家峰崔家峰;叶叶 鹏鹏;关泽满关泽满;谢中华谢中华;王宏志王宏志;孙乃喆孙乃喆;崔家峰崔家峰;谢中华谢中华;tabulate(x)Value Count Percent 崔家峰崔家峰 3 21.43%孙乃喆孙乃喆 2 14.29%安立群安立群 1 7.14%王洪武王洪武 1 7.14%王玉杰王玉杰 1 7.14%高纯静高纯静 1 7.14%叶叶 鹏鹏 1 7.14%关泽满关泽满 1 7.14%谢中华谢中华 2 14.29%王宏志王宏志 1 7.14%2023-5-5【例例17.5-5】统计名义尺度(如性别,职业,产品型号等)统计名义尺度(如性别,职业
34、,产品型号等)数组中各元素出现的频数、频率。数组中各元素出现的频数、频率。%载入载入MATLAB自带的鸢尾花数据自带的鸢尾花数据 load fisheriris%将字符串元胞数组将字符串元胞数组species转为名义尺度数组转为名义尺度数组 species=nominal(species);tabulate(species)Value Count Percent setosa 50 33.33%versicolor 50 33.33%virginica 50 33.33%二、调用自编二、调用自编HistRate函数作频数和频率分布表函数作频数和频率分布表 HistRate函数函数调用方式:调用
35、方式:result=HistRate(x)功能:功能:用来作频数和频率分布表用来作频数和频率分布表2023-5-5【例例17.5-1续续】统计数值型数组中各元素出现的频数、统计数值型数组中各元素出现的频数、频率。频率。x=2 2 6 5 2 3 2 4 3 4 3 4 4 4 4 2 2 6 0 4 7 2 5 8 3 1 3 2 5 3 6 2 3 5 4 3 1 4 2 2 2 3 1 5 2 6 3 4 1 2 5;HistRate(x)取值取值 频数频数 频率频率 累积频率累积频率 0 1 1.96%1.96%1 4 7.84%9.80%2 14 27.45%37.25%3 10 19
36、.61%56.86%4 10 19.61%76.47%5 6 11.76%88.24%6 4 7.84%96.08%7 1 1.96%98.04%8 1 1.96%100.00%2023-5-5【例例17.5-2续续】统计字符串中各字符出现的频数、频率。统计字符串中各字符出现的频数、频率。x=If x is a numeric array,TABLE is a numeric matrix.;HistRate(x)ans=取值取值 频数频数 频率频率(%)累积频率累积频率(%)I 1 2.4390 2.4390 f 1 2.4390 4.8780 x 2 4.8780 9.7561 i 5 1
37、2.1951 21.9512 s 2 4.8780 26.8293 a 5 12.1951 39.0244 n 2 4.8780 43.9024 u 2 4.8780 48.78052023-5-5【例例17.5-3续续】统计字符型数组中各行元素出现的统计字符型数组中各行元素出现的频数频率频数频率.x=崔家峰崔家峰;孙乃喆孙乃喆;安立群安立群;王洪武王洪武;王玉杰王玉杰;高纯静高纯静;崔家峰崔家峰;叶叶 鹏鹏;关泽满关泽满;谢中华谢中华;王宏志王宏志;孙乃喆孙乃喆;崔家峰崔家峰;谢中华谢中华;HistRate(x)ans=取值取值 频数频数 频率频率(%)累积频率累积频率(%)崔家峰崔家峰 3
38、 21.4286 21.4286 孙乃喆孙乃喆 2 14.2857 35.7143 安立群安立群 1 7.1429 42.8571 王洪武王洪武 1 7.1429 50 王玉杰王玉杰 1 7.1429 57.1429 高纯静高纯静 1 7.1429 64.2857 叶叶 鹏鹏 1 7.1429 71.4286 关泽满关泽满 1 7.1429 78.5714 谢中华谢中华 2 14.2857 92.8571 王宏志王宏志 1 7.1429 1002023-5-5【例例17.5-4续续】统计字符串元胞数组中各字符串出现统计字符串元胞数组中各字符串出现的频率。的频率。x=崔家峰崔家峰;孙乃喆孙乃喆;
39、安立群安立群;王洪武王洪武;王玉杰王玉杰;高纯静高纯静;崔家峰崔家峰;叶叶 鹏鹏;关泽满关泽满;谢中华谢中华;王宏志王宏志;孙乃喆孙乃喆;崔家峰崔家峰;谢中华谢中华;HistRate(x)ans=取值取值 频数频数 频率频率(%)累积频率累积频率(%)崔家峰崔家峰 3 21.4286 21.4286 孙乃喆孙乃喆 2 14.2857 35.7143 安立群安立群 1 7.1429 42.8571 王洪武王洪武 1 7.1429 50 王玉杰王玉杰 1 7.1429 57.1429 高纯静高纯静 1 7.1429 64.2857 叶叶 鹏鹏 1 7.1429 71.4286 关泽满关泽满 1 7
40、.1429 78.5714 谢中华谢中华 2 14.2857 92.8571 王宏志王宏志 1 7.1429 1002023-5-5【例例17.5-5续续】统计名义尺度(如性别,职业,产品型号等)统计名义尺度(如性别,职业,产品型号等)数组中各元素出现的频数、频率。数组中各元素出现的频数、频率。load fisheriris species=nominal(species);HistRate(species)ans=取值取值 频数频数 频率频率(%)累积频率累积频率(%)setosa 50 33.3333 33.3333 versicolor 50 33.3333 66.6667 virginica 50 33.3333 100