1、第四章 风险统计和概率分析本章内容提要w 风险统计分析w 概率的计算w 概率分布本章学习目标w 学会数据的整理和表示;w 掌握数据集中趋势的测度与数据离散程度的测度;w 了解并会运用常见的概率分布。本章重点与难点w 重点:1.数据的整理和表示;2.数据的计量(数据集中趋势的测度与数据离散程度的测度)。w 难点:数据收集。第一节 风险统计分析一、数据收集(一)数据来源:1.企业自身的历史损失资料(含近期的损失资料);2.同类系统的损失资料;3.外界公布的有关的损失统计资料;4.国际性动态资料。一、数据收集(二)数据要求1.准确性:反映客观情况;2.完整性:避免得出片面的结果。一、数据收集(三)收
2、集方法1.论文、研究报告及其他出版物;2.风险咨询机构、保险公司、政府有关机构;3.直接调查。例:直接调查收集数据信息时,表格设计注意要点(PP71-72)。二、数据整理(一)数据整理:根据研究任务的需要,按自己设计的整理方案要求,将收集来的数据进行加工、综合,使之条理化、系统化,成为能够反映事物总体特征的综合资料。(二)几个概念:频数、频率(相对频数=频数/总数)、组距(上限-下限)、组中值=(上限+下限)/2。(三)分组频数的几个问题:1.组距可以是等距,也可以是不等距;二、数据整理2.就离散型和连续型变量,上下限写法不同。对离散型可一一列举,而对连续型,相邻两组的上下限应重合,并统一规定
3、上下限数值的归属。习惯下限包括在本组中,而上限不包括在本组中。3.若N表总次数,斯特奇斯组距C经验公式:C=(最大值-最小值)/(1+3.322lgN)三、数据的表示(一)频数分布表示1.频数分布;(P72)2.频数分布比较;(P73)3.相对频数分布(P73)4.累计频数分布(PP73-74)三、数据的表示(二)统计图表示1.直方图:有频数和频率直方图(底为各组的组距,高为频率除以组距)。2.圆饼图:直观。3.柱状图:能表示多个变量的值(P76)。三、数据的表示4.频率折线图:连接图4-1或图4-2中每个长方形上层的中点而成,折线代表的函数近似于密度函数,其累计频率函数成为经验分布函数。极限
4、情形下为密度函数与分布函数。5.曲线图:为所选目的而采用(PP76-77)。四、数据的计量(比照随机变量相关概念理解)w 数学期望(均值)w 中位数:连续时为F(x)=1/2的解x;离散为1/2=F(x)Za=a,(0=a=1)。w 上a分位点:PX=Za=a,(0=a=1)。四、数据的计量(比照随机变量相关概念理解)w 方差w 标准差w 变异系数(Coefficient variation)w 偏态系数(Skewness)四、数据的计量(一)数据集中趋势的测度(位置的计量)1.算术平均值(PP78-79);2.几何平均值(P79);3.中位数(P80);4.众数(P80)。四、数据的计量(二
5、)数据离散程度的测度1.极差:数组中的最大与最小值之差。2.均方差与标准差(P81)数组:例:分组频数数据的标准差(PP81-82)21()nxxn四、数据的计量3.变差系数:标准差除以平均数的百分比。例:P83四、数据的计量(三)偏态计算公式1:P84计算公式2:依随机变量的偏度类比。第二节 概率的计算略!第三节 概率分布一、常见的离散型分布:二项分布、泊松分布、负二项分布等。二、常见的连续型分布:均匀分布、正态分布、指数分布、伽玛分布、对数正态、帕累托分布等。三、实际分布与理论分布第三节 概率分布拟合损失分布w 整理记录数据;w 选择分布类型;w 分布参数的估计;w 拟合分布检验:(1)卡方检验;(2)偏度、峰度来检验总体是否为正态分布。思考题与作业题思考题1:写出对数正态分布、帕累托分布的密度函数,并观察其图形特征?思考题2:考察负二项分布的形成过程,阐述其描述现实生活情景的适应性。讨论专题:讨论专题:查找数据,用SPSS、SAS 或Eviews等统计软件测试其分布。作业题:第3题、第4题(P99)