1、粒子物理与核物理实验中的粒子物理与核物理实验中的数据分析数据分析杨振伟杨振伟清华大学清华大学第第十十二讲:特征函数二讲:特征函数2本讲要点本讲要点n特征函数的定义特征函数的定义n特征函数的性质特征函数的性质n常用概率密度函数的特征函数常用概率密度函数的特征函数n特征函数的应用特征函数的应用n中心极限定理中心极限定理n利用特征函数求估计量的利用特征函数求估计量的p.d.f.p.d.f.3特征函数的定义特征函数的定义()()ikxikxxkE eef x dx特征函数的本质是什么?特征函数的本质是什么?设随机变量设随机变量 x 的概率密度函数为的概率密度函数为 f(x),则,则特征函数特征函数 定
2、义为定义为 的期望值,即的期望值,即()xkikxe特征函数的本质是特征函数的本质是 概率密度函数概率密度函数 f(x)的的傅里叶变换傅里叶变换。任意概率密度函数都存在特征函数。任意概率密度函数都存在特征函数。4特征函数与概率密度函数的关系特征函数与概率密度函数的关系1()()2ikxxf xek dk特征函数则与概率密度函数特征函数则与概率密度函数一一对应一一对应。概率密度由特征函数的反傅里叶变换概率密度由特征函数的反傅里叶变换唯一确定唯一确定已知概率密度函数已知概率密度函数f(x),我们往往关心其特征,我们往往关心其特征值值(比如均值、方差比如均值、方差)。特征值提供了概率密度函数最重要的
3、信息,但特征值提供了概率密度函数最重要的信息,但不能完全确定概率密度函数的所有性质。不能完全确定概率密度函数的所有性质。也就是说,概率密度函数也就是说,概率密度函数 f(x)与其特征与其特征函数函数 是是等价等价的。的。()xk5为什么引入特征函数为什么引入特征函数问题:既然概率密度函数与特征函数一一对应,问题:既然概率密度函数与特征函数一一对应,给出任意一个都可以完全确定概率密度函数的给出任意一个都可以完全确定概率密度函数的所有性质,为什么还需要引入特征函数?所有性质,为什么还需要引入特征函数?很多问题直接用概率密度函数不易处理,很多问题直接用概率密度函数不易处理,但用特征函数处理则非常方便
4、。比如,但用特征函数处理则非常方便。比如,1)求独立随机变量之和的分布的卷积变为)求独立随机变量之和的分布的卷积变为乘法运算;乘法运算;2)求)求n阶代数矩变为求阶代数矩变为求n阶微分阶微分.6特征函数的性质特征函数的性质(1)*(1)(0)1(2)()1(3)()()(4),()()(5),()()()(6)()(0)xxxxibtyxxyxylxmmxkkkyaxba bteakx ytkkE xklmli E x(m)若其中为常数,则独立随机变量和的特征函数为特征函数的积,即,设独立,则若存在,则为 次可导,并且对1,有7特征函数的性质特征函数的性质(2)()(5),()()()()()
5、x yxyikxikyik x yikxikyikxikyxyx ytkkxyeeE eE e eE eE ekk独立随机变量和的特征函数为特征函数的积,即,设独立,则证明:由于 和 独立,所以与独立,从而1212()()()()nnzxxxzxxxkkkk可以推广到可以推广到n个独立随机变量之和个独立随机变量之和1()()2ikzzf zek dk利用反傅立叶变换可求出利用反傅立叶变换可求出z的概率密度函数的概率密度函数8特征函数的性质特征函数的性质(3)(6)()(0)()()0()()()()0(0)lxmmxllikxmikxmikxmkikxxmxE xklmli E xE xxf
6、x dxkef x dxmlmldkef x dxixef x dxi E x edkk(m)(m)(m)若存在,则为 次可导,并且对1,有证明:存在,于是含参变量 的广义积分可以对 求 次导。所以,对,有令,即可得到mmi E x利用特征函数可以方便地求出各阶代数矩。利用特征函数可以方便地求出各阶代数矩。9常用概率密度函数的特征函数常用概率密度函数的特征函数222!()!1/111()2122(;,)(1)(1)1(;)exp(1)!(;,)()0(;)(;,p.d.f.)kexpe()nN nikNNn N nniki ki kxikxf n N pppp ef neenxeef xikf
7、 xef x 分布类型二项分布泊松分布均匀分布指 其它数分布高斯分布/222212/2 1/2/212(/2)12|11xp()(;)(1 2)()nnznnkxi kkf z nzeikf xe分布柯西分布柯西分布在柯西分布在k=0处不可导,即各阶矩都不存在。处不可导,即各阶矩都不存在。10特征函数的应用特征函数的应用(1)问题:既然概率密度函数与特征函数一一对应,问题:既然概率密度函数与特征函数一一对应,给出任意一个都可以完全确定概率密度函数的给出任意一个都可以完全确定概率密度函数的所有性质,为什么还需要引入特征函数?所有性质,为什么还需要引入特征函数?很多问题直接用概率密度函数不易处理,
8、很多问题直接用概率密度函数不易处理,但用特征函数处理则非常方便。比如,但用特征函数处理则非常方便。比如,1)求独立随机变量之和的分布的卷积变为)求独立随机变量之和的分布的卷积变为乘法运算;乘法运算;2)求)求n阶代数矩变为求阶代数矩变为求n阶微分阶微分.11特征函数的应用特征函数的应用(2)22222222112220012222222012222220222211()1()1()i kki kkkki kkki kkkdE xeik ei dkidV xE xE xei dkikei求均值和方差(以高斯分布为例)求均值和方差(以高斯分布为例)类似地,可以很容易求各阶中心矩类似地,可以很容易求
9、各阶中心矩特征函数为特征函数为2212()i kkke12特征函数的应用特征函数的应用(3)取极限取极限 为常数为常数0,pNpN 求求p.d.f.的极限行为(以二项分布为例)的极限行为(以二项分布为例)即二项分布在试验次数很大并且均值保持不变即二项分布在试验次数很大并且均值保持不变时,趋向于泊松分布时,趋向于泊松分布同样可以证明同样可以证明很大时,泊松分布趋向于高斯很大时,泊松分布趋向于高斯分布。分布。()(1)1Nikkp e特征函数为特征函数为()(1)1(1)1exp(1)NNikikNikkp eeNe 13特征函数的应用特征函数的应用(4)222222211221()()2()()
10、()xxyyxyxyikkikkzxyikkkkkeee则则z=x+y的特征函数的特征函数求独立随机变量之和的求独立随机变量之和的p.d.f.两个独立的高斯随机变量两个独立的高斯随机变量x和和y,均值为均值为 ,方差为,方差为,xy22,xy这正是均值这正是均值 ,方差,方差 的的高斯分布的特征函数高斯分布的特征函数。同样可证泊松变量之和仍服从泊松分布。同样可证泊松变量之和仍服从泊松分布。zxy222zxy1422221()iiiniiiinxxzn(,),个独立高斯随机变量均值为方差为证明服从自由度为 的分布。特征函数的应用特征函数的应用(5)/221/22/22,1()2()(;1)2nd
11、f()(1 2)()(1 2),ndfiiiiiziznnizixyzydyg zyef z ndzzzkikzykikn2证:首先容易证明服从标准高斯分布 并且的 概率密度函数为即 服从=1的分布,其特征函数为。若,显然特征函数为此即=的分布的特征函数。15中心极限定理中心极限定理(1)2233()3/20022221220()()()()(0)!3!()exp/(2)12jjjjjjjjmmjjmmjjjmmjjnjjjjjxyE yE yyknnE xkikikkE ymmnnkkknzzny证:定义,则,。将 的特征函数泰勒展开,则在大 极限下,忽略高阶项,。定义,则 的特征函2212
12、2()()exp/(2)0nzjjjjjjkkknzzxnz数为,即 为均值为,方差为的高斯分布。变换回,则 为均值为,方差为的高斯分布。定理:假设有定理:假设有n个独立随机变量个独立随机变量xj,均值与方差,均值与方差分别为分别为 。在大在大n极限下,极限下,为高斯随机为高斯随机变量,均值和方差分别为变量,均值和方差分别为 和和 。2,jj jjzxjj2jj16中心极限定理中心极限定理(2)n有限时,中心极限定理成立的条件与程度:有限时,中心极限定理成立的条件与程度:12121126/12niniiinxzxn大致说来,只要大致说来,只要z的求和中,每个的求和中,每个xj的贡献都很的贡献都
13、很小即可。即小即可。即 z由大量微小贡献组合而成。由大量微小贡献组合而成。例如,很多地方经常用例如,很多地方经常用12个个(0,1均匀分布的均匀分布的随机变量之和近似高斯分布。随机变量之和近似高斯分布。如果某个或某几个如果某个或某几个xj的贡献非常大,则求和的的贡献非常大,则求和的的结果将明显偏离高斯分布。的结果将明显偏离高斯分布。为什么取n=12?17求估计量的求估计量的p.d.f.(1)11/1(/)()1/(1)()1/(1)11()2(1)(1)!()(/)(;,)(1/(;)!,/)nxiinzikznzznnnznnkikzxnkikzezgzdkeikngz dz dnn nng
14、ne 由于,所以的特征函数为。反傅立叶变换可以得到 的p.d.f.以指数分布为例以指数分布为例 :参数参数 的最大似然估计量为的最大似然估计量为其分布可以用特征函数法求得。其分布可以用特征函数法求得。1(;)exp(/)f xx11niixn这是伽马分布,这是伽马分布,n很大时趋于高斯分布。很大时趋于高斯分布。18求估计量的求估计量的p.d.f.(2)1(/)00(/)(;,)(1)!nnnnEgndedn 要求寿命要求寿命 的平均值,可以的平均值,可以11niitn也可以用刚才的也可以用刚才的p.d.f进行积分:进行积分:111111 nnniiiiiEEtE tnnn有意思的是有意思的是
15、的最大似然估计量的最大似然估计量1/1/如何求其期待值?如何求其期待值?1/?niiEE nt19用该用该p.d.f求解期待值:求解期待值:求估计量的求估计量的p.d.f.(3)0(;,)1nEhndn可以看出可以看出 不是无偏估计量。不是无偏估计量。()/1()1(;,)(;,)/(1)!nnnnhngndden可以先求可以先求 的分布函数:的分布函数:20对于给定对于给定 以及观测值以及观测值 ,通过通过求估计量期待值的置信区间求估计量期待值的置信区间obsobsg(;)g(;)a db d求得置信区间求得置信区间a,b。obs利用特征函数方法求出估计量利用特征函数方法求出估计量(如如 )的的p.d.f.,有了估计量的有了估计量的p.d.f.(如如 ),很多问题很多问题都可以方便地处理,比如置信区间。都可以方便地处理,比如置信区间。(;,)gn,21小结小结1.特征函数的定义特征函数的定义2.特征函数的性质特征函数的性质3.常用概率密度函数的特征函数常用概率密度函数的特征函数4.特征函数的应用特征函数的应用5.中心极限定理中心极限定理6.利用特征函数寻找估算子的利用特征函数寻找估算子的p.d.f.()()()()(0)x yxymmmxkkkxyi E x:随机变量 和 独立:微分与代数矩的关系()()ikxikxxkE eef x dx傅立叶变换