粒子物理与核物理实验中的数据分析1学习培训课件.ppt

上传人(卖家):林田 文档编号:4142221 上传时间:2022-11-14 格式:PPT 页数:37 大小:1.39MB
下载 相关 举报
粒子物理与核物理实验中的数据分析1学习培训课件.ppt_第1页
第1页 / 共37页
粒子物理与核物理实验中的数据分析1学习培训课件.ppt_第2页
第2页 / 共37页
粒子物理与核物理实验中的数据分析1学习培训课件.ppt_第3页
第3页 / 共37页
粒子物理与核物理实验中的数据分析1学习培训课件.ppt_第4页
第4页 / 共37页
粒子物理与核物理实验中的数据分析1学习培训课件.ppt_第5页
第5页 / 共37页
点击查看更多>>
资源描述

1、11/14/20221粒子物理与核物理实验中的粒子物理与核物理实验中的数据分析数据分析11/14/20222随机变量与概率密度函数随机变量与概率密度函数假设实验结果为假设实验结果为 x (记作样本空间中元素记作样本空间中元素)的概率为的概率为(,)()Pxx xdxf x dx观测到到在在范范围内内那么概率密度函数那么概率密度函数 p.d.f.定义为定义为 f(x),它对全部样本空间,它对全部样本空间S 满足满足()1Sf x dx 定义累积分布函数为定义累积分布函数为()()xF xf x dx 对于离散型随机变量对于离散型随机变量1(),1,()()iniiiiixxfP xfF xP x

2、)(xf)(xFxx11/14/20223 分位数、中值与模分位数、中值与模分位分位点点 x 定义为随机变量定义为随机变量 x 的值,它使得的值,它使得()F x 这里这里 0 1。因此可以容易求出分位点。因此可以容易求出分位点1()xF 随机变量随机变量 x 的的中值中值定义为定义为 11/2(1/2)xF 随机变量随机变量 x 被观测到大于或小于中值的概率是相等的。被观测到大于或小于中值的概率是相等的。模模定义为使概率密度函数值达到极大的随机变量值。定义为使概率密度函数值达到极大的随机变量值。11/14/20224直方图与概率密度函数直方图与概率密度函数概率密度函数概率密度函数 p.d.f

3、.就是拥有无穷大样本,区间宽度为零,就是拥有无穷大样本,区间宽度为零,而且归一化到单位面积的而且归一化到单位面积的直方图直方图。()()()()N xf xn xN xnx 每每个个区区间的事的事例例数数 频数数填入填入直直方方图的的总事事例例数数区区间的的宽度度)(xN)(xN)(xN)(xfxxxx直方图在统计分析中非常重直方图在统计分析中非常重要,应准确理解它的含义。要,应准确理解它的含义。有有限限xnxn 0,11/14/20225多变量情形多变量情形观测量大于一个,例如观测量大于一个,例如 x 与与 y()(,)(,)p.d.f.(,)1P ABf x y dxdyf x yf x

4、y dxdy 联合合的的11/14/20226边缘分布边缘分布将联合概率密度函数将联合概率密度函数 p.d.f.分别投影到分别投影到 x 与与 y 轴轴y)(yfyx)(xfxyx()(,)y()(,)(),()p.d.f.xyxyxfxf x y dyfyf x y dxfxfy 投投影到影到轴:投投影到影到边缘的的轴:定定义:11/14/20227若若 x,y 相互独立,则可构造相互独立,则可构造2-维维p.d.f条件概率密度函数条件概率密度函数利用条件概率的定义,可得到利用条件概率的定义,可得到dxxfdxdyyxfAPBAPABPx)(),()()()|(定义条件概率的密度函数定义条件

5、概率的密度函数 p.d.f.为为)(),()|(,)(),()|(yfyxfyxg xfyxfxyhyx则贝叶斯定理可写为则贝叶斯定理可写为)()()|()|(yfxfxyhyxgyx)()(),(yfxfyxfyx h(y|x)yyxdxdx11/14/20228名词总汇名词总汇随机事例随机事例概率概率条件概率条件概率相对频率与主观概率相对频率与主观概率贝叶斯定理贝叶斯定理随机变量随机变量概率密度函数概率密度函数条件密度函数条件密度函数直方图直方图11/14/20229提醒:概率都是条件概率提醒:概率都是条件概率由柯尓莫哥洛夫公理,我们定义了概率由柯尓莫哥洛夫公理,我们定义了概率 P(A)。

6、但在实际应用中,我们总是对但在实际应用中,我们总是对 A 相对于许多样本空间的概率相对于许多样本空间的概率感兴趣,而不仅仅只是一个空间。因此,通常以记号感兴趣,而不仅仅只是一个空间。因此,通常以记号(|)P A S来表示所进行的研究是在特定的样本空间来表示所进行的研究是在特定的样本空间 S 中,也就是中,也就是 A 相相对于对于 S 的条件概率。的条件概率。因此,所有概率在实际应用中都是因此,所有概率在实际应用中都是条件概率条件概率。只有当只有当 S 的选择是明白无误时,才能简单记为的选择是明白无误时,才能简单记为(|)P A S()P A11/14/202210证明举例:事例与逆事例证明举例

7、:事例与逆事例如果 A 是在 S 中的任意一个事例,则()1()P AP A证明:由于 A 与 根据定义是互斥的,并且从文恩图得到AAAS因此可以写出()()()()1P AP AP AAP S()1()P AP A11/14/202211举例:检查给定概率的合理性举例:检查给定概率的合理性如果一个实验有三种可能并且互斥的结果 A,B 和 C,检查下列各种情况给出的概率值是否是合理的:1)()1/3,()1/3,()1/32)()0.64,()0.38,()0.023)()0.35,()0.52,()0.264)()0.57,()0.24,()0.19P AP BP CP AP BP CP A

8、P BP CP AP BP C 结论:只有结论:只有1)与)与4)是合理的。)是合理的。评论:作为一个合格的实验研究人员,一定要具备判断评论:作为一个合格的实验研究人员,一定要具备判断 结果是否合理的能力!结果是否合理的能力!11/14/202212举例:检查经验概率密度函数举例:检查经验概率密度函数221)()1,2,3,422)()0,1,2,3,425xf xxxh xx对于对于实验上经常经验性地从直方图中给出概率密度函数(例如通过拟合直方图分布等等),但是需要确定得到的函数是否满足概率密度函数的定义,例如试判断哪一个可以用作概率密度函数?答案:1)有负概率值;2)累积函数值大于1。因此

9、,两者在给定的随机变量范围内都不能用作概率密度函数。11/14/202213数据分析中的问题数据分析中的问题粒子与核物理实验中对动量的测量通常是分别测量粒子与核物理实验中对动量的测量通常是分别测量xypzp在已知两分量测量值的概率密度函数情况下,总动量为在已知两分量测量值的概率密度函数情况下,总动量为如何导出总动量的测量值的概率密度函数?如何导出总动量的测量值的概率密度函数?22xyzppp(,)xyzf pp()g p是研究随机变量函数的是研究随机变量函数的p.d.f问题。问题。11/14/202214一维随机变量的函数一维随机变量的函数随机变量的函数自身也是一个随机变量。随机变量的函数自身

10、也是一个随机变量。假设假设 x 服从服从 p.d.f.f(x),对于函数对于函数 a(x),其,其p.d.f.g(a)为何?为何?()()()()()(),()()()()()dSx a dax adxx adadax ag a daf x dxdSaa adaxg a daf x dxf x dxdxg af x ada 在在内内的的 空空间间范范围围cos:与例如11/14/202215函数的逆不唯一情况函数的逆不唯一情况假如假如 a(x)的逆不唯一,则函数的的逆不唯一,则函数的 p.d.f.应将应将 dS 中对应于中对应于 da 的所有的所有 dx 的区间包括进来的区间包括进来2:,2(

11、)(),22()()()22dSdaaxxadxag a daf x dxdadadSaaaaaafafag aaa 例例如如11/14/202216多维随机变量的函数多维随机变量的函数考虑随机矢量考虑随机矢量 与函数与函数 ,对应的,对应的 p.d.f.),.,(1nxxx)(xa11()(,.,).()()nndSg a daf xx dxdxdSa xaa xadax 在在与与定定义义的的曲曲面面空空间间范范围围如果两个独立变量如果两个独立变量 x 与与 y,分别按,分别按 g(x)与与 h(y)分布,那分布,那么函数么函数 z=xy 应具有何种形式?应具有何种形式?(,)()()f x

12、 yg x h y()/|/|()(,)()()()()dSdSz dzxz xf z dzf x y dxdyg x h y dxdyg x dxh y dy 11/14/202217多维随机变量的函数多维随机变量的函数(续一续一)()()()()()|zdxzdyf zg x hgh yxxyy fgh记作记作 g 与与 h 的的Mellin卷积卷积如果函数为如果函数为 z=x+y,则应具有何种形式?,则应具有何种形式?()()()()()f zg x h zx dxg zy h y dy fgh记作记作 g 与与 h 的傅立叶卷积的傅立叶卷积注意:通常将两者皆称为注意:通常将两者皆称为

13、g 与与 h 的卷积的卷积,已相同记号表示。,已相同记号表示。11/14/202218多维随机变量的函数多维随机变量的函数(续二续二)考虑具有联合的考虑具有联合的 p.d.f.的随机矢量的随机矢量 ,构造,构造 个线性独立的函数:个线性独立的函数:,而且其逆,而且其逆函数函数 存在。那么存在。那么 的联合的联合 p.d.f.为为1(,.,)nxxx n1()(),.,()na xaxax 1(),.,()nx ax aa()()g aJ f x 这里这里 是雅可比行列式是雅可比行列式J1111222212nnnnxxxaaaxxxaaaJxa 任意一个函数任意一个函数均可通过对函数均可通过对函

14、数积分掉其它不用的变积分掉其它不用的变量而得到。是数据处量而得到。是数据处理中误差传递的基础。理中误差传递的基础。()iig a()g a 11/14/202219期待值期待值考虑具有考虑具有 p.d.f.的随机变量的随机变量 ,定义,定义期待期待(平均平均)值为值为)(xfxdxxfxxE)(注意注意:它不是它不是 的函数,而是的函数,而是 的一个参数。的一个参数。x)(xf通常记为:通常记为:xE对对离散型离散型变量,有变量,有niiixPxxE1)(对具有对具有 p.d.f.的函数的函数 ,有,有)(xy)(ygdxxfxydyyygyE)()()(方差方差定义为定义为222)(xExE

15、xExV通常记为:通常记为:2xV标准偏差标准偏差:211/14/202220协方差与相关系数协方差与相关系数定义定义协方差协方差 (也可用矩阵表示也可用矩阵表示 )为为,covyxxyVyxyxxyEyxEyx)(,cov相关系数相关系数定义为定义为 11 ,covxyyxxyyx如果如果 x,y 独立,即独立,即)()(),(yfxfyxfyx则则 0,covyx11/14/202221举例:样本平均值举例:样本平均值假设实验上研究一核素衰变寿命,在探测效率为100%的情况下,每次探测到的寿命为 ti,一共测量了 n 次,求平均寿命(也就是寿命的期待值)。根据离散型期待值的定义1()nii

16、iE tt P t问题的关键是 ti 的概率密度函数是什么?根据概率的相对频率定义,在 n 次测量中出现 ti 频率为一次1()iP tn因此,期待值(或平均寿命)为1111 nniiiiE tttnn思考:如果频率为 mi 次,结果会不同吗?11/14/202222误差传递误差传递),.,(1nxxx 假设假设 服从某一联合服从某一联合 p.d.f.,我们也许并不我们也许并不全部知道该函数形式全部知道该函数形式,但假设我们有协方差,但假设我们有协方差)(xf,covjiijxxV 和平均值和平均值 xE现考虑一函数现考虑一函数 ,方差,方差 是什么?是什么?)(xy22)(yEyEyV将将

17、在在 附近按附近按泰勒展开泰勒展开到第一级到第一级)(xy)()()(1iixniixxyyxy然后,计算然后,计算 与与 yE2yE11/14/202223误差传递误差传递(续一续一)由于由于0iixE所以利用泰勒展开式可求所以利用泰勒展开式可求)()(yxyEijxnjijinjjjxjniiixiiixniiVxyxyyxxyxxyExExyyyxyE1,211122)()()()(2)()(11/14/202224误差传递误差传递(续二续二)两项合起来给出两项合起来给出 的方差的方差)(xy2,1 nyiji jijxyyV yVxx如果如果 之间是无关的,则之间是无关的,则 ,那么上

18、式变为,那么上式变为ixijiijV22221 nyiiixyV yx类似地,对于类似地,对于 组函数组函数m)(),.,()(1xyxyxym11/14/202225误差传递误差传递(续三续三)ijxnjijliklkklVxyxyyyU1,cov或者记为矩阵形式或者记为矩阵形式xjiijTxyAAVAU ,)(xy注意:上式只对注意:上式只对 为线性时是精确的,近似程度在函数非为线性时是精确的,近似程度在函数非线性区变化比线性区变化比 要大时遭到很大的破坏。另外,上式并不需要大时遭到很大的破坏。另外,上式并不需要知道要知道 的的 p.d.f.具体形式,例如,它可以不是高斯的。具体形式,例如

19、,它可以不是高斯的。iix11/14/202226误差传递的一些特殊情况误差传递的一些特殊情况,cov2212221221xxxxyy2121222221212221,cov2xxxxxxyxxyy注意在相关的情况下,最终的误差会有很大的改变,例如当注意在相关的情况下,最终的误差会有很大的改变,例如当1 ,10 ,212121xxy0 ,0211 ,0 :14.1 ,211 ,0 :022212221yyyVyEyVyE这种特征有时候是有益的:将公共的或难以估计的误差,这种特征有时候是有益的:将公共的或难以估计的误差,通过适当的数学处理将它们消掉,达到减小误差的目的。通过适当的数学处理将它们消

20、掉,达到减小误差的目的。11/14/202227坐标变换下的误差矩阵坐标变换下的误差矩阵实验上经常通过测量粒子在探测器中各点的击中坐标实验上经常通过测量粒子在探测器中各点的击中坐标(x,y)来拟合在极坐标下的径迹来拟合在极坐标下的径迹(r,)。通常情况下,通常情况下,(x,y)的的测量是不关联的。测量是不关联的。222tan/rxyy x (,)(,)TU rAV x y A 由于由于因此,坐标变换后的误差矩阵为因此,坐标变换后的误差矩阵为2222222222222222222222()0cov(,)101cov(,)()()xyyxxryyxxyxyxyxyxyrrrrrryxyxrxyry

21、xrrrrrr 11/14/202228大亚湾反应堆中微子实验大亚湾反应堆中微子实验11/14/2022291r2r1S2S反应堆中微子反应堆中微子n反应堆能产生大量反电子型中微子3 GW 热功率反应堆206 10个反电子中微子/秒n中微子几乎无损穿透物质假设产生的中微子以球面波传播,那么在任一地方任一给定面元的中微子流强为24rSIIrenpe 11/14/202230大亚湾中微子振荡大亚湾中微子振荡n中微子振荡中微子在运动过程中自己不断改变形态n测量中微子形态随运动距离的改变1214rSIIr2224rSIIrn中微子形态随运动距离的改变理论预言2132()4(,sin)4reeSII P

22、rSIfmr 截面效率11/14/202231如何保证如何保证1%精度?精度?n测量中微子振荡的影响2112rIII方案:方案:那一种方案更易实现那一种方案更易实现1%精度的测量?为什么?精度的测量?为什么?132(,sin)4rSII fmr 截面效率11/14/202232不同坐标系下相关性的变化不同坐标系下相关性的变化通过转动坐标,随机变量的相关性会发生改变。通过转动坐标,随机变量的相关性会发生改变。xyx y 显然,通过将坐标系转动显然,通过将坐标系转动 450,上面的相关性在新坐标系下,上面的相关性在新坐标系下消失。消失。11/14/202233随机变量作正则变换去除相关性随机变量作

23、正则变换去除相关性对应的协方差矩阵为对应的协方差矩阵为11,1,1cov,cov,cov,ijijnnikkjllkknikjlklk lnTikklljk lUyyA xA xA AxxA V A ,1cov,klklnkliji jijxUyyyyVxx 非线性情况非线性情况1niijjjyA x 假设有假设有 n 个随机变量个随机变量 x1,xn 以及协方差矩阵以及协方差矩阵Vij=covxi,xj,可以证明有可能通过可以证明有可能通过线性变换线性变换重新定义重新定义 n 个新的变量个新的变量 y1,yn 使得对应的协方差矩阵使得对应的协方差矩阵Uij=covyi,yj非对角元为零。令非

24、对角元为零。令11/14/202234变换后的变量协方差矩阵对角化变换后的变量协方差矩阵对角化为了使协方差矩阵为了使协方差矩阵 U 对角化对角化TUAVA iiiiikl li kVrrV rr 或或由于协方差矩阵总是对称的,因此可知本征矢量是正交的由于协方差矩阵总是对称的,因此可知本征矢量是正交的1nijijk kijkrrr r 11 nniTjTikikijjijiijjkjjikjjArArA Ar rrr ,可先确定协方差矩阵可先确定协方差矩阵 V 的本征列矢量的本征列矢量 ,i=1,n。解方程解方程ir 变换矩阵变换矩阵 A 由本征矢量由本征矢量 给出,即给出,即r 11/14/2

25、02235正则变换后变量的协方差矩阵正则变换后变量的协方差矩阵因此,正则变换的协方差矩阵为因此,正则变换的协方差矩阵为,1,11nTijikklljk lnijkkl lk lnijkj kkijjjijUA V Ar V rrrrr 变量作正则变换变量作正则变换后,其方差由原后,其方差由原协方差矩阵协方差矩阵 V 的的本征值给出。本征值给出。对应于矢量的转动对应于矢量的转动不改变模的大小。不改变模的大小。|y|2=yTy=xTATAx=|x|2尽管非关联变量经常容易尽管非关联变量经常容易处理,但是对经过变换的处理,但是对经过变换的变量的理解不一定容易。变量的理解不一定容易。11/14/202

26、236带电粒子在闪烁体的射程带电粒子在闪烁体的射程在原来的定义下,可以得到在原来的定义下,可以得到粒子射程随动量大小的变化粒子射程随动量大小的变化关系。通过转动变换,粒子关系。通过转动变换,粒子的射程与动量发生了改变,的射程与动量发生了改变,无物理含义,但是提供了一无物理含义,但是提供了一个很好的粒子类型甄别变量。个很好的粒子类型甄别变量。11/14/202237小结小结概率概率随机变量随机变量随机变量函数随机变量函数误差传递误差传递定义:柯尔莫哥洛夫公理定义:柯尔莫哥洛夫公理+条件概率条件概率解释:频率或信心程度解释:频率或信心程度贝叶斯定理贝叶斯定理概率密度函数概率密度函数 p.d.f.累积分布函数累积分布函数联合,边缘与条件的联合,边缘与条件的 p.d.f.函数自身也是随机变量函数自身也是随机变量 几种方法找出几种方法找出 p.d.f.函数方差的计算方法是基于一阶泰勒展开,只对线性方程精确。函数方差的计算方法是基于一阶泰勒展开,只对线性方程精确。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 常用办公文档
版权提示 | 免责声明

1,本文(粒子物理与核物理实验中的数据分析1学习培训课件.ppt)为本站会员(林田)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|