1、第第9讲讲 后测检验后测检验39380758 B1039380758 B10北北407407华南理工大学金融工程研究中心华南理工大学金融工程研究中心 华南理工大学经济与贸易学院华南理工大学经济与贸易学院于孝建于孝建 博士博士 讲师讲师金融风险管理金融风险管理 Financial Risk Management个人主页:个人主页:http:/ 模型是否有效?模式是否稳健(鲁棒)?巴塞尔委员会对于银行采用的内部模型的评测与惩罚后测检验的设立 模型的准确性 模型能够有效地反映标的物的实际价值 最直接的办法系统地比较实际损失水平与用模型预测出的水平之间的差别 如果模型是完好校准的,所观察到的在VaR预
2、测以外的点,就应该会与置信水平相一致。后测检验的设立1008070605040302010010 20 30 40 50 60 70 80日损益(绝对值)日损益(绝对值)日价格波动率日价格波动率异常异常值点值点异常异常值点的数量称为异常数值点的数量称为异常数NpT观察样本数观察样本数置信度置信度后测检验的设立 如果实际出现的异常很多模型低估了风险 风险资本金过少 如果实际出现的异常过少模型高估了风险 风险资本金过多,影响资金使用效率后测检验的设立:一个例子1008070605040302010010 20 30 40 50 60 70 80日损益(绝对值)日损益(绝对值)日价格波动率日价格波动
3、率假定损益分布是对称的,假定损益分布是对称的,则大约有则大约有2%的日观察的日观察(为正或为负)会位于对(为正或为负)会位于对角线的上方,或者说一年角线的上方,或者说一年当中有当中有5个数据点。个数据点。在这里在这里,我们观察到了我们观察到了4个。个。这样的模型是否正确呢?这样的模型是否正确呢?关于回报的选择 模型依赖于数据 VaR度量假定当前头寸在预测时段是“冻结”的“冻结”投资组合(头寸)的成分是不变的 实际中,交易投资组合的演变即使是在一天中都是动态的。实际的回报对应的是实际的损益,即考虑了日间的交易和其它的利润项目。关于回报的选择 要求:对回报数据的选择必须是时间上是非常短的。选择日回
4、报数据进行后测检验 但是,日间交易会增加收入的波动。假想的回报 代表一种“冻结”的投资组合的回报。*tR关于回报的选择 此外,也可考虑通过采用清洁回报(cleaned return)来近似。清洁回报:是指实际回报减去所有的非盯市项目,诸如融资成本、费用收入、储备释放等。从监管的目的,后测检验应该采用实际回报。实际回报反映了真实的、事后的交易回报的波动率,这也会传达一定的信息量。基于异常回报数的后测检验模型 对后测检验的建模包括了系统地比较历史VaR度量和实际序列回报。对模型的检验,则可以利用异常回报数出现的情况来判断模型的好坏。基于异常回报数的后测检验模型 譬如说在95%的置信水平下的5%的观
5、察数。但几乎可以肯定,我们不一定正好观察到5%的超出偏差。由于运气不好可能导致某个比较大的比例,如6%到8%。如果偏差的频率很大,如10%到20%,则用户必须认为模型是不适宜的,而不仅仅是由于运气不好,从而采取纠正措施。基于异常回报数的后测检验模型 问题:如何对模型的好坏进行判断?模型判断中的两种错误 错误1:拒绝一个好的模型(第1类错误)错误2:接受一个坏的模型(第2类错误)需要在两种错误中进行权衡。基于失效率的模型验证 失效率:在某个给定样本下,超出VaR预测值的次数的占比。证实某个模型准确性最简单的方法是记录下其“失效率”。假定银行提供了总共T天的左尾1%(p=1c)水平下的VaR数据。
6、假设N为实际的损失会超出前一天的VaR值总的异常数,N/T即为失效率。基于失效率的模型验证 理论上,失效率(failure rate)应该是p的一个无偏测度(unbiased measure),即应该随着样本容量的增大而收敛于p。limTNpT基于失效率的模型验证 我们想要知道的是:给定某个置信水平,在样本容量为T的情况下,对于零假设p=0.01,N是太大还是太小。值得注意得是,这一统计检验对回报的分布没有任何先决条件。非参数方法。基于失效率的模型验证 建立这种检验完全是一种传统的构架,即对一系列成功或失败的检验。这又被称作贝努里试验。异常的个数服从某个二项分布:(1)xTxTf xppx基于
7、失效率的模型验证 二项分布的期望:E(X)=pT 方差V(X)=p(1 p)T 当T增大时,我们可以根据中心极限定理用一个正态分布来近似二项分布:(0,1)(1)xpTzNpp T基于失效率的模型验证 二项分布可以用来检验异常的次数是否足够小以接受模型,即发生第一类错误的概率。当模型是被正确地校准的,即当p=0.01,和当T=250时的情形。从该图形中可以看到,这一零假设成立时,仍会在10.8%的时间里观察到超出5个(包括5个)异常的情况。10.8%这一数字描述了犯第1类错误(type 1 error),即拒绝正确模型的概率。基于失效率的模型验证0.000.050.100.150.200.25
8、0.30第1类错误10.8%频率模型是正确的:p=0.01;T=250个观察 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15如果模型是正确的,但此如果模型是正确的,但此时的异常数大于等于时的异常数大于等于5,就会拒绝模型。就会拒绝模型。则,此时拒绝模型的概率则,此时拒绝模型的概率为:为:P(x5)10.8%基于失效率的模型验证 二项式分布的概率密度函数值:P(x=0)=0.0811 P(x=1)=0.2047 P(x=2)=0.2574 P(x=3)=0.2149 P(x=4)=0.1341 P(x5)1 P(x4)10.8%基于失效率的模型验证如果模型是错误的,但
9、此如果模型是错误的,但此时的异常数小于时的异常数小于5,我们,我们还是会接受模型。还是会接受模型。则,此时接受模型的概率则,此时接受模型的概率为:为:P(x4)12.8%基于失效率的模型验证 上面的图给出了当模型校准得不正确时,异常数的分布。该图形给出了,p=0.03,(不是0.01)和当T=250时,异常数的分布。这一图形也告诉我们,有稍多于12.8%的时间,我们会接受这一错误的模型。这描述了我们犯第2类错误,即并没有拒绝一个不正确的模型的概率。基于失效率的模型验证决决 策策模模 型型正确正确模型模型错误模型错误模型接受接受OK第第2类错误类错误拒绝拒绝第第1类错误类错误OK决策错误表决策错
10、误表基于失效率的模型验证 对于后续检验的目的,VaR模型的用户需要尽量避免第2类错误而平衡第1类错误。目标:设置一个很低水平的1类错误,然后采用一种检验能够使得犯第2类错误的水平也很低。在这种情况下,检验才能被称得上是“有效力”的。基于失效率的模型验证 Kupiec(1995)开发了一个95%置信水平的一个近似区域。如表9-2所报告的(应该注意到对这一检验置信区域的选择与在VaR中模型所选择的p的水平无关,而是仅仅取决于接受或拒绝模型的决策规则)。这些区域是由一些对数似然比尾部的点构成的。LRuc=2ln(1 p)TN pN+2ln1(N/T)TN(N/T)N 基于失效率的模型验证LRuc=2
11、ln(1 p)TN pN+2ln1(N/T)TN(N/T)N 这是一个渐进(T非常大时)自由度为1的chi-平方分布。对于零假设:p 是真的概率水平,在置信水平95%下,如果LR 3.84,我们将拒绝这一零假设。即:P(LR 3.84)=0.05 P(LR=3.84)=0.95 基于失效率的模型验证异常数为异常数为N时的非拒绝区域时的非拒绝区域概率水平概率水平pV a R 置置信水平信水平T=255天天T=510天天T=1000天天0.0199%N 71 N 11 4 N 170.02597.5%2 N 12 6 N 21 15 N 360.0595%6 N 21 16 N 36 37 N 6
12、50.07592.5%11 N 28 27 N 51 59 N 920.1090%16 N 36 38 N 65 81 N 120注:注:N为在样本容量为为在样本容量为T的样本中,在检验置信水平为的样本中,在检验置信水平为95%的情的情况下,不足以拒绝零假设:况下,不足以拒绝零假设:p为一正确的概率水平(为一正确的概率水平(1 p为置信为置信水平)时,所能观察到的失效次数。水平)时,所能观察到的失效次数。对模型的后对模型的后测测检验,非拒绝检验的置信区间为检验,非拒绝检验的置信区间为95%(好模型没有拒绝好模型没有拒绝)基于失效率的模型验证 如果有2年的数据(T=510),我们会期望观察到N=
13、pT=1%510=5个异常。但是只要N在1 N 11的范围之内,VaR模型的使用者都不能拒绝这一假设。当N 11时,说明VaR的预测值太低,或模型低估了较大损失的可能性。当N 1时,表示该VaR模型过余保守。基于失效率的模型验证异常数为异常数为N时的非拒绝区域时的非拒绝区域概率概率水平水平pT=255天天T=510天天T=1000天天0.01N/T 0.0280.002N/T 0.022 0.004N/T 0.0170.0250.008 N/T0.047 0.012N/T0.041 0.015N/T 0.0360.050.024N/T 0.082 0.031N/T 0.071 0.037N/T
14、 0.0650.0750.043N/T 0.110 0.053 N/T 0.1 0.059N/T 0.0920.100.063N/T0.142 0.075N/T 0.128 0.081N/T 0.120对模型的后对模型的后测测检验,非拒绝检验的置信区间为检验,非拒绝检验的置信区间为95%(好模型没有拒绝好模型没有拒绝)以以N/T比例表示的区间,会随着样本容量的比例表示的区间,会随着样本容量的增大而缩小。增大而缩小。基于失效率的模型验证 在p=0.05这一行,对于T=255的区间为6/255=0.024,21/255=0.082;而对于T=1000的区间为37/1000=0.037,65/100
15、0=0.065。如果有更多的数据,当模型为假时,我们更容易拒绝它(因为不拒绝模型的区间越来越小,因此接受一个错误模型的区间也变小),即犯第2类错误的几率会减小。基于失效率的模型验证 对于VaR参数p的很小值,确定异常情况是一件很困难的事。(p很小,VaR很大,则超出VaR的异常情况很少)在p=0.01,和T=250时的非拒绝区域为(N 7)。在N 非常小或当模型系统地高估风险时,没有办法告诉任何信息。直觉上,对很低的p值,辨识出系统的异常情况是十分困难的。因为这对应的事件很少。此时犯第2类错误的概率很高。基于失效率的模型验证 因此,部分银行会选择较高的p值,如p=0.05,即置信水平c=95%
16、。这样可以观察到足够多的异常数来证实模型的有效性。然后通过一个乘数因子将具体的VaR值转换成安全资本金缓冲的数字。巴塞尔规则 巴塞尔(1996a)对内部模型的后测检验的规则是直接从这个失效率检验获得的。为了设计这样一个检验,首先要确定犯第1类错误的比例,这是当模型是正确时,拒绝该模型的概率。因此,我们首先应该选择一个检验,让它有较低的犯第1类错误的概率。矛盾的中心在于,不可避免的是,监管者会因此而犯第2类错误,银行都会有这样的意愿在它们的VaR报告中误导。巴塞尔规则 当前的模型证实程序是记录在过去一年中对99%-日VaR的异常数。因此,期望250个交易日的1%,即在过去1年中只有2.5个异常。
17、巴塞尔委员会已经决定直至4个异常都可以接受,这定义了银行的“绿灯区绿灯区”。如果异常数升至5个或更多,则银行落在了“”或“红灯区红灯区”,这时会招致惩罚,而且同时乘数因子也会由3增加到4。如果直接落在“红灯区”则自动招致惩罚。巴塞尔规则区域区域异常的次数(过去异常的次数(过去1年)年)乘数乘数k值的增加值的增加绿灯绿灯0 4 0.00黄灯黄灯50.4060.5070.6580.7590.85红灯红灯10+1.00表表9-3:巴塞尔的惩罚区域:巴塞尔的惩罚区域巴塞尔规则 如果在“黄灯区”,惩罚将取决于监管者,取决于异常的原因。巴塞尔委员会采用以下的范畴来划分可能的原因:模型基本上的完整性(可信性
18、)。异常的发生是由于头寸价值报告得不正确,或是因为程序编程时出现的错误。运用惩罚运用惩罚 模型的精度可以依靠自身得到修正。异常的产生是由于模型并没有以足够的精度度量风险。(譬如,太短的到期日)运用惩罚运用惩罚 日间的交易。一天中的头寸改变。考虑惩罚考虑惩罚 运气不好。市场是高波动的,尤其是相关性的改变。也要考虑到这些情况的发生也要考虑到这些情况的发生巴塞尔规则 后测检验问题的关键是要能够分开运气不好和确实的失效模型。或者说在第1类错误和第2类错误间做一个平衡。覆盖率覆盖率=99%,模型正确,模型正确覆盖率覆盖率=97%,模型不正确,模型不正确区域区域异常异常的个的个数数N概率概率P(X=N)累
19、计的累计的(第第1类,拒绝类,拒绝)P(X N)概率概率P(X=N)累计的累计的(第第2类,类,不拒绝不拒绝)P(X 5.99,将会将会在在95%的置信水平上的置信水平上拒绝假设拒绝假设2(1)分布分布条件覆盖率模型 例子:JPMorgan 在1998年252个交易日内,观察到了20个异常值,则=20/252=7.9%.有6个异常是属于连续异常发生的(前一天也是异常)1=6/20=30%有14个异常发生时,前一天没有异常0=14/232=6%这样我们得到LRind=9.53计算过程pi_06%pi_130%pi7.90%T00218.08T1014T0113.92T116T0232T120前一
20、项139.3243后一项-129.748LRind9.576825条件覆盖率模型 LRind=9.533.84,我们拒绝假设。说明,银行应该修改其VaR模型。险阵中的后测检验 t 时刻的组合回报定义如下:组合回报标准差 p,t|t 1 的计算公式为:215,11215p ti tirr222152152,|1,|1,|1,|1,|111112215215p t ti ttij tti ttj ttiij i险阵中的后测检验 1.0 0.8 0.6 0.4 0.2 0-0.2-0.4-0.6-0.8 100 200 300 400 500 600 700 800 VaR 的边界由+/1.65 给
21、出 损益 1.65 观察+1.65 90%双尾置信区间双尾置信区间险阵中的后测检验 模型的评估 对于1-日95%VaR,这里假定每一天都有 5%的机会,所观察到的损失会超过 VaR 的预测值。定义在任意天 t,如果这一特定天的观察损失大于它对应的 VaR 预测值,随机变量 X(t)=1,反之则有 X(t)=0险阵中的后测检验 X(t)的分布如下,随机变量 X(t)被认为是服从期望值为 0.05 的贝努利(Bernoulli)分布。()1()0.05(1 0.05);()0,1()|0.05)0;X tX tX tf X t其它险阵中的后测检验 在期间 T 违反 VaR 估计的总次数由下式给出
22、XT 的期望值,即在 T 天中违反 VaR 估计的期望次数为 0.05T。例如,如果我们观察 T=20 天的 VaR 预报,则违反 VaR 预测的期望次数为 20 0.05=1;1()TTtXX t险阵中的后测检验 通过违反 VaR 估计的次数来评价对这一包括 215 个现金流组合的险阵模型的适宜性。违反 VaR 的真实概率=5%Prob(Loss 1.65 t|t 1)5.74%5.87%表表9-7 所实现的偏误了所实现的偏误了 VaR 的比例的比例上、下限分别定义为上、下限分别定义为 1.65 t|t 1 和和 1.65 t|t 1险阵中的后测检验 推导出上述结论的一个更加直接的方法是运用
23、险阵模型所维系条件正态分布的假定。假定实际回报(P/L)(被用于构造 VaR 估计的标准差估计除后的值)服从均值为 0 和方差为 1 的正态分布。通过分析标准化后的组合回报来做出判断。险阵中的后测检验 险阵模型预见有 5%的标准回报会落在低(高)于 1.65(1.65)。除了这一预见之外,还有可能推导出给定回报违反 VaR 估计时,该回报的期望(平均)值。对于低尾,这一期望值定义如下:E(r t/t|t 1)|(r t/t|t 1)1.65=2.0671险阵中的后测检验标准回报的条件均值尾部预测标准回报的条件均值尾部预测E(r t/t|t 1)|(r t/t|t 1)1.65=2.63 1.7
24、411.828表表9-8 所实现的平均所实现的平均“尾部回报尾部回报”险阵中的后测检验 图 9-6 和图 9-7 描出了所观察到的标准回报(黑圈)落在标准正态分布低尾(1.65)的情况,每个图中的平等线代表了由条件正态分布预测的平均值。0.0 -0.5 -1.0 -1.5 -2.0 -2.5 -3.0 -3.5 -4.0 0 5 1 0 1 5 2 0 2 5 3 0 3 5 4 0 4 5 5 0 标准化回报-2.0 6 7 1%t 3.5 3.0 2.5 2.0 1.5 1.0 0.5 0 0 5 1 0 1 5 2 0 2 5 3 0 3 5 4 0 4 5 5 0 标准化回报 2.0 6 7 1%t 险阵中的后测检验 两个图都显示了违反 VaR 估计的回报极少会超出由正态分布预见的期望值。事实上,所观察到对上下尾的(大约)46/47 个尾部回报中的大约有 3 点出局了。这大概是占了落在特定尾部的观察的6.5%。注意到正态概率模型的预见是 8.5%Prob(X 2.0671|X 1.65)=Prob(X 2.0671)/Prob(X 1.65)=39%总体来说,险阵模型总体表现相当好 第九讲 End 第十讲 Continue