23.5 极大似然估计法

    我们现在讨论如何由历史数据来估计以上所讨论模型中的参数。这里将要讨论的方法称为极大似然方法(maximum likelihood method)。在参数估计过程中这一方法会涉及选择使数据发生的概率(likelihood)达到最大的参数。

    我们引用一个简单例子来说明这种方法。在某一天我们随机地抽取10个股票的价格,我们发现其中一个股票价格在这一天下降了,而其他9个股票的价格没有变化或有所增加。这时,股票价格下降概率的最好估计为多少?一种自然的答案是0.1。让我们看一下这一结果是否就是极大似然估计所给出的结果。

    将股票价格下降的概率计为p,对应只有一种股票价格下降而其他股票价格不下降的概率为p(1-p)9。应用极大似然估计方法,最好的估计值p会使得p(1-p)9取得最大值。将以上表达式对p求导,并令导数为0,我们得出空标题文档 - 图1时会使得表达式取得最大值,这说明极大似然估计值为0.1,正如所期望的那样。

    23.5.1 估计常数方差

    在下一个有关极大似然方法的例子中,我们考虑如何由服从正态分布并且期望值为0的变量X的m个观察值来估计这一变量的方差。我们假定观察值为u1,u2,…,um。将方差记为v。将观察值出现在X=ui的概率定义成X的概率密度函数在ui的取值,即

    空标题文档 - 图2

    m个观察值正好按u1,u2,…,um出现的概率为

    空标题文档 - 图3

    应用最大似然方法,v的最好估计使得以上表达式达到最大值。

    以上表达式的最大化与其对应的对数最大化等价,对式(23-10)取对数并且忽略常数项后可以得出我们想最大化的目标函数为

    空标题文档 - 图4

    空标题文档 - 图5

    将以上表达式对v求导,并令导数为0,我们可以得到v的极大似然估计为[1]

    空标题文档 - 图6

    23.5.2 估计GARCH(1,1)模型中的参数

    我们现在考虑如何用极大似然方法来估计EWMA,GARCH(1,1)或其他更新波动率方法中的参数,定义空标题文档 - 图7为第i天方差的估计值,在给定方差的条件下,ui的概率分布为正态。与上面类似,我们得出最佳参数应使得以下表达式达到最大

    空标题文档 - 图8

    取对数后,我们可看到这与对下面表达式求最大是等价的

    空标题文档 - 图9

    除了v被代替为vi,这一表达式与式(23-11)相同,我们可以采用迭代法来求取使得表达式式(23-12)达到最大的解。

    表23-1中所示的计算表给出了估计GARCH(1,1)模型中参数的过程,这个表格分析了2005年7月18日至2010年8月13日之间标普500的数据。[2]表中第1列对应于日期;第2列对应天数;第3列显示标普500在第i天结束时的值Si;第4列显示了由第i-1天结束时至第i天结束时标普500的百分比变化,即ui=(Si-Si-1)/Si-1;第5列是对在第i-1天结束时对第i天方差率的估计,空标题文档 - 图10。在第3天开始,我们将方差设为空标题文档 - 图11,在接下去的每一天,我们采用式(23-9)来估计方差,第6列为似然性测度空标题文档 - 图12,第5列及第6列中的数据是基于当前参数ω,α和β的最新估计,我们的目标是如何选取ω,α和β使第6列中数值的和达到最大值。这一过程涉及迭代搜索程序。[3]

    表23-1 估计标普500指数在2005年7月18日到2010年8月13日之间GARCH(1,1)模型中的参数

    空标题文档 - 图13

    在我们的例子中,参数的最优解为

    空标题文档 - 图14

    表达式(23-12)的最大值为10228.2349。在表23-1中所显示的数字对应于参数ω,α及β的最终迭代解。

    在我们的例子中,长期方差VL

    空标题文档 - 图15

    长期波动率为空标题文档 - 图16,也就是每天1.4404%。

    图23-1和图23-2显示了S&P 500指数与它的GARCH(1,1)波动率在数据所包括的5年内的变化。在大多数时间上波动率小于2%,但是在金融危机期间波动率经历了高达每天5%的情形(这个期间的高波动率也表现在VIX指数上,见15.11节)。

    空标题文档 - 图17

    图23-1 标普500指数:2005年7月18日到2010年8月13日

    空标题文档 - 图18

    图23-2 标普500指数的日波动率:2005年7月18日到2010年8月13日

    另一种有时会更可靠的估计GARCH(1,1)参数的做法是所谓的方差目标(variance targeting)法。[4]这种方法将长期平均方差VL设定为由数据计算出的样本方差(或其他合理的估计),因为ω等于VL(1-α-β),因此在模型中只需要估计两个参数,表23-1的数据所对应的样本方差为0.0002412,对应的日波动率为1.5531%,令VL等于样本方差,我们可以找出使得目标函数式(23-12)达到最大化的α和β分别为0.08445和0.9101,相应目标函数值为10228.1941,这一数字只是稍稍低于前面计算的极值数据10228.2349。

    当使用EWMA模型时,参数的估计过程就相对简单一些。因为ω=0,α=1-λ和β=λ,因此我们只需要估计一个参数,使用表23-1中的数据,我们可以求得使目标函数式(23-12)取得极大值的λ为0.937,对应的目标函数取值为10192.5104。

    对GARCH(1,1)和EWMA方法我们都可以通过Excel软件中的Solver程序来找到使得似然函数达到最大的参数值。当计算表格的结构使得寻求的参数值大体在同一级别时,Solver程序的表现会令人满意。例如,在GARCH(1,1)模型中,我们可以将计算表中的单元A1、A2、A3与数据ω×105,10α和β相对应。然后我们可以使单元B1=A1/100000、B2=A2/10以及B3=A3,我们通过B1,B2,B3来计算似然函数。我们可以让Solver计算A1,A2,A3上使似然函数得到最大的值。因为有时Solver会给出一个局部解,所以我们应当对于参数设定一些不同的初始值。

    23.5.3 模型表现如何

    GARCH模型所做的假设是波动率随时间变化。在某些时间里波动率会较高,而在其他时间里波动率较低。换一种形式讲,当空标题文档 - 图19较高时,空标题文档 - 图20会有增大的趋势;当空标题文档 - 图21较低时,空标题文档 - 图22会有降低的趋势,我们可以通过计算自相关系数(autocorrelation)来检验这些结论正确性。

    我们假定空标题文档 - 图23确实具有自相关性,如果GARCH模型是有效的,自相关性就会被清除。我们可以通过计算变量空标题文档 - 图24的自相关系数来验证这一结论。如果它们的自相关系数很小,那么我们可以说空标题文档 - 图25模型确实解释了空标题文档 - 图26中的自相关性。

    表23-2给出的是关于上面所用的标普500数据结果。第1列显示计算自相关系数所用的时滞(time lag),第2列对应于空标题文档 - 图27自相关系数,第3列展示了空标题文档 - 图28的自相关系数。(注:数列xi对应于时滞k的自相关系数等于xi与xi+k的相关系数。)表中结果显示对应于1~15的所有时滞,空标题文档 - 图29的自相关系数均为正值。而对于空标题文档 - 图30,有些自相关系数为正而有些为负,而且它们的幅度比最初空标题文档 - 图31自相关系数要小得多。

    表23-2 采用GARCH模型之前与之后的自相关系数

    空标题文档 - 图32

    看来GARCH模型对于解释这些数据确实很有效。我们可以采用所谓的Ljung-Box统计量来做更为科学的检验。[5]如果一个数列中有m个观察值,Ljung-Box统计量定义为

    空标题文档 - 图33

    其中ηk对应于时滞为k的自相关系数,K为所考虑时滞的数量,以及

    空标题文档 - 图34

    对于K=15,当Ljung-Box统计量大于25时,我们可以有95%的把握拒绝自相关系数为0这一假设。

    在表23-2中,关于空标题文档 - 图35数列的Ljung-Box统计值为大约1566,这是说明确实存在很强的自相关性。关于数列空标题文档 - 图36的Ljung-Box统计值为21.7,这说明GARCH模型确实清除了数据中的大部分自相关性。

    [1] 这一点证实23.1节第3个脚注的结论。

    [2] 数据与计算过程可从www.rotman.utoronto.ca/~hull/GarchExample上找到。

    [3] 如同在今后会讨论的那样,像微软软件Excel中的Solver这样的程序可以用来对问题求解。其他像诸如Levenberg-Marguardt这样的特殊算法也可以用来对问题求解。关于求解算法参考W.H.Press,B.P.Flannery,S.A.Teukolsky,and W.T.Vetterling,Numerical Recipes in C:The Art of Scientific Computing,Cambridge University Press,1988。

    [4] 见R.Engle and J.Mezrich“GARCH for Groups”,Risk,August 1996,36-40。

    [5] 见G.M.Ljung and G.E.P.Box,“On a Measure of Lack of Fit in Time Series Models,”Biometrica,65(1978),297-303。