2015年 第 2 期
财会月刊((2期)
投资·证券
运用Pair-copula贝叶斯网络模型分析多资产投资组合风险

作  者
杜子平(博士生导师),李丽娜

作者单位
(天津科技大学经济与管理学院,天津 300222)

摘  要

      【摘要】目前,高维情况下的多资产投资组合的风险管理中常用Vine Copula来拟合资产收益率的联合分布,但Vine结构的构建随着资产个数增加是非常复杂的,并且由于其网络结构没有考虑到变量间的实际依赖关系,导致无现实解释意义。基于此,本文结合PC算法和爬山算法构建了多个资产间的Pair—copula贝叶斯网络模型来刻画资产间的相依结构,结合蒙特卡罗模拟法计算投资组合风险价值(VaR),并通过Kupiec检验法验证了计算的可靠性。
【关键词】Pair—copula贝叶斯网络;多资产投资组合;VaR;风险传递路径;蒙特卡罗模拟一、引言
多样化投资作为风险规避的主要途径一直备受广大投资者和金融机构的重视,实际生活中的投资组合往往由多个资产构成,具有较高的维数,藤结构作为高维Copula建模的主要技术由杜子平、闫鹏等(2009)引入国内,现已成为多资产投资组合风险分析的热点研究理论。黄恩喜、程希俊(2010)基于C藤、D藤结构构建Pair—copula GARCH模型,进行投资组合VaR值预测。高江(2011)使用藤Copula方法计算多资产投资组合的VaR并进行预测效果检验,证明藤Copula模型在多资产投资组合VaR预测中的有效性。杜子平、汪寅生等(2012)考虑资产间局部相关结构的差异,采用混合C藤Copula模型进行了外汇资产组合的VaR研究。
藤结构为高维Copula提供了可行、有效的建模方式,但在实际应用中随着变量数量的增加,基于藤结构分解的Pair—copula的数量将呈二次平方函数增长,高维下的参数估计也相当复杂,并且藤结构只是给出联合概率密度函数的一种分解形式,无法解释变量间连接关系的实际意义。
贝叶斯网络是联合分布分解的另一种表达方式,Kurowicka和Cooke(2005)将Pair—Copula的概念应用到贝叶斯网络当中,由有向无环图(DAG)指出变量间的马尔科夫结构,得到了一种新型的Pair—copula构建方式,该模型被定义为Pair—copula贝叶斯网络(PCBN)。Hanea(2006)、Hanea和Kurowicka(2008)重点研究基于Copula函数的连续型贝叶斯网络非参数统计推导过程。Alexander Bauer(2011)指出基于DAG的Pair copula构建方式比藤Copula的构建方式需要更少的参数。Alexander Bauer和Claudia Czado(2012)重点研究PCBN模型参数似然推倒过程和数据驱动下的结构学习方法。
本文基于以上研究理论,采用PCBN模型构造多个资产的高维Copula模型及其联合分布函数,捕捉资产间的非线性相依结构并获得风险传递网络,根据变量间的连接关系及相依程度为投资组合管理提供参考,并结合蒙特卡罗模拟方法计算投资组合VaR值,说明PCBN模型在多资产投资组合风险管理领域中的应用优势。
二、模型与研究方法
1. Pair—copula贝叶斯网络模型(PCBN)。Pair—copula贝叶斯网络依赖一个DAG编码变量间的条件独立性,并针对连续型数据使用Copula函数参数化的条件概率密度连接网络中的节点,从而精确控制单变量边际分布的形式,刻画节点相依程度大小。
令D=(V,E)表示一个PCBN的DAG,V为顶点集,E为边集,用Dm表示D的道德图。对于变量i∈V,i的母节点集:pa(i):={j∈V|(j,i)∈E},祖先节点集:an(i):={j∈V|[∃]路径j到i};子节点集:de(i):={j∈i|[∃]路径i到j},非子节点集:nd(i):=V\({i}[⋃]de(i))。
令P表示Rd上绝对连续的概率测度,其中d:=|V|,令X为一概率分布为P的随机变量。对于i∈V假如P满足下式,则称P具有局域D—马尔科夫属性。
Xi[⊥]Xnd(i)\pa(i)|Xpa(i) (1)  
对于I,J,K[⊆]V,且I,J,K两两不相交,若满足下式,则称P具有全局D—马尔科夫属性。
XI[⊥]XJ|XK (2)  
式(1)和式(2)将P边际分布的(条件)独立性与有向无环图D的图分离属性相连接,Lauritzen(1996)证明当且仅当P满足全局D—马尔科夫属性时P才满足局域D—马尔科夫属性。因此,当概率测度P满足式(1)、式(2)时,就称P具有D—马尔科夫属性。假设P的概率密度函数为f,若P满足D—马尔科夫属性,则通过D—递归分解可以得到式(3):
f(x)=     fi|pa(i)(xi|xpa(i)) (3)  
其中:x=(x1,…,xd)∈Rd,fi|pa(i)(·|xpa(i))表示在给定Xpa(i)=xpa(i)时,Xi的条件概率密度函数(pdf)。在语义上,贝叶斯网络是联合概率分布的分解的一种表示,其剔除变量间的条件独立关系,有效地降低了模型估计的复杂程度。
PCBN由三部分组成:C=(D,θc,θf),D表示编码变量间的条件独立状态Xi[⊥]Xnd(i)\pa(i)|Xpa(i);θc为Pair—copula函数集合,连接了D中的网络节点;θf为边际概率密度函数的参数集合。若D中各节点变量母节点满足集合:pa(i,j):={k∈pa(i)k<i j},其中i∈V,j∈pa(i),则称母节点的顺序是良序的,将良序集合记为O,用符号“<i”表示节点i的母节点的先后顺序。母节点顺序可由基于藤Copula模型结构选择算法的启发式规则得以确认,步骤为:①Kendall τ相关性大的优先排序;②对第一步得出的排序进行调整,减少Copula函数参数估计中的积分项,降低模型参数估计难度。
Bauer等(2012)证明得到:如果有向无环图D=(V,E)带有母节点良序集O及边缘分布函数严格递增的D—马尔科夫连续概率密度测度P,则P将由其单变量边缘分布Pi和条件Pair—copula函数Ci,j|pa(j)唯一决定,其中i∈V,j∈Pa(i)。因此,P的概率密度函数f最终被分解为式(4):
f(x)=     fi(xi)      ci,j|pa(i;j)(Fi|pa(i;j)(xi|xpa(i;j)),Fj|pa(i;j)(xj|xpa(i;j)|xpa(i;j)) (4)  
其中:x=(xi)i∈V∈Rd,该模型被称为PCBN。
2. 基于PCBN的蒙特卡罗模拟。Alexander Bauer等(2011,2012)对基于PCBN的蒙特卡罗抽样模拟给出了详细介绍。为产生服从PCBN分解的多元联合分布函数的仿真序列,首先生成n个[0,1]上均匀分布的相互独立的随机数w1,w2,w3,…,wn,然后对其进行分位数转换:
u1=w1,
u2=      (w2|u1,θ),
u3=      (w3|u1,u2,θ),
…=…,
un=          (wn|u1,……,un-1,θ)。
通过D—马尔科夫属性对上述转换进行简化:wi=F1,…,i-1(ui|u1,…,ui-1,θ)=Fi|pa(i)(ui|upa(i),θ),最终得到:
u1=w1,
u2=      (w2|u1,θ),
u3=        (w3|upa(3),θ),
…=…,
un=        (wn|upa(n),θ)。
u1,u2,…,un即为服从PCBN相关结构的[0,1]上的随机数。其中,每个条件边际分布函数Fi|pa(i)(ui|upa(i),θ)都可由式(4)中的Pair—Copula函数及其相应概率积分求出。
3. VaR计算及检验。VaR是指在一定时间期限内,在某个置信水平下,某项资产或证券组合的最大损失值。用公式表示为:
P(Rt≤VaRt(α)Ωt-1)=α
其中:1-α是置信水平;α∈(0,1);Ωt-1是t-1时刻的信息集;Rt代表资产价值的损益。
运用蒙特卡罗方法计算基于Pair—copula贝叶斯网络模型计算多资产投资组合VaR,步骤如下:
(1)建立边际分布模型,得到残差序列,使用概率积分变换得到[0,1]上的均匀分布序列。
(2)PCBN模型建立:首先,使用网络结构学习算法确定网络结构;然后,确认节点变量良序集合及母节点变量排序,得出Pair—copula的分解形式;最后,选取合适的Pair—copula函数进行参数估计及相关测度计算。
(3)使用上述蒙特卡罗模拟法得到各资产第t+1日的10 000个n维仿真序列,n为投资组合中资产的个数。
(4)根据资产的边际分布模型得出各资产投资组合收益率Ri,t,i∈n,。故投资组合收益率为:[i=1nwiRi,t],wi为投资组合权重系数,从而求得VaR值。
(5)重复上述第三步、第四步100次,得出VaR的平均值,即为第t+1日的VaR估计值。
(6)检验模型的预测效果。Kupiec失败率检验法:假设计算VaR的置信度为P,实际考察天数为T,失败天数为N,失败频率为N/T,对VaR模型准确性的检验转换为检验失败率(N/T)是否显著不同于P,检验的原假设为:H0:(N/T)=P,似然比统计量为:
LR=2ln((1-p)T-NPN)+2ln((1-N/T)T-N(N/T)N) ~ χ2(1)     (5)  
三、实证分析
选取美国标准普尔500指数(SPX)、英国富实100指数(UKX)、上证综合指数(SH)、中国香港恒生综合指数(HSCI)、印度孟买30指数(BSESN)、日经225指数(NKY)构建国际投资组合。选取2009年1月5日 ~ 2014年6月23日收盘价作为样本对象(数据来源于雅虎财经网站),记第i支股票每日收盘价为Pi,t,根据对数收益率公式(见式(6))获得对数收益率序列:
ri,t=100×ln(Pi,t/Pi,t-1) (6)  
剔除不存在交易额或数据缺失日期的数据,处理后共1 144个有效数据,将前959个作为样本数据,后185个作为样本外数据,样本外数据主要用于预测效果检验。1. 收益率数据基本统计特征。由表1数据可以看出,各收益率数据都表现出一定的偏度,且峰度均大于3,并由JB统计量可以看出,各收益率均拒绝了正态性假设。根据单位根检验可知各收益率数据平稳。LM ARCH检验证明各收益率序列具有明显的ARCH效应,因此我们选取GARCH模型作为变量的边际分布模型。
使用GARCH类模型对数据进行过滤,消除其序列自相关性及条件异方差性,记在时刻t股票指数i∈{SPX,UKX,NKY,SH,HSCI,BSESN}的对数收益率为ri,t,基于数据非正态的基本统计特征及信息准则(AIC)最小原则,本文选取AR(1)-GARCH(1,1)-t模型作为边际分布模型:
ri,t=μi+airi,t-1+εi,t,εi,t=σi,tzi,t,
                                  (7)  
其中:参数ωi>0,αi,βi≥0,αi+βi<1,|αi|<1,并且μi∈R。
使用Eviews 7.2软件进行边际分布模型参数估计(估计结果见表3)并获得标准残差序列zi,t。残差序列经概率积分变换后得到符合Copula函数建模要求的[0,1]上的均匀分布序列ui,t,经K-S检验ui,t均服从均匀分布,故AR(1)-GARCH(1,1)-t模型作为收益率单变量边际分布模型有效。

 

 

 


2. PCBN网络结构学习及Pair—copula模型选择与估计。贝叶斯网络结构学习算法主要由基于评分搜索和基于条件独立测试的两大类算法构成,在网络结构学习过程中,每种算法往往会得到较多的等价类难以确认最终的网络结构。
这里我们同时使用基于条件独立测试的PC算法和基于评分搜索的爬山算法(HC)两种方法进行网络结构学习(处理软件使用R3.0.2),通过对两种算法得出的结果进行比较,最终确认网络结构。结果显示PC算法与爬山算法得到了相同的道德图Dm,但PC算法在该实证中对边的方向识别效果不是很好,经爬山算法修正能够有效确认各边的方向,得到网络结构DAG,记作D,如图1所示。

 

 

 

 


为节点重新排序建立良序集合,各节点编号为:1->日本NKY,2->香港HSCI,3->上证SH,4->印度BSESN,5->英国UKX,6->美国SPX。基于前文介绍的启发式程序确认UKX母节点顺序:[4<52]。最终得到联合概率分解模型如式(8):
f=C12C23C24C25|4C45C56[i=16fi] (8)  
Kjersti Aas等(2009)指出构建n维藤Copula模型共需要确定 n(n-1)/2个Pair—Copula的函数族,而若变量x,y在给定条件集v下独立,则有Cx,y|v{F(x|v),F(x|v)}=1,条件独立假设可以减少Pair—copula分解的数目,从而有效简化高维联合分布的构建过程。 因此,若该联合分布使用藤结构进行分解,则共需要确定15个Pair—copula函数,本文使用PCBN模型通过DAG编码的网络结构有效地识别了变量间的条件独立关系,只需要确定式(8)中的6个Pair—copula函数,有效降低了模型参数估计及蒙特卡罗抽样过程的复杂程度。
本文选取对股指下行风险刻画较好的Clayton Copula函数来拟合金融随机变量,使用下尾相关系数表示变量间的相依程度。Clayton Copula函数表达式为:
CClayton=(            -1)-1/θ  (9)  
其中θ∈(0,∞)为相关参数,对应的下尾相关系数表达式为:
               (10)  
边际分布Fu1|u2用h方程表示为:
h(u1,u2)=                                   (11)  
参数估计结果及下尾相关系数值如表4所示。一个金融资产价值出现大幅变动时,与其关系较为密切的其他资产将会首先受到影响,PCBN模型网络结构的马尔科夫特性符合这种风险逐级传递的特征,即边连接了具有直接相关关系的两个市场指数,图1给出了各资产间风险传递路径。可以看出欧美两个市场直接相连,其他的亚洲市场直接相连,国际股票市场表现出了较强的地域相关特征,因此,可以通过首先增加不同地域资产的配置数量,再选择地域内相依程度的较小的资产的方式来降低投资组合的总体风险。亚洲各市场满足以下条件独立限制:
SH[⊥]NKY|HSCI,SH[⊥]BSESN|HSCI,NKY[⊥]BSESN|HSCI,
即在香港市场的条件下其他亚洲市场相互独立且均与香港市场保持相较高的相依性,可见香港市场是亚洲市场的连接枢纽,同时香港市场与欧洲市场表现出直接相依性,是欧美金融风险传播到亚洲市场的关键点,在该投资组合中为降低投资组合总体风险,防止因香港股指下跌而引起投资组合内部其他市场大规模的下尾风险联动效应发生,一定要降低香港恒生指数的配置比例。中国SH与美国SPX,日经NKY与美国SPX具有较长的拓扑路径,风险传递的路径最长,可适当加大相应的投资比例。
3. VaR计算及预测效果检验。为方便起见,本文假设投资组合为等权重投资。根据前文介绍的基于PCBN模型的蒙特卡罗仿真方法,使用MATLAB2008a软件进行程序处理,计算该投资组合样本外共185天的VaR值,与投资组合实际收益率进行比较,见图2。
得到预测失败天数为3天,期望天数为9.25天,失败频率为1.62%。99%置信水平上的似然比值LR=0.607 8,自由度为1的卡方分布临界值为6.634 9,似然比LR小于临界值,综上Kupiec失败率检验通过,VaR预测结果有效。
四、结论
本文采用PCBN模型刻画多资产收益率的联合分布情况,PCBN模型在研究金融变量间相依结构及VaR预测问题中的优势在于:①PCBN模型有效地识别了变量间的条件独立关系,降低了高维Copula函数参数估计及蒙特卡罗抽样计算过程的复杂程度。②使用Copula参数化的连续型贝叶斯网络,有效捕捉到了金融资产变量间的非线性相依结构,将连续型贝叶网络拓展到实际研究,为今后使用贝叶斯网络解决复杂系统问题提供参考。③网络结构表达的马尔科夫特性符合金融风险逐级传递的特征,给出了各资产间风险传递的可视路径,具有实际的解释意义。
在今后的研究中还存在很大的拓展空间:①本文中相连节点变量间均选用了同一类型的Copula函数连接,在实际应用中可以针对两两变量的局部特征,选择更适合的Copula函数刻画局部相依特征。②通过预测效果检验已证明PCBN模型在VaR预测问题中的有效性,但与其他预测方法的比较研究还值得进一步讨论。③二元Copula函数与贝叶斯网络均具有动态模型,考虑变量间的相依结构会随时间推移发生变动的因素,将二者动态模型的有效结合并应用于实际也是下一步研究的方向;④藤结构与贝叶斯网络结构具有一定的对应关系,基于藤Copula的贝叶斯网络结构学习也是非常值得研究的。
主要参考文献
杜子平,闫鹏,张勇.基于“藤”结构的高维动态Copula的构建[J].数学的实践与认识,2009(10).
黄恩喜,程希骏.基于pair copula-GARCH模型的多资产组合VaR分析[J].中国科学院研究生院学    报,2010(4).
高江.藤Copula模型与多资产投资组合VaR预测[J].数理统计与管理,2013(2).
杜子平,汪寅生,张丽.基于混合C藤Copula模型的外汇资产组合VaR研究[J].技术经济与管理研究,2013(2).
D. Kurowicka,R. M. Cooke.Distribution-free continuous Bayesian belief nets[J].Quality and Reliability Engineering Statistics,2005(10).
【基金项目】国家自然科学基金项目“时序非线性关联Copula理论建模及在金融领域的应用研究(项目编号:71071111);天津市社科理论“五个一批人才”基金项目