2016年
财会月刊(20期)
投资·证券
带有范数约束的高维组合投资选择模型及应用

作  者
许启发1,2(教授),周莹莹1,何耀耀1(副教授),蒋翠侠1,2(副教授)

作者单位
1.合肥工业大学管理学院,合肥230009;2.合肥工业大学过程优化与智能决策教育部重点实验室,合肥230009

摘  要

      【摘要】为解决高维组合投资选择中的计算困难问题、避免误差累积效应,本文在标准的组合投资选择模型中增加约束条件,得到带有范数约束的高维组合投资选择模型。首先,分析了带有范数约束的高维组合投资选择模型与其他模型的关系;然后,给出该模型的两种求解方法——基于二次规划方法的精确求解和基于LASSO回归的近似求解;最后,通过数值模拟与实际应用,检验了该模型的有效性。
【关键词】组合投资选择;组合投资优化;二次规划;LASSO回归
【中图分类号】F224.0           【文献标识码】A           【文章编号】1004-0994(2016)20-0117-7一、引言
组合投资理论最初是由美国学者Markowitz(1952)提出的,标志着现代组合投资理论研究的开端。他认为理性投资者总是在给定的期望风险水平下追求期望收益的最大化,或者在给定的期望收益水平下追求期望风险的最小化,通过选择有效的组合投资,来实现最大的期望效用。Markowitz还对风险和收益进行了量化,建立了均值—方差模型。该模型反映的是以资产权重为变量的二次规划问题,求出组合风险最小时最优的投资比例。Sharpe(1963)在此基础上中提出了Sharpe单指数模型。随后,Sharpe(1964)和Lintner(1965)分别提出资本资产定价模型(CAPM)。但是,Markowitz的组合投资理论与方法需要计算所有资产之间的方差—协方差矩阵,当资产数目很多时,协方差矩阵的计算量将呈几何级数增加,同时累计误差也相应增加。
为了解决这些问题,已有文献对组合投资理论进行了丰富、改进和发展,可以概括为以下三个方面:
第一,在组合资产的协方差矩阵方面的研究,代表性的有:Ledoit(2003)提出了缩小样本协方差矩阵的方法;Fan等(2008)通过模拟研究,证明了用因子模型估计协方差矩阵比用样本估计协方差矩阵所得的结果更精确;Pesaran等(2008)研究了当组合投资中资产数量较多时,用因子模型估计的协方差矩阵是如何影响各资产的最佳投资比例的。
第二,在组合投资决策模型新算法方面的研究,代表性的有:黄秀路(2013)使用CVaR风险度量指标探讨投资组合优化模型;Chopra等(2011)指出,在均值—方差模型的计算中,参数估计的微小误差就会使得最终结果存在显著差异,建议使用James-Stein方法估计均值,以减少误差;陈志平等(2012)构建了两种分别以CVaR和双边一致性度量为风险度量的离散型多重约束实用投资组合选择模型;路应金等(2004)给出证券组合投资分析的区间数线性规划方法;马永开等(2013)将Lopes的SP/A理论扩展到多心理账户情形,提出了容易求解的多心理账户证券组合投资决策模型;Goldfarb等(2003)研究了如何构建和解决稳健的组合投资选择问题。
第三,在带有约束条件的组合投资选择方面的研究,代表性的有:De Roon等(2001)应用了基于回归分析的平均变异捡动法,研究当投资者面对卖空和交易成本限制时的做法;许英(2014)建立了不同约束的模型并给出相应投资组合的最优策略,研究了我国保险资金的投资组合优化问题;Jagannathan等(2002)在Markowitz的均值—方差模型中加入了非空约束的限制条件,并证明了加上这一条件对组合投资选择是有益的;薛金实(2011)在Markowitz投资组合模型的基础上,加入交易费用、最小交易单位和投资资本约束等限制条件,建立了三种投资组合模型;Fan等(2012)通过对权重向量施加总体风险暴露约束,得到带有惩罚约束的组合投资选择模型,并且在理论上证明了这一组合投资选择的方差存在上界。
无疑,监测和管理大规模组合投资不仅浪费时间,而且要花费很大代价。因此,有必要选择恰当规模的金融资产进组合投资。一般地,应选择建立包含较少数量金融资产的稳健型组合投资,以减少交易、监测和研究的成本。同时,努力控制组合投资中各资产的投资比例,以避免极端的多头和空头头寸。为此,可以建立带有范数约束的高维组合投资选择模型。
本文在标准的均值—方差模型基础上,增加了范数约束(组合投资权重绝对值之和小于某一限定值),得到了带有范数约束的高维组合投资选择模型。这一模型既具有明确经济含义,也具有很好的包容性。进一步地,给出了带有范数约束的高维组合投资选择模型的两种求解方法:基于二次规划方法的精确求解和基于LASSO回归的近似求解。最后,从两个方面检验了新模型及其算法的有效性:一方面,基于Fama-French三因子模型,构造了Monte Carlo数值模拟机制,验证了模型的有效性;另一方面,将带有范数约束的高维组合投资选择模型应用于沪深300指数,对其中的成分股进行组合投资选择,评价其组合投资选择效果。
二、组合投资选择模型的建立
1. 标准的组合投资选择模型。Markowitz首次提出组合投资理论与方法,开创了金融定量研究的先河。其核心思想在于:将均值视为组合投资的收益,并将方差视为组合投资的风险,建立均值—方差模型求解最优组合投资权重,使得在给定风险条件下期望收益最大化或者给定期望收益条件下风险最小化。
不妨考虑N个金融资产,其收益分别为:R1,R2,…,RN,其相关结构可以用方差—协方差矩阵[Σ]表示。一个理想的组合投资,就是通过对金融资产进行合理配置,得到最优组合投资权重w=(w1,w2,…,wN)′,使得组合投资风险    =w′Σw最小化。可以得到Markowitz组合投资优化模型:

s.t. w′1=1
式中:1为由1组成的列向量,1=(1,1,…,1)′N;约束条件w′1=1,表明组合投资权重之和为1。
Markowitz组合投资选择模型可以通过拉格朗日方法,将有条件极值问题转化为无条件极值问题,进而使用标准的二次规划方法进行求解,在理论上和实践上都具有很强的指导意义。然而,在Markowitz组合投资模型中,没有对组合投资权重施加非负约束等,容易产生一些极端权重结果,如:wi=-500%、wj=+600%等。这些极端权重使财富分配与资产管理极为困难,同时也带来了极高的资产买卖交易成本。
2. 带有非负权重约束的组合投资选择模型。Jagannathan等(2002)在Markowitz组合投资选择模型的基础上,实施了非负权重约束,得到下式:

s.t. w′1=1  (2)
wi≥0, i=1,2,…,N
式中,由于wi≥0且w′1=1,有0≤wi≤1。这样,非负权重约束限制了卖空机制的存在,现实中不可能存在极端的组合投资权重,从而避免了Markowitz组合投资模型中容易产生极端权重的问题。
3. 带有范数约束的高维组合投资选择模型。按照Fan等(2012)的研究思路,在标准组合投资模型基础上,对组合投资权重向量长度实施约束,得到下式:

s.t. w′1=1  (3)

 

合投资中权重极端值的出现。
通过约束参数c的不同取值,可以得到不同的资产选择结果。当c=1时,约束条件w′1=1与       ≤1可以确保组合投资权重非负,得到Jagannathan等给出的“无卖空”约束组合投资选择模型。当c→+∞时,约束条件       ≤+∞不起作用,相当于没有实施约束,得到Markowitz给出的无约束组合投资选择模型。当1≤c≤+∞时,模型介于Jagannathan等的组合投资选择模型与Markowitz的组合投资选择模型之间。
在式(3)中,由于使用了约束条件       ≤c,可以将组合投资权重进行“压缩”,将一些贡献不显著或者取值不大的权重“压缩”到0,实现金融资产选择过程,能够解决高维组合投资决策问题。为此,本文称之为“带有范数约束的高维组合投资选择模型”。
三、组合投资选择模型求解
下面,进一步给出带有范数约束的高维组合投资选择模型的两种求解算法:基于二次规划方法的精确求解和基于LASSO回归方法的近似求解。
1. 精确求解。对于式(3),可以使用二次规划方法进行求解。
首先,构造以下拉格朗日函数:
       L(w,λ1,λ2)=w′Σw+λ1(w′1-1)+λ2([w1]-c)
其次,利用Karush-Kuhn-Tucker条件,可以得到:
  (5)
式中,g为       的梯度向量。
最后,由式(5)求出最优组合投资权重向量w。
2. 近似求解。实际上,组合投资选择模型与回归模型之间存在一定的联系,利用w′1=1这个条件,容易得到:wN=1-w1-w2-…-wN-1,可以将组合投资风险最小化的规划问题转化为一个回归问题,如下式所示:

 

   (6)
式中,Y=RN且Xj=RN-Rj(j=1,2,…,N-1),[w"]=(w1,…,wN-1)"为回归系数,[d=c-|1-w"1|]。特别地,当d=0时,c=1成立。这样,可以通过回归分析求出回归系数,[w"]=(w1,…,wN-1)",进而得到最优权重w=([w"],1-w1-…-wN-1)′=(w1,…,wN-1,1-w1-…-wN-1)′。
与二次规划的精确求解不同,回归方法的求解只能算作近似求解,其取值依赖于资产Y=RN的选择,最终结果有可能并非全局最优。当面对的金融资产数目非常庞大时,式(6)就是一个高维变量回归模型,详见李根等(2012)的综述。对式(6)所示的回归模型,可以使用Tibshirani(1996)与Efron等(2004)给出的LASSO方法进行求解。
可以将近似求解过程概括为四个步骤:
第一步,在式(3)中,取c=1,利用基于二次规划的精确求解方法求出带有“无卖空”约束的最优组合投资,令其为Y。
第二步,在式(6)中,将Y代入并对剩余金融资产差额Xj进行回归,使用LASSO方法求出与约束参数d相对应的回归系数[w](d)。
第三步,通过w=([w"],1-w1-…-wN-1)",将[w](d)还原为w(c),其中:c=d+            。
第四步,由w(c)得到最优组合投资收益:Rp(c)=w′(c)R与最优组合投资方差:    (c)=w′(c)Σw(c)。
四、数值模拟
1. 数据生成过程。利用Fama等(2012)给出的Fama-French三因子模型模拟金融资产收益状况,将Fama-French三因子模型写成以下矩阵形式:

式中,N为金融资产数目,T为样本观测时长,f为三因子矩阵,B为因子载荷系数矩阵,ε为误差矩阵。
假设E(ε|f)=0和cov(ε|f)=diag(    ,…,     )。因此,从式(7)不仅可以模拟各个金融资产收益,而且可以得到R的方差—协方差矩阵,如下式所示:

为模拟N个金融资产在T观测时期的收益,本文中Fama-French三因子模型的参数设置参考Fan等(2012)的估计。首先,从三元正态分布N(均值,方差)随机产生因子载荷矩阵,其中正态分布的参数见表1左侧。其次,三因子收益从三元正态分布N(均值,方差)中得出,其中正态分布的参数见表1右侧。最后,从形状参数为3.3586和尺度参数为0.1876的伽玛分布中得出残差项。
这样,通过式(7)可以得到金融资产收益的模拟数据,通过式(8)可以得到金融资产收益真实的方差—协方差矩阵。此外,还可以通过样本的方差—协方差矩阵,即S=(R-R)(R-R)′/(T-1),对Σ做出估计。

 

 

 

 


2. 数值模拟结果。利用前述的数据生成过程,分别选取两种情形:①T=252,N=100;②T=252,N=500。这里,T=252与一个年度的交易日相对应。对于情形①,由于N较大,接近T,使得难以从样本方差-协方差矩阵S中得到Σ的精确估计。对于情形②,由于N>T,直接导致Σ为奇异矩阵。无约束的Markowitz组合投资选择模型失效。分别使用真实的方差—协方差矩阵与样本的方差—协方差矩阵作为输入条件,使用精确求解算法对带有范数约束的高维组合投资选择模型进行求解,得到最优组合投资权重与组合投资效果评价。
图1中左图和右图分别给出了最优组合投资日波动与选中的金融资产数目随着约束参数变化的结果,可以看出当约束参数c的取值较小时,样本方差—协方差矩阵所得结果与真实方差—协方差矩阵所得结果并无明显差异;当约束参数c的取值较大时,两者所得结果差异明显,此时样本方差—协方差矩阵所得结果存在较大误差。由图1还可以看出,随着约束参数c的取值增加,被选中的金融资产数目逐渐增多,投资组合变得更加多元化了,风险分散化效果进一步增强,主要表现为波动率迅速下降并且稳定在某一水平上,较好地提升了已有的组合投资选择模型的投资效果。
当取T=252,N=500时,本文的方法依然能够给出最优组合投资选择结果,如图2所示。图2与图1的结果相类似,可以看出:在c>2以后,基于样本方差-协方差矩阵估计方法所得结果与真实的方差—协方差矩阵方法所得结果差异更大。
接下来,使用基于LASSO回归的近似求解算法,对此开展研究。按照近似求解算法的四个步骤,以c=1时基于精确算法求得的“无卖空”约束组合投资选择结果作为Y,再完成余下的组合投资选择过程,对组合投资效果进行评价。
为比较不同的方差—协方差矩阵估计方法对组合投资选择效果的影响,本文采用两种方法来估计方差—协方差矩阵:方法1,样本方差—协方差矩阵;方法2,Fama-French三因子模型方差—协方差矩阵。
图3的左图与右图分别给出了方法1与方法2的LASSO回归系数选择过程,两个选择过程并非完全一致,但最终都了100个金融资产。限于篇幅,本文略去了金融资产数目为500的LASSO回归系数选择过程。
图4报告了在金融资产数目为100时使用LASSO回归近似求解算法所得的组合投资效果,其中:左图为基于方法1所得结果,右图为基于方法2所得结果。图4的结果表明:第一,随着约束参数d取值的增加,投资者越容易选择更多的金融资产来分散风险,所得组合投资的波动率呈现下降趋势;第二,无论是方法1还是方法2,所得组合投资的经验风险都与真实风险非常接近。
图5报告了在金融资产数目为500时使用LASSO回归近似求解算法所得的组合投资效果。其中:左图为基于方法1所得结果,右图为基于方法2所得结果。与图4相比,图5呈现出一些新的变化:第一,当d>3以后,基于方法1与方法2所得组合投资的经验风险与真实风险的差异都在变大,意味着更大规模资产给组合投资选择带来了一定的困难;第二,基于方法2所得组合投资的经验风险与真实风险更为接近,这主要是因为大规模金融资产的样本方差—协方差矩阵估计精度不如基于Fama-French三因子模型的方差—协方差矩阵估计精度高。
最后,分别将图4与图1、图5与图2进行对比,可以发现:就风险分散化效果而言,基于LASSO回归近似求解算法所得组合投资选择结果与基于二次规划精确算法所得组合投资选择结果较为接近,表明基于LASSO回归近似求解算法取得了较好的近似效果。图6给出了基于精确算法的组合投资选择效果,左图为年化波动率,右图为夏普比率;实线为基于样本方差—协方差矩阵估计方法,虚线为基于Fama-French三因子模型方差—协方差矩阵估计方法。由图6可以看出,实线与虚线存在较大距离,表明基于方法1所得的结果与基于方法2所得的结果存在较大差异。无论是方法1还是方法2,其波动率总体上存在先下降后上升的趋势,并且大约在c=1.7处达到最小。而夏普比率的变动情况与此稍有不同,基于方法1所得的结果呈现出先上升后下降的趋势;而基于方法2所得的结果呈现出递增趋势,并最终保持在恒定水平上。不过,这两种方法所得的夏普比率均以c=1.7处为转折点。这一结果对于约束参数取c=1.7时,可以得到较为满意的组合投资选择效果。进一步比较发现,基于方法1的波动率高于基于方法2所得的结果,同时前者的夏普比率低于后者,表明基于Fama-French三因子模型的方差—协方差矩阵估计方法能够得到更为满意的组合投资效果。
表2列出了最优组合投资选择的年化收益与年化风险等特性。可以看出:第一,基于方法2所得的金融资产数目多于基于方法1所得的金融资产数目,这一结果导致了前者的最大权重小于后者,最小权重大于后者;第二,无论方法1还是方法2都存在负权重现象,表明沪深300指数进行非负权重的加权组合投资效果并非最优;第三,将最大权重与最小权重进行比较,可以看出“做多”的权重远远大于“做空”的权重,表明在沪深300指数成分股中,只需进行少量“做空”操作,就可以实现最优组合投资。
为便于比较,本文以等权组合投资模型及标准的均值—方差模型(全局最小方差组合投资模型)作为基准,其组合投资效果也列于表2中。由表2可知:第一,无论是基于方法1还是方法2估计的方差—协方差矩阵,等权组合投资所得夏普比率都为负,其组合投资效果劣于带有范数约束的高维组合投资模型;第二,对于全局最小方差组合投资模型,基于方法1所得的组合投资效果较差,最小权重较小,最大权重较大,“做多”的权重略高于“做空”的权重;而基于方法2所得的投资组合效果明显提升,其夏普比率为1.524,仍不如带有范数约束的高维组合投资模型所得的组合投资效果(c≥2.0),且其所选头寸数目较多、最大权重较高,不利于资产管理。
综合比较可知,本文建立的带有范数约束的高维组合投资选择模型,通过对约束参数的控制与选择,可以得到满意的投资组合选择效果:较高的夏普比率与较少的头寸数目,可适用于大规模组合投资管理与决策。
六、结论
在标准组合投资选择模型的基础上,通过施加范数约束,得到了带有范数约束的高维组合投资选择模型。将带有范数约束的高维组合投资选择模型与其他组合投资选择模型进行比较,发现其更具一般性:通过约束参数c的取值,能够得到不同的组合投资结果。这一结果为机构投资者选用不同的组合投资方案提供了可能,既可以选择较小的c值,控制资产池中金融资产的规模,降低监管成本,也可以选择较大的c值,达到降低风险的目的。
对于带有范数约束的高维组合投资选择模型,分别使用二次规划方法与LASSO回归方法,给出其精确求解和近似求解算法,并通过Monte Carlo数值模拟与实际应用验证了模型的有效性。数值模拟结果表明:基于LASSO回归的近似求解算法能够较好地逼近基于二次规划的精确算法,组合投资选择效果基本一致。通过实际应用,发现带有范数约束的高维组合投资选择模型不仅能够运用于资产数目大于样本量的高维情形,而且能够实现金融资产的选择,得到比基准的组合投资模型(等权组合投资模型、均值—方差组合投资模型)更为有效的组合投资选择结果,主要表现在两个方面:第一,可以获得更高的夏普比率,取得更为满意的收益风险比;第二,选中的头寸数目更少,便于组合投资管理,降低组合投资选择成本。

主要参考文献:
Markowitz H..Portfolio selection[J].The Journal of Finance,1952(1).
Sharpe W. F..A simplified model for portfolio analysis[J].Management Science,1963(2).
Sharpe W. F..Capital asset prices: A theory of market equilibrium under conditions of risk[J].The Journal of Finance,1964(3).
Lintner J..The valuation of risk assets and the selection of risky investments in stock portfolios and capital budgets[J]. The Review of Economics and Statistics,1965.
Ledoit O., Wolf M..Improved estimation of the covariance matrix of stock returns with an application to portfolio selection[J]. Journal of Empirical Finance,2003(5).
Fan J., Fan Y., Lv J..High dimensional covariance matrix estimation using a factor model[J].Journal of Econometrics,2008(1).
Pesaran M., Zaffaroni P..Optimal asset allocation with factor models for large portfolios[J].Ssrn Eletronica Journal,2008(6).
Chopra V. K., Ziemba W. T..The effect of errors in means, variances, and covariances on optimal portfolio choice[J].The Journal of Portfolio Managernent,1993(2).
路应金,唐小我,周宗放.证券组合投资的区间数线性规划方法[J].系统工程学报,2004(1).
Goldfarb D., Iyengar G..Robust portfolio selection problems[J].Mathematics of Operations Research,2003(1).
De Roon F. A., Nijman T. E., Werker B. J..Testing for mean variance spanning with short sales constraints and transaction costs: The case of emerging markets[J].The Journal of Finance,2001(2).