总第 696 期
【作 者】
杨春霞1(教授) 邓强强1 刘小芳2
【作者单位】
(1.南京信息工程大学信息与控制学院 南京 210044 2.中国工商银行泗洪支行 江苏泗洪 213900)
【摘 要】
【摘要】 本文采用排列熵和滑动窗口方法研究交叉上市公司A股和H股的价格行为。研究发现,交叉上市的A股和H股股票价格变化存在差异,H股股票价格变化相对规则,A股股票价格变化则相对随机;并且在金融危机后,A股价格变化的不确定性明显变大,A股的信息效率变高,而H股价格变化的不确定性有减小的趋势; A股、H股价格变化存在着较高的关联性并且在长时间尺度下A股、H股价格变化的关联性逐步增强。
【关键词】 交叉上市 价格行为 排列熵 滑动窗口
一、引言
交叉上市是指同一家公司在两个或多个证券交易所上市的行为。香港证券市场在市场监管、信息披露和金融创新等方面的先进水平吸引了众多内地企业在港上市。随着香港投资者直接投资A股的渠道的开放、投资港股的QDII(Qualified Domestic Institutional Investors)产品的出现、H股的回归以及众多大型公司在两地的同时上市,两地市场之间的联系逐渐加强,同时对交叉上市的A股和H股关系的研究也成为理论界与实务界关注的焦点。
在A股、H股价差方面,胡章宏等(2008)通过分析A股对H股普遍存在的溢价现象发现,流动性假说和信息不对称假说对A股、H股价差具有较强的解释力。陆静(2011)在具有异质信念的两阶段定价模型基础上证明了异质信念和卖空机制是导致H股价格低于A股价格的原因之一。李连发(2012)通过分析A股、H股溢价水平,发现信息不对称理论能够解释A股、H股溢价扩大的现象。
在A股、H股相互关系方面,陈学胜等(2009)通过Hasbrouck的信息份额模型发现,虽然交叉上市公司A股、H股价格存在差异,但是两者的变动存在线性或非线性的协整关系且互为调整。杨毅(2009)结合BEEK模型与Granger因果检验分析研究了交叉上市的A股、H股间的价格引导关系,发现H股市场显著地引导A股市场。倪晋武等(2011)运用Granger因果检验和BEKK—MGARCH模型考察了不同市场间价格的传染效应和波动溢出效应,发现金融危机中上证指数会影响恒生指数的价格趋势,并且对恒生指数具有一定程度的单向波动传染效应。刘燕等(2013)结合协整检验和Granger因果检验分析了A股、H股市场之间的均衡关系和因果关系,发现A股、H股市场之间存在长期稳定的均衡关系,并且A股市场显著地引导H股市场。
现有的对A股、H股价格差异的研究主要是寻找和验证影响股票价格差异的因素,同时大多采用协整检验和Granger因果检验来分析A股、H股波动性之间的传递效应和价格或收益间的领先滞后关系,对A股、H股自身价格行为和相互关系随时间变化的研究仍较少。
Bandt等(2012)提出的排列熵算法能够有效地放大时间序列的微弱变化和衡量时间序列的复杂度,被广泛地运用在时间序列分析中。Zuninol等(2009)使用排列熵研究了不同国家间主权债务市场的效率,发现发达市场相对于新兴市场具有较高的排列熵,这表明发达市场的债券指数价格变化更随机、可预测性较弱,且市场的信息效率更高。基于此,本文使用排列熵来研究A股、H股价格变化的特征,进而分析A股、H股价格变化的差异性。
二、排列熵
排列熵(Permutation Entropy,PE)是基于时间序列自身所具有的空间特性来度量时间序列的复杂度,具有计算简单、抗噪声干扰能力强等特点。
对一个一维时间序列{x(i) |i=1,2,3,...,n},确定相空间重构的嵌入维数m和延迟时间τ;对时间序列中的元素x(i)进行相空间重构,得到重构后的向量序列{X(j)|j=1,2,…,n-(m-1)τ},其中X(j)=(x(j),x(j+τ),…,x(j+(m-1)τ));将重构向量X(j)中的数值由小到大排列,即x(j+(k1-1)τ)≤x(j+(k2-1)τ)≤⋯x(j+(km-1)τ),并且当k1<k2时,x(j+(k1-1)τ) ≤ x(j+(k2-1)τ)。因此,对于重构后的每个向量X(j)都可以得到一组符号序列,如下:
S(l)=(k1,k2,…,km) (1)
式中:l=1,2,…,g,且g≤m!。计算每一种符号序列出现的概率P1,P2,…,Pg,则按照Shannon熵的形式,时间序列x(i)的排列熵可以定义为:
(2)
当Pl=l/m!时,hp(m)就达到最大值ln(m!)。为了便于比较,对hp(m)进行归一化处理,即:
0≤Hp=hp(m)/ln(m!)≤1 (3)
归一化排列熵(Normalized Permutation Entropy,NPE)Hp的大小反映了时间序列x(i)的随机程度:Hp的值越小,说明时间序列越规则、确定性越高;反之则时间序列越接近随机、不确定性越高。
同样,可以利用上文的方法定义K维时间序列{Wt=(X1t,X2t,…,XKt)}的排列熵。先确定嵌入维数m和延迟时间τ,然后对K维时间序列进行相空间重构;统计重构得到的符号序列{S=(S1l,S2l,…,SKl)}中每种符号序列出现的概率Ps,则K维时间序列的排列熵为:
hp(Wt)=-∑Psln(Ps) (4)
时间序列Xt和Yt之间的条件排列熵可定义为:
hp(Yt|Xt)=hp((Xt,Yt))-hp(Xt) (5)
对长度为N的一维时间序列,为了保证统计的可靠性,N和嵌入维数m之间至少满足N≥m!,Bandt(2002)提出在实际应用中3≤m≤7。Matilla-García等(2008;2010;2014)进一步提出对一个每一维均具有N个观测值的K维时间序列,嵌入维数[m]的最大值应满足N≥5(m!)K。对延迟时间τ,一般使用τ=1。
三、实证分析
1. 数据选取与处理。本文选取恒生AH股A指数(HSAHA)作为交叉上市公司A股价格的代表指标,恒生AH股H指数(HSAHH)作为交叉上市公司H股价格的代表指标。选取两个指数的日收盘价为研究样本,样本的时间跨度为2007年1月4日到2014年2月26日,共1 734个样本值。所有数据均来源于wind数据库。
由于恒生AH股A指数、H指数分别以人民币和港元计价,为了保持样本数据的一致性,本文以人民币为基准将恒生AH股H指数的价格折算成人民币计价,港币对人民币的汇率使用国家外汇管理局提供的人民币基准汇率。
2. 股票价格行为分析。本文指数价格时间序列的长度为1 734,根据现有文献,我们分别分析嵌入维数m为3、4、5时A指数、H指数排列熵的变化情况。
表1给出了不同嵌入维数下两个指数的排列熵。从中我们可以发现两个指数的排列熵均随着嵌入维数的增加而增加;归一化后的排列熵随着嵌入维数的增加而减小,这说明随着嵌入维数的增加,时间序列变化的确定性增加,较大的m值更有助于系统的研究。在不同的嵌入维数下,HSAHH和HSAHA的标准化排列熵均较大,这说明不论是H股还是A股,其价格变化的随机性都比较高;虽然在相同嵌入维数下HSAHH的排列熵和HSAHA的排列熵的差值很小,但是HSAHH的排列熵均小于HSAHA的排列熵,这表明HSAHH价格变化相对规则,HSAHA价格变化相对随机,A股具有较高的信息效率。
3. 股票价格行为变化趋势分析。不难发现在样本期间内,HSAHA和HSAHH的价格变化存在差异。我们采用滑动窗口方法来研究A指数、H指数价格行为差异随时间变化的趋势。
为了研究不同嵌入维度下A股、H股价格变化的差异,我们确定滑动窗口的长度为600,相邻窗口间的滑动步长为1。我们计算了不同窗口下两个指数的排列熵,结果如图1所示。其中上图为两个指数的排列熵,下图为两个指数的归一化排列熵。图中横坐标t对应每个窗口中第一个数据的日期。
在图1中,我们可以发现当嵌入维数为3时,HSAHA的排列熵从2007年1月到2007年7月逐渐减小。从2007年7月到2009年5月先增大再减小最后趋于稳定,在2009年5月以后逐渐增大并趋于稳定。当嵌入维数为4或5时,HSAHA的排列熵从2007年1月到2007年7月逐渐减小,从2007年7月到2009年5月逐渐增大并趋于稳定,在2009年5月以后明显增大并趋于稳定。
在不同维数下HSAHH的排列熵在2007年8月前后存在明显变化,从2007年8月到2009年5月逐渐增大并趋于稳定;当嵌入维数为3时,在2009年5月以后HSAHH的排列熵有增大的趋势并且存在明显的波动;当嵌入维数为4或5时,在2009年5月以后HSAHH的排列熵同样存在明显的波动,但是有减小的趋势。
对比A指数、H指数排列熵随时间的变化趋势,我们可以发现当嵌入维数为4或5时,在2009年5月以前A指数、H指数排列熵变化趋势基本相同并且排列熵的差值较小;在2009年5月以后A指数排列熵明显增大而H指数排列熵有减小的趋势,这说明在2009年5月以后即金融危机后恒生AH股A指数价格变化的随机性变大、信息效率变高,恒生AH股H指数价格变化的不确定性降低。当嵌入维数为3时,在2009年5月以后A指数排列熵明显增大,同时H指数的排列熵也有增大的趋势,但H指数的排列熵均小于A指数的排列熵,这表明当嵌入维数为3时,在2009年5月恒生AH股A指数和H指数价格变化的随机性均变大、信息效率变高,但是A指数价格变化的不确定性要高于H指数。
4. 股票价格变化的关联性分析。前文分析了A指数、H指数价格行为随时间变化的趋势。因发行主体相同,交叉上市的A股和H股间存在着天然的内在联系,因此有必要对交叉上市的A股、H股股票价格变化做相关性分析。
表2给出了在不同嵌入维数下A股、H股股票价格{At,Ht}的顺序模式的联合概率(因篇幅限制,表中只给出了概率较高的部分数据,表中序列“123”表示价格的顺序模式为A1≤A2≤A3)。从表2我们可以发现,在样本期间内A指数、H指数价格存在较为明显的相同的变化模式并且同增同减的变化模式最显著,这说明A指数、H指数价格变化存在着较高的联动性。
图2给出了嵌入维数为3时A指数、H指数间条件排列熵随时间变化的趋势。因样本长度为1 734,为保证统计的可靠性,在计算二维时间序列{At,Ht}的排列熵时嵌入维数m取3。
图a中滑动窗口的长度为180,相邻窗口间的滑动步长为1,横坐标t对应每个窗口中第一个数据的日期;从2007年1月到2009年2月A指数、H指数间的条件排列熵逐渐减小,这表明在该段时期内A指数、H指数间的关联性逐步增强;在2011年3月后A指数、H指数间的排列熵均较小,这表明在2011年3月后A指数、H指数间存在着较强关联性。图b中滑动窗口的长度为400,图c中滑动窗口的长度为600,图d中滑动窗口的长度为800。从图b、c、d中我们可以发现A指数、H指数间的条件排列熵逐渐减小,这表明A指数、H指数间的关联性逐渐增强;同时,当滑动窗口长度为400时在2011年5月以后h(H|A)明显小于h(A|H),当滑动窗口的长度为600时在2010年3月以后h(H|A)明显小于h(A|H),当滑动窗口的长度为800时在2009年5月以后h(H|A)明显小于h(A|H),这表明在A指数、H指数间的关联性逐渐增强的同时,在已知A指数价格变化的情况下预测H指数变化情况的不确定性要低于在已知H指数变化情况下预测A指数变化情况的不确定性。
四、结论
交叉上市的A股、H股存在着不同的价格行为。对交叉上市的A股、H股股票价格行为变化特性的研究,能够帮助我们优化投资策略。基于股票价格变化自身的特性,本文使用排列熵和滑动窗口方法对A股、H股的价格行为进行了分析。研究发现,在样本期间内恒生AH股A指数价格变化的随机性有增强的趋势,并且在2009年5月以后即金融危机后明显增大、A指数的信息效率提高;在2009年5月以后恒生AH股H指数价格变化的随机性有降低的趋势;A指数、H指数价格变化存在着较高的联动性,并且在长时间尺度下A指数、H指数价格变化的关联性逐渐增强,同时在金融危机后,已知A指数价格变化的情况下预测H指数变化情况的不确定性低于已知H指数变化的情况下预测A指数变化情况的不确定性。
因可获取数据的有限性,我们只分析了嵌入维数为3时A指数、H指数价格变化的相关性。对嵌入维度较高时A指数、H指数价格变化的相关性,以及引发A指数、H指数产生不同价格行为的影响因素的分析是我们下一步的研究工作。
【注】 本文受国家自然科学基金(项目编号:61273229)资助。
主要参考文献
陆静.投资者异质信念与上市公司盈余信息的甄别——基于AH股分割市场的实证分析.中国管理科学,2011;5