2013年 第 16 期
总第 668 期
财会月刊(下)
业务与技术
基于多采样频率的沪深300股指期货价格发现能力研

作  者
刘 澄(博士生导师) 胡艺铭

作者单位
(北京科技大学东凌经济管理学院 北京 100083)

摘  要

      【摘要】本文基于同一时段沪深300股指期货及现货的每5分钟高频数据、每60分钟数据和日数据,利用VAR模型和VECM模型实证研究了沪深300股指期货及沪深300指数的价格发现能力。结果表明:在高频交易中,股指期货价格的误差修正速度约是指数现货价格修正速度的200倍,股指期货价格单向引导现货价格,价格变动领先现货10分钟左右,股指期货主导价格发现过程;在低频交易中,股指期货的价格发现能力减弱,指数现货逐渐成为价格发现的主力驱动。
【关键词】股指期货   价格发现   VAR   VECM

      一、引言
价格发现(Price Discovery)功能是指市场将新信息导入资本价格,通过公开、公正、高效、竞争的交易运行机制,形成均衡价格的过程。在完全有效的金融市场中,新信息会同时渗入到期货与现货市场,但是在现实世界中,由于结构性因素,在期货、现货价格之间往往形成一种领先—滞后关系(Lead-Lag relationship)。股指期货市场效率的实现主要依赖其价格发现功能的发挥。
国外学者对期货价格发现功能的研究由来已久,大多研究采用对期货和现货的时间序列进行建模处理,实证结果多数支持期货具有价格发现功能的结论,相关研究的有Garbade和Silber(1983)、Stoll和Whaley(1990)、Tse(1999)、Visvikis和Alexakis(2008)。同时,一些学者从新的视角出发,认为股指现货比股指期货更具价格发现能力,相关研究的有Edwards(1988)、Chen和Gau(2009)、Anshul和Chandra(2012)。在研究方法上,Garbade和Silber(1983)最早建立动态模型(G-S模型)来刻画期货价格在价格发现功能中作用的大小。Kawaller-Koch-Koch(1987)、Min和Najand(1999)将三阶段最小二乘法(3SLS)运用到股指期货价格发现能力的研究中,并计算出股指期货领先现货的时间。Hasbrouk(1995)、Gonzalo和Granger(1995)分别提出信息分享模型和永久/暂时模型,从不同角度衡量不同市场在价格发现过程中的贡献,这两个模型被学界广泛采用。 也有很多学者采用向量误差修正模型(VECM)研究价格发现。
我国股指期货市场起步较晚,相关研究主要采用国外成熟证券市场的数据或者仿真交易数据。黄玉如(1994)对美国S&P500的日交易数据进行Granger因果关系检验,表明股指期货与现货互为因果。肖辉、鲍建平、吴冲锋(2006)使用脉冲响应和一般因子分解模型检验了香港恒生指数、日经指数等的期货与现货市场之间的价格发现过程,研究发现,期货市场在价格发现过程中占主导地位,并且随着期货市场的发展,其在价格形成过程中的作用越来越大。严敏等(2009) 利用日交易数据研究了沪深300股指期货仿真交易市场与沪深300指数市场之间的价格发现与波动溢出效应,研究结果发现,指数现货市场在价格发现中起主导作用,两市场间不存在显著的非对称双向波动溢出效应。刘瑾婧等(2011)利用沪深300股指期货的仿真交易数据证实,短期内股指期货的价格对股指价格的影响比长期均衡影响大。
沪深300股指期货正式交易仅两年时间,我国证券市场与国外成熟市场在市场环境和投资者构成上存在很大差异,因而基于国外市场交易数据的研究可能无法有效反映国内股指期货市场的运行状况。此外,仿真交易过程存在规则不完善、市场参与度低、交易量小、交易机制单一、交易非同步等缺陷,导致基于仿真交易数据实证研究的有效性还有待商榷。本文利用沪深300股指期货正式稳定运行后的高频和低频交易数据来探索股指期货的价格发现能力,以此来考察沪深300股指期货推行两年来的真实市场运行效率。
二、研究方法
(一)数据的采集
根据预期理论(Expectation Theory),股指期货合约指数是对未来某个时点的指数水平的一个预期,预测的时间跨度越大,预测的精确度就越低,所以从市场交易情况来看,一般只有到了交割月份或者交割的前一个月份,交易才会活跃起来,而此时的交易信息最能反映股指期货市场的效率。因此借鉴Schwarz和Laatsch(1991)的研究结论,选取数据的时间跨度是IF1204合约交割前的一个月,即2012年3月13日至2012年4月14日。根据采样频率不同,将样本分成三组:两个指数的每5分钟高频数据、每60分钟数据和日数据。数据来源于Wind资讯金融数据库,数据分析采用Eviews 6.0软件。
为方便研究,记沪深300指数(HS300指数)和IF1204期货价格的每5分钟收盘价序列分别为{S1,t}和{F1,t};记HS300指数和IF1204期货价格的每60分钟收盘价序列分别为{S2,t}和{F2,t};记HS300指数和IF1204期货价格的日收盘价序列分别为{S3,t}和{F3,t}。为了消除异方差性,对序列进行对数化处理,得到三组六个对数价格序列,分别是{s1,t}和{f1,t}、{s2,t}和{f2,t}、{s3,t}和{f3,t},其中si,t=lnSi,t,fi,t=lnFi,t,(i=1,2,3),用△si,t和△fi,t代表对数价格的一阶差分。
(二)理论模型
1. 股指期货定价模型。对期货市场价格发现功能的理解和界定在理论界有多种表述,其中有代表性的表述是:期货市场的价格发现是指期货价格在理论上等于对期货合约到期日的现货价格的条件期望,也即期货价格是对到期日现货价格的无偏估计。该定义可用公式表示为:
Ft=E(St+1/It)(1)  
式中:Ft表示到期日为 t+1的期货合约在t时期的价格;St+1表示到期日的指数水平;It表示第t期的信息。式(1)表达的思想是:在市场有效的情况下,期货价格反应了第t期的所有信息,期货价格应该是对到期日指数水平的条件期望,期货价格呈现随机波动的特征。如果Ft≠E(St+1/It),表明第t期的信息没有充分地反映到期货价格上,市场参与者可以使用额外的信息来预测St+1,可以通过买入或者卖出期货合约来获得额外利润,直到两者重新恢复相等。股指期货的价格发现过程就是市场达成上述均衡的过程。
2. 向量自回归模型(VAR)。为了探究是股指期货还是股票指数在价格发现上起主导作用,本文采用VAR模型研究两者价格的领先和滞后关系。Sims(1980)提出VAR模型,模型中所有变量都被视为内生变量,采用多方程联立的形式,在模型的每一个方程中,内生变量对模型的全部内生变量的滞后值进行回归,从而估计全部内生变量的动态关系。如果股指期货和现货两个市场对新信息的反应是同时的,那么HS300指数和IF1204期货价格运动应该存在同期相关关系;如果存在某一个市场对信息的反应比另外一个市场对信息的反应快,那么两个市场之间存在领先—滞后关系。假设IF1204期货价格和HS300指数均是由前p期的价格和误差项决定的,那么VAR模型可以表示为:

 


式中:st指t时刻HS300指数水平;ft指t时刻IF1204期货合约的价格;u1,t和u2,t独立同分布,即,u2,t,u2,t ~ IID(0,?滓2),cov(u1,t,u2,t)=0。
3. 向量误差修正模型(VECM)。为研究股指期货和指数对价格发现过程的贡献大小,在协整的基础上,采用VECM模型进行协整分析。VECM模型实际上是对无约束的VAR模型进行协整约束后的有约束VAR模型,因而它和VAR模型具有相同的滞后阶数,本文采用的协整方程是含截距但不含确定趋势的形式。股指期货与指数对价格的VECM模型可以表示为:
△st=c1+?姿1Zt-1+     ?祝i △ft-i+     ?祝i △st-i+?着1,t(3)  
△ft=c2+?姿2Zt-1+     ?祝i △ft-i+     ?祝i △st-i+?着2,t(4)  
式中:c1、c2分别为对应模型的常数项;    (j=1,2;k=1,2)为短期调整系数;p为滞后阶数;?着1,t和?着2,t为对应模型的残差,这里假定其服从标准正态分布;Zt-1=ecmt-1=st-1+?酌ft-1-c,是前一期的非均衡误差;而?姿ecmt-1称为误差修正项,表示非均衡误差的短期修正。
从长期来看,误差修正系数?姿1和?姿2表示价格的短期调整方向和速度。当ecmt-1>0(即出现正误差)时,误差修正项?姿ecmt-1<0;而ecmt-1<0(即出现负误差)时,?姿ecmt-1>0,两者的方向恰好相反,所以,误差修正是一个反向的调整过程,即负反馈机制。
从短期来看,若式(3)中的△ft-i的系数    显著不为零,则说明在价格发现过程中,fi,t起主导作用,即股指期货价格引导指数现货;同样的,若式(4)中的△st-i的系数    显著不为零,则说明在价格发现过程中,si,t起主导作用,即指数引导股指期货价格。因此,利用上述方法可以得出股指期货和指数对于价格中非均衡误差的修正速度,修正速度快的项在价格发现过程中起主导作用。
三、实证研究
(一)数据的描述统计
表1是样本期内HS300指数和IF1204期货的对数化后的价格的基本描述统计。统计结果显示,三个样本组中IF1204期货价格都比同组的HS300指数价格稍高、波动稍大。从偏度和峰度来看,s1,t、f1,t、s2,t、f2,t偏右,s3,t、f3,t略微偏左。从JB正态分布检验统计量的值及其伴随概率来看,在5%的水平上显著,除f1,t不服从正态分布外,其余五个序列均呈现显著的正态分布特征。经计算,三组数据中两个变量之间的相关性都很强,?籽>0.99。      (二)协整检验
1. VAR模型的参数估计。根据股指期货定价模型,若定价准确,则IF1204期货价格与HS300指数之间应该存在长期的稳定协整关系,因而进行协整检验可以验证。协整检验前需对三组序列分别进行平稳性ADF检验,结果发现,在5%的显著性水平上,六个时间序列均为非平稳序列,但是其一阶差分序列(△s1,t、△f1,t、△s2,t、△f2,t、△s3,t、△f3,t)均平稳,说明它们均为一阶单整序列I(1),可以对3组样本分别进行协整检验。本文选取基于VAR模型的多重协整检验方法——Johansen检验法,对三组样本数据分别建立VAR模型,根据LR统计量、SC信息准则、AIC信息准则等指标,确定模型的最优滞后阶数分别为滞后2阶、滞后1阶和滞后1阶。模型的估计参数如表2所示:

 

 

 

 

 

 

 

 

 

对以上三组VAR模型进行平稳性检验,结果表明,特征根均在单位圆内,说明所建立的模型是稳定的。由表2的参数估计可以看出,对于每5分钟的高频数据,在HS300指数的对数价格变化方程中,IF1204期货价格的滞后项系数均显著,说明前期IF1204期货价格的变化领先当期HS300指数价格的变化。但是,在IF1204期货价格变化的方程中,HS300指数价格的滞后项对IF1204期货价格变化的解释作用不显著,说明前期指数价格的变化晚于当期IF1204期货价格的变动。在基于每60分钟数据和日交易数据的VAR模型中,系数显著性不强,说明指数价格和股指期货价格之间的引导能力减弱。为了进一步说明HS300指数与IF1204期货价格之间的互动性,对{s1,t}{f1,t}、{s2,t}{f2,t}、{s3,t}{f3,t}这三组价格分别进行基于VAR模型的Granger因果关系检验,结果如表3所示:

 

 

 

 

 

 

 

从Granger因果检验的结果可以看出,对于每5分钟的高频交易数据,IF1204期货价格是HS300指数价格的单向Granger原因,且滞后阶数为2,说明前者领先后者10分钟左右。对于每60分钟的交易数据和日数据,伴随概率均大于0.05,说明两个价格之间不存在显著的Granger因果关系;但是在10%的显著性水平上,这两组样本均表明HS300指数价格是IF1204期货价格的Granger原因。表3中的检验结果还说明:在短期高频交易中,股指期货价格的变动领先和引导指数价格的变动的。但是,当交易数据的采集频率降低,从相对较长的时间跨度考察两者价格之间的关系时,股指期货价格的这种领先优势逐渐减弱,并逐渐逆转,HS300指数的价格开始引领股指期货价格的变动。
在以上建立的VAR模型基础之上进行Johansen协整检验,表4是Johansen协整迹检验的结果:

 

 

 

 


从表4的Johansen协整迹检验结果可以看出,对于每5分钟的高频数据和每60分钟的数据,HS300指数价格和IF1204期货价格之间存在长期稳定的协整关系,可以进一步采用VECM模型分析两者短期波动的关系;而对于日数据,迹检验结果表明两者之间不存在长期稳定的协整关系。
2. 基于VECM模型的短期波动分析。协整检验结果表明3组样本均存在长期稳定的协整关系,因而可以分别估计它们的长期均衡关系式,即协整方程,并进一步借助VECM模型分析其短期波动。根据式(3)和式(4),VECM模型参数估计结果如表5所示:

 

 

 

 

 

 

 

 

 

 

根据表5中的参数估计值,可以写出VECM方程,其中Zt-1项即误差修正项vecmt-1是核心部分,它的系数反映了当系统偏离长期均衡时,HS300指数和IF1204期货价格所构成的短期调整速度和方向。
对于每5分钟的高频数据, vecmt-1对△s1,t的估计系数?姿1=-0.000 266<0,意味着误差修正项对HS300指数价格有负向调整作用,即对于HS300指数来说,当系统偏离均衡时,若为正误差,则vecmt-1>0;若为负误差,则vecmt-1<0。说明此时HS300指数相比IF1204期货价格偏高(或偏低),市场上套利活动会使HS300指数以0.026 6%的速度下跌(或上升)直到均衡;同理,vecmt-1对△f1,t的估计系数?姿2=0.048 443>0,意味着若此时IF1204期货价格相比于HS300指数偏低(或偏高),市场上的套利活动会使IF1204期货价格以4.844 3%的速度上涨(或下跌)。显然这两个系数都很小,说明股指的短期价格调整对长期均衡的影响较小,这主要是由于“套利成本”的存在,致使长期均衡的偏离较难在短期内得到纠正。但从调整速度的比较来看,|?姿1|?垌|?姿2|,误差调整项对IF1204期货价格的调整速度大约是它对HS300指数的调整速度的200倍,因而股指期货在价格发现过程中领先指数现货。此外,在△s1,t的方程估计中,△f1,t-1的系数     在5%的水平上显著,而在△f1,t的方程中,△s1,t-1的系数     在此水平上不显著,说明IF1204期货价格引领HS300指数。
对于每60分钟的数据,vecmt-1对△f2,t的估计系数为0.549 024,统计显著,而对△s2,t的估计系数为0.415 332,统计不显著,说明股指期货价格在价格发现过程中仍然保持着主导地位,只是两者的调整方向都为正向,且调整速度相近,说明股指期货在价格发现过程中的领先优势有所减弱。从日交易数据的VECM模型参数估计结果看,vecmt-1对△s3,t和△f3,t的估计系数均不显著,说明误差修正项的短期修正作用非常弱,在此样本中,HS300指数价格与IF1204期货价格的变动不存在明显的领先—滞后关系。
四、结论
本文选取了HS300指数和股指期货IF1204合约的收盘价作为研究对象,根据采样频率的不同,建立每5分钟交易数据、每60分钟交易数据和日交易数据共3个样本组。采用VAR模型、VECM模型和Johansen协整分析、Granger因果检验等方法分析不同采样频率下股指期货的价格发现能力。VAR模型表明,在高频样本中,股指期货在价格发现中起主导作用,股指期货市场对新信息的反应领先现货市场10分钟左右,但是随着采样频率下降,股指期货价格对HS300指数的引导作用减弱;Granger因果检验结果也发现,随着采样频率的降低,指数现货逐渐成为价格发现过程的主力;Johansen协整检验和VECM模型参数估计结果表明,HS300指数与IF1204股指期货价格在长期内存在稳定协整关系,在短期内,IF1204期货价格的调整速度比HS300指数的调整速度快,前者约为后者的200倍。
以上实证结果表明,股指期货在价格发现过程中占主导地位,但是随着采样时间跨度的拉大,指数现货的价格发现能力逐渐超越股指期货。因此,短线投资者或高频交易者可以利用股指期货对指数现货的价格发现能力进行套利,但是长线投资者在进行投资决策时应更多关注指数现货价格变动对期货价格变动的引导作用。
主要参考文献
1. Garbade Kenneth D., Silber William L..Price movements and price discovery in futures and cash markets. Journal of Finance,1995;4
      2. 方斌.新兴市场股指期货价格发现功能的研究.经济理论与经济管理,2007;6
      3. 华仁海.现货价格和期货价格之间的动态关系:基于上海期货交易所的经验研究.管理评论,2011;2
      4. 任燕燕,李学.股指期货与现货之间超前滞后关系研究 .统计与信息论坛,2008;9
      5. 肖辉,鲍建平,吴冲锋.股指与股指期货价格发现过程研究.系统工程,2009;10
      6. 严敏,巴曙松,吴博.我国股指期货市场的价格发现与波动溢出效应.系统工程,2009;10
      7. 刘向丽,张雨萌.基于向量误差修正模型的股指期货价格发现功能研究.管理评论,2011;2