【作 者】
王 谦1,刘 春1(副教授),管河山1(副教授),罗智超2(高级工程师)
【作者单位】
(1.南华大学经济管理学院,湖南衡阳 421001;2.厦门大学王亚南经济研究院,厦门 361005)
【摘 要】
【摘要】本文采集了我国A股市场所有上市公司的价格数据和收益率数据,分别采用R/S、MR/S和V/S检验方法进行实证研究,发现:①数据平稳性特征会对长记忆性检验结果造成直接影响,而股票价格和收益率数据不都是平稳的,因此,应该事先对数据进行平稳性检验;②不同股票样本、不同检验方法得到的检验结果有较大差异,根据市场指数或部分股票样本探究股市长记忆性有一定的片面性;③同一时间段,数据采样间隔(日、周)会影响到数据总量,进而造成长记忆性检验结果的差异。对A股市场的股票总体分析表明,无法给出市场长记忆特征的最终结论。因此,相对股市整体而言,探究个股长记忆性特征更具有研究价值。
【关键词】A股市场;长记忆性;检验方法
一、引言
英国水利学家Hurst(1951)对水文数据特征的分析开启了时间序列记忆性特点研究的大门。随后,时间序列长记忆性特征分析被广泛地运用到金融领域,这为准确掌握金融市场的运行规律,建立符合其特征的精确预测模型提供了现实可能性。长记忆性作为金融市场价格波动的重要研究内容之一,它侧重探究价格序列本身在较远时间间隔的情况下是否仍具有持续依赖关系。而时间序列长记忆性特征的存在,使得利用时间序列本身的历史信息来预测其未来变化趋势成为可能,它作为建立预测模型的关键因素之一,对金融资产价格记忆性及其本质特征的研究不仅可以为上层政策制定和宏观调控提供决策依据,还能为组织和个人投资者提供一定现实参考。
近年来,关于我国金融市场长记忆性特征的研究颇多。比如,何兴强 (2006)和顾荣宝(2008)对我国沪深股市进行V/S检验,认为我国股票市场呈现反持续性特征而不是长记忆性特征;许友传(2010)发现R/S检验更倾向于接受长记忆性,并得出需谨慎解释采用R/S检验方法和修正的R/S检验方法所得出实证结果的结论;李志生(2011)采用序列相关检验和R/S检验法分析得出我国股票市场有显著的长记忆性并在近年来逐步增强的趋势;苑莹(2012)运用R/S法、MR/S 法、KPSS检验及Granger因果检验方法发现我国股市收益率和成交量均具长记忆性特征;肖炜麟(2013)研究了长记忆建模影响问题,发现不同模型的定价结果证明了金融资产具有长期记忆性。庞淑娟(2011)、陈浪南(2013)等对我国股市高频数据的长记忆性特征进行了研讨。楼晓东(2013)提出V/S方法在识别长记忆性时最贴近实际,并通过计算出Hurst指数证实了国际黄金现货(周线/月线)存在着显著的长记忆性,表明黄金市场不是弱势有效的。
上述研究虽然拓展了长记忆性的研究,然而,学者们在对我国股市长记忆性的研究过程中,其实证分析中都采用抽样样本进行分析,研究结论具有不一致性。部分学者认为金融股市不具有长记忆性;部分学者认为金融股市具有长记忆性;部分学者针对不同地区的金融股市进行分析,认为发达地区股市一般不具有长记忆性,而发展中国家股市具有长记忆性。可见,在不同股市环境、不同数据采集时段、不同检验方法对检验结果有一定的影响,学者们对金融市场的长记忆性判定各执一词,其研究结论的可靠性仍需要深入探讨。为此,本文采用长记忆性检验中常用的三种方法(重标极差检验法、修正的重标极差检验法和重标方差法),并采集我国A股市场所有上市公司的数据进行分析,全面探究A股市场的长记忆性特征。
二、长记忆性定义及检验方法
(一)长记忆性定义
长记忆性(long-term memory) 又称长程相关性或持久性,它描述了时间序列在较远间隔处的持续依赖关系,表明时间序列具有非周期的循环特征,如果其动态相依结构表现出某种长记忆特征或长时相依关系,则时间序列的历史信息将有助于预测其未来变化趋势。国内外对长记忆的定义有很多种,本文选取两种较常见的定义方式,如下所示:
第一种是根据自相关函数的定义,当平稳过程Xt(t=1,2,……,T)的自相关函数α(k)满足:
α(k)→Cαk2d-1 (1)
其中,k→∞,Cα>0,d<1/2则认为平稳时间序列{Xt}具有长记忆性或长相依性。
第二种是谱密度函数定义,如果存在一个实数d和一个有界常数C,使得对于一个平稳序列{Xt},它的谱密度f{ρj}满足:
其中:d∈(0,0.5);ρj=2π×j/N,j=1,2,……,m;N为样本总数;m为带宽,m=g(T)≤T,则认为时间序列{Xt}具有长记忆性或长相依性。
值得注意的是:进行长记忆性分析的前提条件是时间序列数据满足平稳性的假设,然而现实中的股票价格和收益率等金融时间序列数据有很多是非平稳的,因此,在进行长记忆性分析之前探讨数据的平稳性特征就显得十分必要。平稳性假设主要是为了保证在实证分析中可以随意运用在此假设下各种成熟的检验方法。Mikosch等(2004)、李锐(2007)发现,如果平稳性假设得不到满足可能会导致错误的检验结果,这使得讨论长记忆性检验方法在非平稳框架下的稳健性成为必要,可见,数据的平稳性特征是检验其是否满足长记忆性特征的重要前提条件。
(二)长记忆性检验方法
1. 重标极差检验法(R/S)。对时间序列长记忆性的理论研究最早始于20世纪50年代。Hurst(1951)在对水文数据的研究中发现了时间序列具有记忆性的属性,由此提出了重标极差分析的检验方法,并给出了相应的判别式。给定一个时间序列{Xt},t=1,2,……,T,将原始时间序列等分成A段,即T=A×n,n为子序列长度。再求解回归方程的斜率线H作为R/S的检验量,如下所示:
ln(E(Qn))≈lnC+H×ln(n) (3)
Qn=Rn/Sn
根据R/S方法求得的H值,并进行长记忆性判定,判定原则如下:
(1)当0≤H<0.5时,时间序列呈现出反持久的分形布朗运动的特点。
(2)当H =0.5时,标准随机游走序列,不同的时刻点值无关。
(3)当0.5<H<1时,具有长记忆性的时间序列。
(4)当H =1时,时间序列为一条直线,未来完全可以预测。
(5)其他,长记忆性判定失效。
理论上来说,R/S方法在分析存在短期记忆性或具有异方差的时间序列时,会更多地倾向于拒绝“不存在长记忆性”的原假设,而这与本方法统计量构造的数学原理有密切关系,因此R/S方法在进行长记忆性检验时很容易出现偏倚或错估。还有可能的情况是在对R/S统计值进行回归求解时,H值可能出现负值,H值不偏不倚等于0.5的情况很难出现,因此对H值的判断标准可能并不能涵盖所有情况。
2. 修正的重标极差检验法(MR/S)。W. Lo(1991)在其论文《股票价格市场的长记忆性》一文中描述到当序列包含短记忆性、存在异质性、具有非平稳性时,R/S分析的结果就会大打折扣,因此W. Lo也提出了相应的修正方法,即修正的 R/S (MR/S ),以此来弥补原有方法判断时间序列长记忆性上的缺陷。具体修正如下:
Qn=Rn/θn(q) (4)
其中:Rn、 和xn的定义与R/S中的相似;γj为样本的自协方差。
由上式可以看出:MR/S法与R/S法虽在分母的计算上有明显的区别,但通过引入调整项θn(q)可以在一定程度上修正R/S过度拒绝时间序列存在长记忆性的原假设,使得结果的输出更为无偏有效。但式中q值的确定难以统一,q值太小时不利于消除序列短期记忆对检验结果的影响,而q值太大又会影响该方法的检验效率和性能,尽管W. Lo在1991年的论文中又提出了q值的经验计算公式。但不难发现,经验值q并不是十分可靠的,当子序列长度n值较小时,可能出现q>n的情况,造成检验结果的失效。本文计算q值,借鉴许友传(2010)的方法,得到如下计算公式:
q=4×([T100])[29] (5)
3. 重标方差法(V/S)。由于前文中提到的MR/S法在q值的确定上经验值存在缺陷,而在学术界对于q值的界定和选取又缺乏统一公认的标准,Giraitis等人(2003)提出了一种明显异于前两者的新的检验时间序列长记忆性的方法——重标方差法。V/S法的基本思想是:将总长度为M的时间序列{Xi}划分为A个长度为N的等长子区间,记作Da,a=1,2,……,A。子序列Da对应的元素为xi,a,i=1,2,……,n,子序列均值为xa,子序列标准差为Sn。V/S法的判别式如下:
(6) 其中:
xa= [1ni=1kxi,a]为子序列均值
对于不同区间划分N有不同的子序列的V/S值,而V/S统计量满足于(V/S)n=k×n2H的函数关系,可通过对log(n) ~ log(V/S)n进行最小二乘估计来求得直线的斜率,而V/S法的H值即为回归斜率的一半。一般认为最新的V/S法在构造机理上的优势有效地避免了R/S分析的不足,使得该方法在判断时间序列长记忆性上更为稳健,其检验结果也更为有效可靠。但不难发现,V/S法统计量计算复杂度为o(n2) ,高复杂度使得其计算速度和效果不尽如人意,尤其在金融高频数据处理过程中,这种不足会愈加明显和突出,甚至导致实验中断,软件系统在有限的内存下运算容易陷入瘫痪。
三、现有研究的评述
1. R/S、MR/S和V/S方法是长记忆性研究中常用的三种方法,从理论上分析而言:R/S方法通常倾向于拒绝“不存在长记忆性”的原假设,这与R/S检验统计量的构造原理有关;MR/S方法通过对R/S检验统计量分母的“长期方差”引入,从而降低了其对短记忆和异方差的敏感度,提高了模型的适应性,但MR/S检验结果依赖于模型的滞后阶数选择;V/S方法对时间序列短期相关性的敏感度却没有明显的优势,且计算复杂度高。因此,以上检验方法各有利弊,综合采用多种检验方法来进行综合判定,避免采用某种单一的方法进行武断判定,这已经成为众多学者的共识。
2. 现有文献的实证研究大多采用了特定金融市场的综合指数或某些典型上市公司的数据来进行分析,缺乏对A股市场所有上市公司的全面分析,因此,典型样本分析的结论是否能如实反映市场总体的特征仍值得探究。
3. 长记忆性检验过程中,对数据平稳性检验的重视程度不够,甚至部分学者在实证过程中未曾对数据的平稳性进行分析,这会直接影响到长记忆性检验结果的合理性。
4. 部分学者研究发现,数据采样的具体时间段对长记忆性检验结果影响较大,但是,对同一采样时段而言,不同的数据采样间隔(日数据、周数据等)是否对长记忆性特征形成影响,仍需进一步探究。
5. 尽管大部分学者都认为单一检验方法的结果存在片面性,然而它们对股市长记忆性判断的结果,其差异到底有多大,是否会对检验结果形成本质性的差异,仍值得深究。
四、我国A股市场的长记忆性特征实证分析
(一)数据说明
采集我国A股市场所有上市公司(含市场指数,共2 597个数据样本)的收盘价和收益率(考虑现金红利再投资的日个股回报率),采样时段分别为1991年1月1日 ~ 2014年4月30日(全时段)、2006年1月1日 ~ 2008年12月28日(牛市)和2009.1.1-2011.12.31(熊市),数据来源于CSMAR数据库,借助SAS软件处理数据,分别采用R/S、 MR/S和V/S方法进行分析。实证时,子序列长度n的取值范围定为[10,int (T/2)],T为原始时间序列的时间长度;当采用MR/S法进行分析,需要计算参数q的取值,为此我们对子序列长度n的最小取值进行了调整,调整为[n0,int(T/2)],n0=max{10,q}。
(二)平稳性检验分析
根据长记忆性的定义,需要假定数据本身具有平稳性。采用ADF方法检验其平稳性,结果如表1所示:
由表1可知,对价格数据而言,大部分数据都是非平稳的,而对收益率数据而言,大部分数据都是平稳的。根据收益率的计算原理可知,收益率数据近似于价格数据的对数差分,而差分是消减非平稳性特征的重要途径,因此,收益率数据的平稳性样本更多。
(三)长记忆性分析
根据表1的分析结果,进一步提取平稳数据分析。对三种采样时段(全时段数据、牛市和熊市)而言,只要公司上市时间较早,则其样本的数据长度都超过三位数字;分别采用R/S、MR/S和V/S法展开实证,分析结果见表2:
需注意表2中的数据:(1)V/S法的计算复杂度较高,日采集方式的数据量太大,因此未采用V/S法分析;(2)部分个股的上市时间较短,数据总量不够,出现判定失误的情况,将其并为“判定失败”一栏。
由表2分析可知:
1. 对价格和收益率两种数据类型进行分析,价格数据中反持久特征的样本比例明显偏低,而收益率数据中反持久特征的样本比例明显偏高;收益率数据可以近似看作价格数据的对数差分,其随机波动性更强,造成了收益率数据呈现出更为明显的反持久分形布朗运动的特点。
2. 对全时段的日数据和周数据两种数据采集方式进行分析,三种方法的判定结果差异比较明显,这意味着,对同一采样时段而言,不同的数据采集方式,得到的数据长度不同(样本量差异),这将对长记忆性检验结果的产生显著影响;因此,考虑某个时段上市公司的长记忆性特征,应根据实际问题采取相应的数据采集方式。
3. 对长记忆性判定进行分析,R/S、MR/S和V/S法得到结果差异较大:R/S法的结果更倾向于接受长记忆性,特别是对收益率数据而言,这一特点更为明显;相对R/S 方法而言,MR/S法检验得到的结果中,更多个股倾向于反持久的分形布朗运动的特点,特别是对收益率数据而言,呈现出明显的反持久的分形布朗运动的特点;V/S法判定失误的概率明显较大,判定结果中一半接受长记忆性,另一半则倾向于反持久的分形布朗运动的特点。综合以上分析,三种方法的检验结果有显著的差异,其结果需要进一步确定。
4. 对两种市场行情(全时段、牛市、熊市)进行分析,排除检验失效的样本,R/S和V/S法对不同市场行情趋势下(牛市和熊市)的长记忆性检验结果的差异较小;MR/S方法对牛市和熊市的两种市场行情趋势的长记忆性检验结果的差异非常明显,该方法在日价格中,样本都表现出较强的长记忆性,然而在日收益率数据下,该方法却更明显地倾向于接受反持久性特征,这与第三个结论是一致的。
五、结论
本文借助R/S、MR/S和V/S三种判定方法展开综合分析,并采集我国A股市场中所有个股的历史数据进行实证,综合以上研究结果发现:
1. 对A股市场的个股而言,不管其价格数据,还是收益率数据,都不可能全部是平稳的,因此,对我国A股市场长记忆性的研究,应该首先对数据的平稳性进行分析。不可否认,平稳性分析是长记忆性检验的必要预处理过程。
2. 不同的检验方法(R/S、MR/S和V/S)、不同个股得到的长记性判定结果有明显的差异,因此,很难给出我国A股市场是否长记忆性特征的综合结论。已有研究中,仅采用A股市场综合指数或部分典型样本分析并得出股市长记忆性判定的结论,其观点存在一定的片面性。
3. 不同时段(全时段、牛市、熊市)的数据,其长记忆性存在明显差异;然而,对于同一时间段,数据采样间隔(日数据、周数据)的不同也会导致长记忆检验结果的差异显著,这正是本文的研究结论之一。
股市长记忆分析结果受到数据平稳性特征、数据采样间隔、长记忆检验方法及样本选取的影响。本文通过对A股市场的股票总体分析(而非抽样样本),实证结果无法给出市场长记忆特征的最终结论;因此,相对股市整体而言,探究个股长记忆性特征更具有研究价值。
主要参考文献
Hurst H. E.. Long-term storage capacity of reservoirs[J]. Trans. Amer. Soc. Civil Eng,1951(16).
何兴强,李仲飞.上证股市收益的长期记忆:基于V/S的经验分析[J].系统工程理论与实践,2006(12).
顾荣宝,陈霁霞.基于分形 V/S 技术的沪深股市长记忆性研究[J].安徽大学学报(自然科学版),2008(3).
许友传.金融时间序列R/S长记忆性检验的有效性[J].中国管理科学,2010(8).
李志生,刘正捷.资产收益的短记忆性与长记忆性:我国股票市场效率的动态分析[J].江西财经大学学报,2011(1).
宛莹,杜乐鹿,庄新田.股市收益率与交易量长记忆性实证研究[J].东北大学学报,2012(7).
肖炜麟,张卫国,徐维东.双分式布朗运动下股本权证的定价[J].系统工程学报,2013(3).
庞淑娟,刘向丽,汪寿阳.中国期货市场高频波动率的长记忆性[J].系统工程理论与实践,2011(6).
陈浪南,杨科.中国股市高频波动率的特征、预测模型以及预测精度的比较[J].系统工程理论与实践,2013(2).
楼晓东,张良.基于分形理论的国际金价波动长记忆性识别及预测研究[J].上海金融,2013(6).
Daniel O. Cajueiro, Benjamin M. Tabak. The rescaled variance statistic and the determination of the Hurst exponent[J]. Mathematics and Computers in Simulation, 2005(70).
刘春,王谦,管河山.系统协调度模型的稳健性研究[J].南华大学学报(社会科学版),2014(5).
刘湘云,卞悦.我国农产品期货的长记忆研究:基于GPH与修正R/S实证检验[J].南京财经大学学报,2011(3).
【基金项目】教育部人文社科青年项目“海量金融时间序列数据平稳性检验方法研究”(编号:13YJCZH044);湖南省科研创新立项课题“大数据时代金融时间序列长记忆性检验方法研究”(编号:CX2014B397)