总第 696 期
【作 者】
张 颖 辜秋琴(教授) 张成松
【作者单位】
(成都理工大学商学院 成都 610059)
【摘 要】
【摘要】本文以中国战略性新兴产业上市公司为研究对象,运用主成分分析(PCA)方法提取出对财务风险具有显著影响的特征指标,以此作为输入变量将粒子群算法(PSO)、遗传算法(GA)、网格搜索法(GS)分别与支持向量机(SVM)相结合构建财务风险预警模型,进而以样本集分类准确率和第一、二类错误率为标准对模型的可靠性进行对比研究。实证结果表明,PCA-PSO-SVM模型具有最为优越的学习能力与泛化推广能力,能够最为准确地预测财务风险,从而为我国监管机构和企业管理层提供可操作性的应用工具与方法。
【关键词】战略性新兴产业 财务风险 智能预警 支持向量机 粒子群算法
一、研究背景
近年来,随着金融危机的爆发,战略性新兴产业发展已逐渐成为世界各国政府关注的焦点。这是因为,战略性新兴产业不同于一般的新兴产业,其发展往往推动着国民经济的重大转变,是引导社会经济发展的中坚力量。就中国而言,尽管已跃升为世界第二大经济体,但与欧美等发达国家相比,在经济与科技发展水平上还存在较大的差距。因此,我国只有加快发展战略性新兴产业,才能抢占新一轮经济和科技发展的制高点。
要发展战略性新兴产业,必然要依托战略性新兴产业企业的发展。但对于企业而言,财务风险却严重威胁着企业的生存与发展(乔飞鸽,2006)。因此,建立科学合理的预警模型,对战略性新兴产业企业的财务风险进行预警研究,对于企业及时防范与化解财务风险、监管机构加强指导与监督具有十分重要的现实意义。
二、文献综述及本文的研究方法选择
早期的财务风险预警多以单变量模型、多元判别分析(Multiple Discriminant Analysis, MDA)模型、逻辑(Logit)回归模型、概率比(Probit)回归模型等传统的统计模型为主。这些财务风险预警模型尽管具有显著的可解释性,但却存在前提条件过于苛刻、指标选择主观性强、缺乏动态预警能力等诸多问题(周敏、王新宇,2002;黄继鸿等,2003)。
随着人工智能学科的发展,基于神经网络(Neural Networks,NN)、支持向量机(Support Vector Machine,SVM)等人工智能模型已被广泛运用于解决财务风险预警问题,并取得了令人满意的效果(Tseng & Hu,2010;杨淑娥、黄礼,2005)。NN虽然具有自适应性强、容错性能良好等优点,但是其存在着可调整参数过多、建模复杂,且易陷入局部最优等不足(杨毓、蒙肖莲,2006)。而SVM恰好能够有效地解决NN存在的上述问题,从而成为目前人工智能领域研究的一个新热点(宋新平、丁永生,2008)。基于此,本文引入SVM对我国战略性新兴产业企业的财务风险预警进行研究。
需要指出的是,我国战略性新兴产业企业的财务数据往往呈现高相关性特征,从而容易引发数据冗余问题,最终导致SVM财务风险预警模型的预测精确度大大降低(胡达沙、王坤华,2007)。而周子英等(2011)研究发现,PCA方法能够有效地解决财务数据之间因具有高相关特征而产生的数据冗余问题。基于此,本文在构建战略性新兴产业企业的SVM财务风险预警模型之前,将引入PCA方法消除数据之间的高相关性特征,以提升模型的预测能力。
此外,SVM财务风险预警模型的预测能力在很大程度上还取决于惩罚参数(Penalty Parameter)和核函数(Kernel Function)参数,如果不恰当地选择这两类参数,就很可能会导致SVM模型过拟合或欠拟合。然而目前,SVM参数选择还没有统一的理论方法,凭借先验知识和人为经验选取具有一定的随意性,就很可能导致无法准确地寻找到最优参数而降低模型的预测能力(姜明辉、袁绪川, 2008)。而粒子群算法(Particle Swarm Optimization,PSO)具有全局搜索能力强大、收敛速度快、算法简单、可调整参数少、容易实现等特点,能够有效地解决参数问题(王润芳等,2011)。基于此,本文运用PSO来寻找SVM财务风险预警模型的最优惩罚参数值和核函数参数值,以提升SVM模型的预测能力。
综上所述,本文以我国战略性新兴产业企业为研究对象,运用PCA方法提取对财务风险具有显著影响的特征指标,以此作为输入变量。将PSO与SVM相结合构建财务风险预警模型,还分别将GA、GS与SVM相结合构建财务风险预警对比模型,进而以样本集分类准确率和第一、二类错误率(分别指将财务风险较高的公司误判为财务状况正常的公司,以及将财务状况正常的公司误判为财务风险较高的公司)为标准,对模型的可靠性进行对比研究,力求更为全面地展现PCA-PSO-SVM财务风险预警模型的良好预测性能。
迄今为止,国内已有相当部分学者对上市公司财务风险预警进行了研究。辛秀和熊晓轶(2011)引入PCA方法提取对财务风险具有显著影响的特征指标,进而运用SVM方法构建财务风险预警模型,并与MDA、Logit、Probit三种传统的统计模型进行了比较。李云飞等(2010)在选取出财务风险特征指标的基础上,引入GA方法挖掘SVM最优参数,进而运用该参数下的SVM方法构建财务风险预警模型。胡达沙和王坤华(2007)运用PSO-SVM方法构建了财务风险预警模型。
虽然他们的研究都取得了令人满意的预测效果,但与本文相比,却存在明显的差异性:①均未将PCA方法、参数寻优方法与SVM方法共同结合起来构建财务风险预警模型。②鲜有运用多种参数寻优方法来优化SVM财务风险预警模型。③更很少有基于样本集分类准确率和第一、二类错误率两个视角共同对预警模型的性能进行比较研究的文献。④就我们所掌握的文献而言,尚未发现有以我国战略性新兴产业企业为研究对象进行预警研究的文献。
以上四点差异性即为本文的研究特色,本文旨在运用多种方法优化战略性新兴产业上市公司的SVM财务预警模型,并通过实证分析测试了模型的一些性能参数。
三、战略性新兴产业企业财务风险预警模型的构建
(一)战略性新兴产业企业财务风险预警的SVM方法
1. 运用SVM构建战略性新兴产业企业财务风险预警模型。对一家企业而言,在第t时刻可能出现两种情况:发生财务风险与未发生财务风险。本文将公司发生财务风险定义为正类,将公司未发生财务风险定义为负类。样本数据集是由若干个样本点所构成。而每一个样本点又分别由一个d维特征指标向量“x=([x1,x2,…,xd])”以及状态指标变量“[y∈]{+1,-1}”构成。于是,n家战略性新兴产业企业在第t时刻的特征指标向量与状态指标变量就构成一个样本集([yt,i,xt,iv])。其中,i=1,2,…,n。
由于本文研究的是企业财务风险预警方法,为了达到预测的目的,需要将样本集中样本点的特征指标向量表示为([xt-a,iv]),a是大于0的整数,即用t-a时刻的财务指标预测t时刻是否会发生财务风险。至此,就构建出样本集([yt,i,xt-a,iv])。
在此基础上,划分样本集中的一部分数据([yt,j,xt-a,jv])作为训练集,j=1,2,…,k;另一部分数据([yt,m,xt-a,mv])作为测试集。对于训练集,能够通过SVM方法挖掘出一个最优分类函数,即财务风险预警模型:
[yt=sgn(f(x))] (1)
其中,[sgn(x)]是符号函数,[f(x)]是一个与训练样本集中样本点的特征指标向量有关的决策函数。进一步,对于运用SVM方法在训练集[(yt,j,xt-a,jv)]上寻找最优分类函数而言,通常是在 的条件下,将寻找最优分类函数转化为求解以下最优问题:
[min 12w2+Cj=1kξj] (2)
其中,w是可调权值向量,b是偏置向量。[ξj]是非负的松弛变量(Slack Variable),其作用是适当地“软化”约束条件,允许样本误判的存在。C是惩罚参数,目的是使得分类间隔[2w]尽可能大而错划程度[i=1nξi]尽可能小。
利用拉格朗日乘子(Lagrange Multiplier)法将上述最优问题转化为对偶(Dual)问题:
[maxα-12j=1kp=1kyt,jyt,pαjαpexp(-γxt-a,j-xt-a,p 2)+p=1kαp] (3)
[s.t. j=1kyt,jαj=0] (4)
[0≤αj≤C,j=1,2,…,k] (5)
其中,[α]为拉格朗日乘子,[(xt-a,p,yt,p)]为[α]的一个正分量[αp]所对应的样本点, 是引入的径向基核函数(Radical Basis Function,RBF),[γ]是径向基核函数的参数。由于径向基核函数是实际应用中最为常用的一种核函数(韩立岩等,2011),因此,本文选用它作为SVM的核函数。
通过求解上述对偶问题,就得到以下最优分类函数:[ g(x)=sgn(w*·gx+b* ) =sgnj=1kα*jyt,jexp(-γxt-a,j-xt-a 2 )+b*] (6)
其中,sgn()为符号函数,[w*]为权向量,[b*]为分类阈值(Threshold),且:
[b*=yt,p-j=1kyt,jα*jexp(-γxt-a,j-xt-a,p2)] (7)
通过上述分析,本文就清晰地呈现出运用SVM方法寻找最优分类函数的具体过程,至此也就构建出中国战略性新兴产业企业的财务风险预警模型。
2. 预警模型的性能测试与评价方法。基于RBF核函数的SVM而言,存在C和[γ]两个可调整参数,运用不同参数值下的SVM将会产生不同的预警模型。究竟模型的性能是否可靠,哪个模型最为优越,还需要进行性能测试与评价。Veropoulos等(1999)提出通过分类准确率和第一、二类错误率对SVM分类器的性能进行测试与评价。
正类样本用P表示,负类样本用N表示,则用FP表示负类样本错分成正类的个数,用FN表示正类样本错分成负类的个数,以及用TP和TN分别表示正类样本和负类样本被正确分类的个数。于是可以得到:SVM分类器的分类准确率α=(TP+TN)/(TP+TN+FP+FN);第一类错误率α1=FN/(FN+TP);第二类错误率α2=FP/(EP+TN)。
若SVM分类器的分类准确率越高以及第一、二类错误率越低,则表明该SVM分类器的预测能力愈加优越。基于此,本文就能够运用上述方法对SVM预警模型的性能进行测试与评价。
(二)SVM财务风险预警模型的PSO参数寻优方法
从式(2)和式(3)不难发现,构建SVM财务风险预警模型的关键在于确定惩罚参数C值和RBF核函数参数[γ]值。由于PSO具有全局搜索能力强、收敛速度快、算法简单、可调整参数少、容易实现等特点(王润芳等,2011),因此,本文选用PSO来挖掘最优参数C和[γ]。
运用PSO挖掘最优参数C和[γ],首先需要随机初始化一群C粒子与[γ]粒子,每个粒子都具有位置x与速度v两类属性。其中,位置x代表着C粒子与[γ]粒子的值,速度v决定着C粒子与[γ]粒子在搜索空间中进行迭代的位移。
在此基础上,选用交叉验证(Cross Validation,CV)准确率作为适应度值,它是决定粒子优劣程度的关键。交叉验证准确率越高的粒子,其适应度值越大,也就越有可能成为最优参数。
为了搜寻到最优参数,C粒子与[γ]粒子需要根据个体最优值[Pbest]和群体最优值[gbest]来进行迭代更新,公式如下:
(8)
(9)
其中,i=1,2,…,k;j=1,2,…,d;t表示当前的迭代次数;[xij]表示在j维空间中C粒子与[γ]粒子中的第[i]个个体的位置,[vij]表示在j维空间中C粒子与[γ]粒子中的第[i]个个体的飞行速度,为防止C粒子与[γ]粒子在更新过程中超出搜索空间的范围而进行盲目的搜索,通常将C粒子与[γ]粒子的位置与速度分别限定在某个区间[[-xmax,xmax]]、[[-vmax,vmax]]内;[c1]和[c2]为加速度因子,前者调节着在j维空间中C粒子与[γ]粒子中的第i个个体飞向个体最优值的速度,后者调节着该个体飞向全局最优值的速度;[γ1]和[γ2]是均匀分布于[[0,1]]之间的随机数;[pij]表示个体最优值,[gij]表示全局最优值;w是惯性权重值,对于平衡PSO的全局搜索能力与局部搜索能力起着不可或缺的作用。因此,本文引入陈贵敏等(2006)提出的w动态更新公式,其数学模型如下:
(10)
其中,[wk]为所求的惯性权重值,[wstart]为初始惯性权重值,通常设为0.95,[wend]为当迭代次数达到最大时的惯性权重值,通常设为0.4,k为当前的迭代次数,[Tmax]为最大迭代次数,c为调节参数,通常设为10。
于是,C粒子与[γ]粒子就通过式(8)和式(9)进行不断迭代更新,一旦迭代次数达到给定的最大迭代次数或者适应度值达到预设值要求时,迭代就会结束,此时,C粒子与[γ]粒子的位置x就是通过PSO捕获的最优参数C和[γ]的值。否则,继续通过式(8)和式(9)的更新公式进行迭代,直到满足终止条件为止。
于是,SVM就能基于PSO寻找到的最优参数构建财务风险预警模型,然后运用Veropoulos等(1999)提出的SVM分类器性能测试与评价方法对其进行性能测试与评价。
四、实证结果与分析
(一)样本选择与原始数据处理
本文以国务院发布的《战略性新兴产业分类(2012)》(试行)为依据,从中国A股上市公司中选取790家战略性新兴产业上市公司,以其2013年的净利润作为上市公司是否发生财务风险的评判标准:如果上市公司净利润为负,则表明上市公司发生财务风险;否则,公司财务就处于正常状况。
通过数据整理发现,790家战略性新兴产业上市公司中,524家属于财务正常类上市公司,其中367家被划入训练集合,剩余157家被划入测试集合,并用“-1”表示它们所属财务正常类。另外266家属于财务风险类上市公司,其中186家被划入训练集合,剩余80家被划入测试集合,并用“+1”表示它们所属财务风险类。
在此基础上,本文通过借鉴以往研究文献并参考公司业绩评价指标体系,从以上790家战略性新兴产业上市公司2012年12月末的财务报表数据中选取能够综合反映公司的短期偿债能力、长期偿债能力、营运能力、盈利能力和增长能力5方面的共20项财务比率指标作为样本指标(见表1)。
本文主要使用Matlab 2013a软件分析数据。本文首先对各项财务比率指标数据进行归一化处理,得到新的财务比率指标数据[x*i],i=1,2,…,20。并运用PCA方法提取8个主成分因子,其累积贡献率达到79.696%,说明提取的这8个主成分因子能够比较全面地反映中国战略性新兴产业上市公司的财务状况。
(二)战略性新兴产业上市公司财务风险预警模型的性能评价
将上述8个主成分因子作为输入指标,运用PSO-SVM方法建立战略性新兴产业上市公司财务风险预警模型。SVM的核函数设为径向基核函数。另外,为了更加全面而科学地评估PCA-PSO-SVM模型,本文采用5折交叉验证法(Breiman & Zhang,1993)检验模型判别效果。
此外,为了更加全面地比较和验证PCA-PSO-SVM的优越性,本文还引入GA和GS与其进行比较。为了增加各模型之间的可比性,增强实证研究结果的可靠性,本文选择将C和[γ]的范围都设为[[2-14],[214]],也将PSO与GA的样本个数都设为40,最大迭代次数都设为300。由此,本文通过计算得到各模型下的最优惩罚参数C和核函数参数[γ]值以及在这两类最优参数下训练集与测试集的分类准确率结果(见表2)。
表 2 模型最优参数值和分类准确率
由表2可知,不论是在训练集还是在测试集上,PCA-GS-SVM模型的预测准确率都最低,分别只有77.5%与70%,说明该模型存在学习能力与泛化推广能力都不理想的欠学习问题。虽然PCA-GA-SVM模型的学习能力良好,达到80%,但是,它在测试集上的分类准确率只有77.5%,证明该模型存在泛化推广能力较弱的过学习问题。与以上两类模型相比,PCA-PSO-SVM模型在训练集上的预测准确率不仅最高,达到85%,说明该模型的学习能力最优,更为可贵的是,该模型在测试集上的预测准确率也最高,并且仍然保持在85%,从而展示出该模型具有最为优越的泛化推广能力。
进一步,在财务风险预警中,将财务风险类上市公司误判为财务正常类上市公司造成的负面影响通常要远远大于将财务正常类上市公司误判为财务风险类上市公司造成的负面影响(Altman,1977)。显然,在将前者定义为第一类错误而后者定义为第二类错误的基础上,如果模型的第一、二类错误率低,特别是第一类错误率低,也能够证明该模型具有优越的性能。因此,为了更加全面而充分地证明PCA-PSO-SVM模型具有优越的性能,本文还基于第一、二类错误率,尤其是第一类错误率的视角,对上述三类模型的学习能力与泛化推广能力进行比较与评价(见表3)。
表 3 训练集与测试集下模型的第一、二类错误率
从表3可以看出,PCA-GS-SVM模型无论是在训练集还是测试集上第一类错误率都最高。而PCA-GA-SVM虽然在测试集上的第二类错误率最低,但是在训练集与测试集上的第一类错误率分别高达72.7%与75%。就PCA-PSO-SVM模型而言,虽然在测试集上第二类错误率高于PCA-GA-SVM模型,但仅仅只有3.6%,而在训练集与测试集上的第一类错误率却都是最低的,并且测试集的第一类错误率较训练集的第一类错误率而言,还有所降低,即从54.5%下降到41.67%。这也恰好再一次充分印证了PCA-PSO-SVM模型具有最为优越的学习能力与泛化推广能力这一事实。
然而,仅仅通过第一类错误率的大小来评价模型的预测性能,还缺少类似于统计学检验所具有的科学性、全面性与客观性。因此,本文还将进行显著性水平为5%的Mcnemar检验(Li,2008),由此检验PCA-PSO-SVM模型与PCA-GA-SVM和PCA-GS-SVM模型在第一类率错误率上的差异是否显著,结果见表4。
表 4 第一类错误率差异显著性的McNemar检验结果
从表4可以看出,在5%的显著性水平下,PCA-PSO-SVM模型的第一类错误率明显低于PCA-GA-SVM和PCA-GS-SVM模型。这又进一步证明了本文构建的PCA-PSO-SVM模型具有显著的优越性。
需要进一步说明的是,PCA-PSO-SVM模型的性能明显优于PCA-GA-SVM和PCA-GS-SVM模型的性能。这一差异究竟是如何产生的,原因分析如下:
(1)PCA-PSO-SVM模型的性能明显优于PCA-GS-SVM模型的性能,可能是因为PSO比GS具有更加精确的参数寻优精度以及更加快捷的参数寻优速度(Cheng,2009)。因此,在搜索范围相同的前提条件下,PSO的寻优性能强于GS,从而促使PCA-PSO-SVM模型的性能也优于PCA-GS-SVM模型的性能。
(2)PCA-PSO-SVM模型性能明显优于PCA-GA-SVM模型,其原因通过展示能够刻画PSO与GA适应度和收敛性能的最佳适应度变化曲线来诠释(见图1和图2)。
从图1和图2可以看出,在适应度方面,PSO的最佳适应度变化曲线在完成最终收敛时的最佳适应度值高达82.5%,而GA却只达到75%。就本文而言,最佳适应度值是通过CV准确率计算出来的,适应度值越大,表明算法的参数寻优性能越强。由此可见,最佳适应度的差异是促使PSO的参数寻优性能优于GA的原因之一。而在收敛性能方面,GA的最佳适应度变化曲线大约在第50代附近最终收敛,此时的最佳适应度为75%,然而早在大约第10代附近,PSO就已经完成适应度为75%的收敛工作,这也成为PCA-PSO-SVM模型的性能优于PCA-GS-SVM模型性能的另一个原因。
综上所述,PCA-GS-SVM模型存在学习能力与泛化推广能力都不理想的欠学习问题。PCA-GA-SVM模型尽管学习能力良好,却存在泛化推广能力较弱的过学习问题。与它们相比,PCA-PSO-SVM模型具有最为优越的学习能力与泛化推广能力。
五、结论
本文以中国战略性新兴产业上市公司为研究对象,运用PCA方法提取对财务风险具有显著影响的特征指标,以此作为输入变量将PSO、GA、GS分别与SVM相结合构建财务风险预警模型,进而以样本集分类准确率和第一、二类错误率为标准对模型的可靠性进行对比研究。实证结果表明,PCA-GS-SVM模型存在学习能力和泛化推广能力都不理想的欠学习问题;PCA-GA-SVM模型尽管学习能力良好,却存在泛化推广能力较弱的过学习问题;而PCA-PSO-SVM模型具有最为优越的学习能力与泛化推广能力。
基于以上实证研究结果,本文认为:PCA-PSO-SVM财务风险预警模型能够有效地预测中国战略性新兴产业上市公司是否会发生财务风险,从而能够为我国监管机构和战略性新兴产业上市公司管理层提供宝贵的决策支持,具有重要的实际应用价值。
【注】本文系四川省科技厅软科学研究计划项目“战略性新兴产业发展科技支撑研究”(编号:2012ZR0159)、四川省科技厅软科学研究计划项目“自主创新支撑四川省战略性新兴产业发展路径研究”(编号:2012ZR0046)的研究成果。
主要参考文献
1. 乔飞鸽.加强对我国海外上市公司的监管.证券之窗,2006;11
2. 周敏,王新宇.基于模糊优选和神经网络的企业财务危机预警.管理科学学报,2002;3
3. 杨淑娥,黄礼.基于BP神经网络的上市公司财务预警模型.系统工程理论与实践,2005;1
4. 杨毓,蒙肖莲.用支持向量机(SVM)构建企业破产预测模型.金融研究,2006;10
5. 宋新平,丁永生.基于最优支持微量机模型的经营失败预警研究.管理科学,2008;1
6. 李云飞,鄢飞,张谦.基于GA-SVM的上市公司财务危机预警研究.西安工程大学学报,2010;6.
7. 韩立岩,宋晓东,姚伟龙.基于改进支持向量机的上市公司财务困境判别研究.管理评论,2011;5
8. 陈贵敏,贾建援,韩琪.粒子群优化算法的惯性权值递减策略研究.西安交通大学学报,2006;1