【作 者】
张 虎1,黄 迅2,范莉莉1(博士生导师)
【作者单位】
(1.西南交通大学经济管理学院,成都 610031;2.成都理工大学商学院,成都 610059)【摘要】 本文运用数据包络分析(DEA)方法对中国商业银行的竞争力水平进行测度,以此作为状态指标变量,并基于非均衡商业银行样本视角,将计算机科学的ADASYN和BalanceCascade两种非均衡样本处理方法与SVM人工智能方法相结合,构建ADASYN-BalanceCascade-SVM智能模型,进
【摘 要】
【摘要】 本文运用数据包络分析(DEA)方法对中国商业银行的竞争力水平进行测度,以此作为状态指标变量,并基于非均衡商业银行样本视角,将计算机科学的ADASYN和BalanceCascade两种非均衡样本处理方法与SVM人工智能方法相结合,构建ADASYN-BalanceCascade-SVM智能模型,进而与传统的SVM、ADASYN-SVM、BalanceCascade-SVM以及ADASYN-BalanceCascade-BPNN模型进行对比研究。实证研究结果表明,非均衡样本处理方法能够有效地解决商业银行的非均衡样本问题,同时,与其余预测模型相比,ADASYN-BalanceCascade-SVM模型具有最为优越的预测性能。
【关键词】 竞争力预测;数据包络分析;自适应合成抽样;BalanceCascade;支持向量机
一、引言
众所周知,金融业是现代经济的核心,而商业银行作为金融体系的重要组成部分,不仅关系着金融业的稳定发展,而且对于整个国民经济的健康运行也起着至关重要的作用。然而,随着国外银行不断涌入中国,中国商业银行间的竞争加剧,而中国商业银行自身经营管理模式落后、金融创新性不足等缺陷也使得中国商业银行的发展面临着十分严峻的挑战。因此,如何有效地预测中国商业银行的竞争力水平并采取相应的措施来应对未来的竞争与挑战,从而有效地推动中国商业银行的发展,进而维护整个国民经济持续健康稳定发展,成为当前理论与实务界研究的重要课题之一。
目前,竞争力预测模型主要包括以KLR信号分析法、Logit模型、Probit模型等为主的传统的统计模型以及以人工神经网络(Artificial Neural Network,ANN)和支持向量机(Support Vector Machine,SVM)为主的人工智能模型(Kaminsky、Lizondo,1998;陈守东等,2006;Cipollini、Fiordelisi,2012;Zhang、Patuwo、Hu,1998;Vapnik,1995)。与其余预测模型相比,SVM能够根据结构最小化原则自动确定模型结构,同时又能够通过求解凸优化问题而获得全局最优点,因而具有更为优越的预测性能,备受学者们的青睐。
但不能忽视的是,SVM通常都是基于各类样本数量相等的前提假设进行机器学习。但事实上,现实世界中各类样本数量往往不相等。就中国商业银行而言,具备较强与较弱竞争力的银行数量通常不相等,于是这两类不相等的银行样本就构成了非均衡样本。如果SVM仍然基于均衡的银行样本进行机器学习,那么最终构建的SVM智能模型的预测结果必然与实际不符,从而将会错误地引导中国商业银行的发展。因此,只有基于非均衡样本视角对中国商业银行竞争力预测展开研究,才能对中国商业银行未来竞争力进行准确的判断,从而也才能为金融经济管理部门、银行高层管理人员和投资者进行管理、经营与投资决策提供有效的借鉴。
值得注意的是,当SVM基于非均衡样本进行机器学习时,其分类超平面往往会倾向于多数类样本,使得模型会很容易将少数类样本错误地预测为多数类样本,从而削弱SVM对少数类样本的学习性能,最终造成SVM模型预测性能的下降。为了有效地解决非均衡样本问题,学者们殚精竭虑,研究出多种不同的欠抽样和过抽样方法对非均衡样本问题进行了卓有成效的探讨。随机抽样方法(Random Undersampling,RU)是最为简单的一类欠抽样方法,它通过从多数类样本中随机选择一部分样本进行删除,从而使多数类与少数类样本的数量达到一致。尽管该类欠抽样方法简单易行,但很容易删除较多具有重要信息的多数类样本,反而会削弱SVM智能模型的预测性能。随着计算机科学技术的日新月异,欠抽样方法也逐渐向智能化方向发展,以BalanceCascade为代表的智能欠抽样方法应运而生。它的优势在于能够通过不断地循环迭代自适应地选择出对预测模型具有良好效果的多数类样本,同时又重点关注被错误预测的多数类样本,从而使得最终的预测模型能够在很大程度上学习多数类样本的全部有用信息(Liu、Wu、Zhou,2009)。而在过抽样方法中,合成少数类过抽样(Synthetic Minority Over-Sampling Technique,SMOTE)方法是最为常用的一类过抽样方法。它通过在抽样样本与近邻样本之间生成人造样本来平衡样本数据集来解决非均衡样本问题(Chawla,2002)。然而,在生成样本过程中,SMOTE方法往往没有考虑原始少数类样本的近邻样本的分布情况,总是平均生成相同数量的人造少数类样本,从而使得生成的人造少数类样本很可能与原始少数类样本发生重叠,最终造成少数类样本冗余(Wang,Japkowicz,2004)。而自适应合成抽样方法(Adaptive Synthetic Sampling Approach,ADASYN)能够根据原始少数类样本的近邻样本的分布情况,生成不同数量的少数类样本,从而有效地克服了SMOTE的样本冗余问题(He et al.,2008)。基于此,本文将结合ADASYN和BalanceCascade方法,构建ADASYN-BalanceCascade混合抽样方法,以充分发挥两类抽样方法的优势来有效克服商业银行竞争力预测中的非均衡样本问题。
需要指出的是,开展商业银行竞争力预测研究的重要前提条件在于准确地界定竞争力较强与较弱的商业银行样本,即测度出商业银行的竞争力水平。由于效率是衡量商业银行资源配置以及测度银行盈利能力和治理水平的重要指标,被大量学者认为是竞争力的集中体现,因而学者们通常都是运用层次分析法(Analytic Hierarchy Process,AHP)、随机前沿分析法(Stochastic Frontier Analysis,SFA)、自由分步法(Distribution Free Approach,DFA)、厚边界函数法(Thick Frontier Approach,TFA)和数据包络分析(Data Envelopment Analysis,DEA)等方法对商业银行效率进行测度,进而对其竞争力水平展开评价研究(Ishizaka,Nguyen,2013;Thoraneenitiyan,Avkiran,2009;Berger,Humphrey,1997;Paradi,Zhu,2013)。而在上述各种测度方法中,DEA是最具有应用优势的一种,因为DEA不仅不需要人为赋予权重,而且不需要假设生产函数形式,同时又可以方便地处理多投入和多产出的银行运作过程。因此,本文将运用DEA方法对商业银行效率进行测度,从而界定出竞争力较强与较弱的商业银行样本,为进一步开展商业银行竞争力预测研究提供坚实的样本基础。
基于以上分析,本文以中国商业银行为研究对象,运用DEA方法对商业银行的竞争力水平进行测度,并基于非均衡商业银行样本视角,将计算机科学的ADASYN和BalanceCascade两种非均衡样本处理方法与SVM人工智能方法相结合,构建ADASYN-BalanceCascade-SVM智能模型,对中国商业银行的竞争力展开预测研究,力求为金融经济管理机构、银行高层管理人员以及投资者进行银行竞争力预测分析提供良好的指导意义。
迄今为止,基于商业银行效率视角,Wanke and Barros(2014),Lin and Chiu(2013),Matthews(2013),Yang and Liu(2012),Holod and Lewis(2011),Staub,Souza and Tabak(2010),段永瑞、孙丽琴和赵金实(2013),芦峰、刘维奇和史金凤(2012),丁忠明和张琛(2011),周逢明等(2010),黄宪、余丹和杨柳(2008)等国内外研究学者都已开展了商业银行竞争力测度与评价研究。但令人遗憾的是,他们并未进一步对商业银行的竞争力展开预测研究。而黄茂兴和李闽榕(2012),李闽榕、黄茂兴、李军军(2009),魏晓强、李双元(2012),史本林、贺振、李红忠(2009),石吉金、杨兆萍、张宏元(2007),王联兵、米文宝、刘小鹏(2005),高晓红、郭军(2004)尽管运用组合预测模型、因子分析法以及BPNN模型对省域经济、旅游业和中国煤炭企业的竞争力展开了预测研究,并取得了良好的研究结果,但却并没有运用计算机科学的SVM智能方法对商业银行的竞争力进行预测研究,尤其没有基于非均衡样本视角,引入非均衡样本处理方法来解决研究样本中存在的非均衡样本问题。此外,尽管韩立岩、宋晓东和姚伟龙(2011),林宇、黄迅和徐凯(2013),Zhou(2013),Li and Sun(2012),Li et al. (2013)对财务风险与金融风险等经济领域的非均衡样本问题进行了探索,但并未对商业银行竞争力预测的非均衡样本问题进行研究。
本文不仅运用DEA方法对商业银行竞争力水平进行测度研究,而且基于非均衡样本视角,运用非均衡样本处理方法解决商业银行样本中存在的非均衡样本问题,并引入SVM智能方法对中国商业银行的竞争力水平进行预测研究。
二、非均衡样本视角下中国商业银行竞争力预测研究方法
1. 基于ADASYN-BalanceCascade的非均衡样本处理方法。假定中国商业银行的样本数据集为( , ),其中i=1,2,…,n,表示有n家商业银行样本; 为特征指标变量,且 =( ),表示每家商业银行在第t年有m个特征指标; 为状态指标变量,且 ,表示每家商业银行在第t+1年是否具有较强的竞争力,其中,“1”表示商业银行具有较强的竞争力,“0”表示不具有较强的竞争力,即竞争力较弱。
在获得商业银行样本数据集( , )的基础上,本文将其中一部分样本数据( , )划分为训练样本集。需要注意的是,在训练样本集中,竞争力较强与较弱商业银行的数量往往不相等,从而会降低SVM智能模型的预测性能。因此,为了有效地解决由两类数量不相等的样本所产生的非均衡样本问题,本文在构建SVM智能预测模型前,将引入ADASYN-BalanceCascade方法来平衡训练样本集,具体步骤如下:
Step1:从训练样本集( , )中划分出多数类样本集N与少数类样本集P,并用|N|与|P|代表各自的样本数量,且用xN和xP代表各自样本。Step2:计算多数类样本与少数类样本的数量差异D=|N|-|P|,并设定少数类样本增加的比例r。
Step3:统计出每个少数类样本的k个最近样本邻点,并运用式(1)计算邻点中少数类样本所占比例Rj:
Rj=λj/k (1)
其中,j=1,2,…,|P|,λj指第j个少数类样本的k个最近邻样本中属于少数类样本的数量。
Step4:通过式(2)归一化rj,从而得到分布函数 :
(2)
其中,分布函数[Rj]满足:[j=1PRj=1]。
Step5:计算出每个少数类样本需要生成的人造少数类样本数量Numj:
Numj= ×D×r (3)
Step6:从每个少数类样本的k个最近邻样本中随机选择一个邻点样本 ,再基于少数类样本xP与选定的最邻近样本 ,运用式(4)生成新的少数类样本 :
[xnewP=xP+xP-xP][×δ] (4)
其中,δ为[0,1]之间的随机数。
Step7:不断重复Step6,直到每个少数类样本都生成Numj个人造少数类样本,则终止样本生成,从而获得新的少数类样本集Pnew。
Step8:设定从多数类样本集N中抽样的次数为T,AdaBoost集成算法中SVM弱学习器F的循环次数为S,BalanceCascade算法的迭代次数i=1,2,…,T,误阳率rai=T-1[NwrN],即将多数类样本错误地预测为少数类样本的比率,其中,ra1=[PN],并进行如下循环。
Step9:从N中随机抽取多数样本子集Ni,并保证Ni的样本数量等于通过ADASYN处理后得到的新的少数类样本集合Pnew的数量|Pnew|,同时,由Ni和Pnew组成训练样本子集M,并用yi表示其状态指标变量。
Step10:令AdaBoost算法的迭代次数j=1,2,…,S,并基于样本权重 训练SVM弱学习器 ,且有:
=1/(|Ni|+|Pnew|)
Step11:通过式(5)计算预测误差:
(5)
Step12:通过式(6)计算SVM弱学习器 的权重 :
(6)
Step13:通过式(7)更新并归一化样本权重 :
[Wij+1=Wijexp-αijFijyijZij] (7)
其中, 为归一化因子,其作用在于使得[Wij+1]=1。在通过式(7)更新样本权重 的基础上,通过Step11 ~ Step13不断进行迭代,直到AdaBoost算法的迭代总次数达到S为止。
Step14:获得如下AdaBoost集成学习器:
(8)
Step15:运用式(8)中的AdaBoost集成学习器Gi对多数类样本子集Ni进行预测,从而根据预测结果更新rai。
Step16:从N中删除被Gi预测正确的多数类样本,并重复Step9 ~ Step15。
Step17:当i=T时,BalanceCascade算法的循环结束,从而获得最终的SVM集成学习器,即最终的ADASYN-BalanceCascade-SVM预测模型:
H(x)=[sgni=1Tj=1SαijFijx-i=1Trai] (9)
其中,x代表待输入的商业银行样本,sgn()代表符号函数。
2. 基于SVM的竞争力智能预测方法。从上述关于非均衡样本处理方法的介绍中可以发现,要获得式(9)的ADASYN- BalanceCascade-SVM预测模型,关键在于构建SVM弱学习器F。从上述实验步骤可知,从Step10起,就需要训练SVM弱学习器F,即构建SVM预测模型。于是,基于由Nsub(为阐述方便,本文在此处用Nsub代替Ni来表示多数类样本子集)与Pnew组成的训练样本子集M[M=( , )]进行SVM训练,就需要求解如下最优问题:
min [12][w][2]+C[ba=1Nsub+Pnewξba]
s.t. [yt+1bawTxtba+b+ξba≥1]+[ξba]
其中,ba=1,2,…,|Nsub|+|Pnew|,w代表可调权值向量,b代表偏置向量,ξba代表非负的松弛变量,其作用在于“软化”约束条件,允许部分样本被错误预测,即允许将具有竞争力的商业银行样本预测为不具有竞争力的商业银行样本,或者将不具有竞争力的商业银行样本预测为具有竞争力的商业银行样本。C代表惩罚参数,具有在模型的学习性能与泛化推广性能之间进行平衡的功能。于是,本文通过引入非负的拉格朗日乘子α(Lagrange Multiplier)并进行求解,就得到如下对偶问题:
[exp-γxtba,xtd]-[ba=1Nsub++Pnewαba]
s.t. [ba=1Nsub+Pnewyt+1baαba=0,0≤αba≤C]
其中,( , )为α的一个正分量αd所对应的样本,[exp-γxtba,xtd]为RBF核函数,γ为RBF核函数的参数。于是求解上述对偶问题,就能够获得最终的决策函数,即SVM预测模型:
[Fxtba=sgnFxtba=sgnba=1Nsub+Pnewα∗bayt+1baexp-γxtba,xtd+yt+1d-ba=1Nsub+Pnewα∗bayt+1baexp-γxtba,xtd]
基于上述分析,本文就能够将式(12)所构建的SVM预测模型代入式(9)中,并基于式(9)的ADASYN-BalanceCascade-SVM智能模型,对训练样本集( , )和测试样本集( , )分别进行样本内和样本外预测,从而对ADASYN-BalanceCascade-SVM智能模型的学习性能与泛化推广性能进行评价,进而综合评估出ADASYN-BalanceCascade-SVM智能模型的竞争力预测性能。
3. 基于DEA的状态指标变量计算方法。从上述分析可以发现,要构建ADASYN-BalanceCascade-SVM智能预测模型,首要条件在于获得中国商业银行的样本数据集( , ),因此,就需要提前对模型的状态指标变量 进行准确界定。基于此,本文采用传统DEA方法中的C2R(Charnes-Cooper-Rhodes)模型对商业银行的综合效率进行测度,从而测度出商业银行的竞争力水平,即界定出状态指标变量(由于综合效率是纯技术效率与规模效率的乘积,能够更为全面地反映银行的竞争力水平,故本文基于综合效率来测度银行的竞争力水平),具体如下:
对每家商业银行而言,用inij表示第i家银行的第j个原始投入变量,且inij≥0(i=1,2,…,n,j=1,2,…,m),并用Ini=(ini1,ini2,…,inim)表示所有商业银行的原始投入变量集合;用outir表示第i家银行的第r个原始产出变量,且outir>0(r=1,2,…,s),并用outi=(outi1,outi2,…,outis)表示所有商业银行的原始产出变量集合。于是,商业银行综合效率测度的C2R模型如下:
min θ-ε(e1TS-+e2TS+)
s.t. Iniλi+S-=θinij
outiλi-S+=outir
λi≥0,θ≥0,S-≥0,S+≥0
其中,S-和S+分别为松弛变量和剩余变量,θ为第i家银行的效率值,ε为非阿基米德无穷小量,e1为m行1列、元素全为1的列向量,e2为r行1列、元素全为1的列向量。于是,通过求解上述最优化问题,就能够得到最优解θ0、S-0和S+0。如果θ0=1且e1TS-0+e2TS+0=0,则表示第i家银行为DEA有效,可以认为该银行具有较强的竞争力,于是其状态指标变量 =1;如果θ0=1且e1TS-0+e2TS+0>0以及θ0<1,则分别表示第i家银行为弱DEA有效和不为弱DEA有效,可以认为该银行具有较弱的竞争力,于是其状态指标变量 =0。
通过上述分析,就能够将每家商业银行的状态指标 确定出来,进而就能基于特征指标变量与状态指标变量所组成的样本数据集( , )来构建ADASYN-BalanceCascade- SVM智能预测模型。
4. 智能预测模型的性能评估方法。为有效地评估本文提出的ADASYN-BalanceCascade-SVM智能模型的预测性能,本文引入几何平均正确率G值和少数类样本的F值对模型的预测性能进行全面的评估。
假定多数类样本被预测正确的数量为|TN|、多数类样本被预测错误的数量为|FN|,少数类样本被预测错误的数量为|FP|、少数类样本被预测正确的数量|TN|,于是就能够根据这四项指标构建如下的混淆矩阵(见表1)。
基于表1的结果,运用式(15) ~ 式(17)就能够计算得到灵敏度SE、特异度SP和少数类样本查准率P三种基本指标:
SE=[TPTP+FP] (14)
SP=[TNTN+FN] (15)
Pr=[TPTP+FN] (16) 然后再基于式(14) ~ 式(16)计算得到的结果,并运用式(18)和式(19)就能够得到几何平均正确率G和少数类样本的F:
G= (17)
F=[2×SE×PSE×P] (18)
从式(17)可以发现,几何平均正确率G是灵敏度SE和特异度SP的几何平均,因而几何平均正确率G能够综合考察模型对于两类样本的预测性能。G值越大,说明模型对于两类样本的预测性能越优异,反之亦然。
从式(18)又可以发现,少数类样本的F是由灵敏度SE和少数类样本查准率Pr所构成的指标,从而说明与几何平均正确率G关注两类样本预测的综合情况不同,少数类样本的F主要关注少数类样本的预测情况,能够单独考察模型对于少数类样本的预测性能。F值越大,说明模型对于少数类样本的预测性能越优异,反之亦然。需要说明的是,之所以要运用少数类样本的F来单独考察模型对于少数类样本的预测性能,原因在于当预测模型遭遇非均衡样本问题时,更容易将少数类样本错误预测为多数类样本,因此,如果仅以几何平均正确率G对模型的预测性能进行综合评估,就很可能会造成评价结果的失真,而少数类样本的F却正好能够弥补几何平均正确率G的评价缺陷,因而将这两种方法相结合对模型进行性能评估,能够更为全面地考察模型的预测性能。
三、中国商业银行竞争力预测的实证结果与分析
1. 商业银行样本与DEA指标的选择。鉴于样本数据的可获得性,本文选择了中国银行、建设银行、工商银行、农业银行、交通银行5家国有大型银行以及光大银行、广发银行、华夏银行、民生银行、浦发银行、平安银行、兴业银行、招商银行、浙商银行、中信银行10家股份制商业银行,以2004 ~ 2013年10年为研究年份,从而使得对中国商业银行竞争力预测的研究更加全面与科学。
要运用DEA方法获得商业银行竞争力状况,投入与产出指标的选择十分关键。基于此,本文借鉴了国内外相关学者的研究成果(游家兴、陈淑敏和徐盼盼,2011;虞晓雯等,2012;李平、曾勇和朱晓林,2013;Paradi,2004;Avkiran,2006;Mostafa,2009)以及国际金融界权威性杂志《银行家》对世界各地商业银行进行排名所使用的指标,从中选择出职工总数、固定资产净值、营业费用作为投入指标,利息收入与非利息收入作为产出指标。所有数据信息来源于国泰安金融数据库、相关研究年份的《中国金融年鉴》、《中国统计年鉴》以及银行年报。
2. 状态指标的计算与特征指标的选择。由于商业银行竞争力的历史状况能够通过综合效率值体现出来,因此,本文运用DEAP2.1计算上述十五家商业银行2004 ~ 2013年各年度的综合效率值,就能据此确定商业银行竞争力的历史状况并界定出状态指标变量。上述15家商业银行的综合效率测度结果如表2所示。从表2可知,综合效率值为1且松弛变量与剩余变量也皆为0的样本数据有51个,表明具有较强竞争力的商业银行样本数据有51个;综合效率值不为1的样本数据有99个,表明不具有较强竞争力的商业银行样本数据有99个,由此界定出每家商业银行各年度的状态指标变量。从而可以发现,具有较强竞争力与不具有较强竞争力的商业银行样本数量不一致,属于非均衡样本,两类样本的不平衡比例达到1:1.94,从而表明本文基于非均衡样本视角对商业银行竞争力进行预测研究是有据可依的。
此外,由于每家商业银行竞争力的历史状况都是基于职工总数、固定资产净值、营业费用、利息收入与非利息收入五项指标计算得到,因而在构建商业银行竞争力预测模型时,也同样应该将这五项指标作为特征指标变量进行预测研究,才能有效地保证整个研究过程的连续性。同时,每家商业银行样本的特征指标变量与状态指标变量还应该相差一个年度,即当年的状态指标变量需要对应前一年的特征指标变量,这样才能使构建的模型具有预测功能。基于此,本文以每家商业银行2003 ~ 2012年的职工总数、固定资产净值、营业费用、利息收入与非利息收入作为特征指标变量,并与上述计算得到的状态指标变量共同构建样本数据集,从而为智能预测模型的构建提供良好的样本基础。
3. 训练样本与测试样本的划分。在获得商业银行样本数据集的基础上,本文将2004 ~ 2010年共7年的银行样本数据划分为训练样本(浙商银行2004年才正式开业,故缺少其2003年的指标数据),即训练样本包含2003 ~ 2009年的特征指标变量以及2004 ~ 2010年的状态指标变量,其中,具有较强竞争力的商业银行样本数据有37个、不具有较强竞争力的有67个,训练样本的非均衡比例达到1:1.82;同时,将2011 ~ 2013年共3年的银行样本数据划分为测试样本,即测试样本包含2010 ~ 2012年的特征指标变量以及2011 ~ 2013年的状态指标变量,其中,具有较强竞争力的商业银行样本数据有14个、不具有较强竞争力的有31个,测试样本的非均衡比例达到1∶2.21。由此可见,不论是训练样本、测试样本还是总样本,都属于非均衡样本,因而从非均衡样本角度对商业银行竞争力进行预测研究是具有科学依据的。
4. 最优ADASYN-BalanceCascade-SVM预测模型的确定。众所周知,参数的选择对于模型性能具有重要的影响。本文提出的ADASYN-BalanceCascade-SVM模型具有如下参数(见表3):
为了获得最优的ADASYN-BalanceCascade-SVM预测模型,本文基于matlab2013a编程软件不断进行实验,对不同参数下预测模型的训练样本预测结果与测试样本预测结果进行考察发现,不论参数i、S和k如何变化,ADASYN-BalanceCascade-SVM模型基于训练样本和测试样本进行预测所获得的G和F值都没有任何改变,表明这三类参数对模型预测性能无任何影响(鉴于篇幅限制,关于三类参数的实验结果不在文中展示)。然而,在训练样本预测上,r的变化尽管不会引起ADASYN-BalanceCascade-SVM模型G和F值较为明显的变化,但在测试样本预测上,r的变化却会引起ADASYN-BalanceCascade-SVM模型G和F值较为明显的变化,如图1和图2所示。
从图1中可以看出,在对训练样本的预测中,随着r值的不断变化,ADASYN-BalanceCascade-SVM预测模型的G值和F值都分别在0.86 ~ 0.92和0.90 ~ 0.95两个区间内进行波动,波动幅度较小,从而表明r值的变化不会对ADASYN-BalanceCascade-SVM预测模型的学习性能造成明显的影响。
然而,从图2我们可以明显地看到,在对测试样本展开的预测中,随着r值的增大,ADASYN-BalanceCascade-SVM预测模型的G和F值首先逐渐上升,直到r值为0.5时G和F值达到最大,然后G和F值又逐渐下降,同时随着r值的变化,G和F值的波动也较大,由此表明r值的变化对ADASYN-BalanceCascade-SVM预测模型的泛化推广性能会造成较为明显的影响。通过分析,其原因可能在于:
如果r值较大,则意味着ADASYN将增加较多的少数类样本而BalanceCascade将删除较少的多数类样本,从而就很容易造成少数类样本存在较多的冗余信息而多数类样本保留较多的噪声信息;但是如果r值较小,却又意味着ADASYN将增加较少的少数类样本而BalanceCascade将删除较多的多数类样本,从而又很可能造成少数类样本中有用信息不足而多数类样本中有用信息被较多地删除,最终都将会降低模型的泛化推广能力。只有当r为0.5,即少数类样本增加与多数类样本删除的数量一致时,才能较好地平衡有用信息与冗余或噪声信息之间的关系,从而保证模型具有较为良好的泛化推广性能。
此外,由于目前网格寻优法(Grid Search,GS)已经被大量用于确定SVM的最优参数C和g值,因而本文在进行实验时就直接运用GS搜寻最优参数C和g值,故在此就不再对这两个参数进行讨论。
基于以上分析可知,在参数i、S和k被任意设定、最优C和g值通过GS确定以及r被设定为0.5时,构建的ADASYN-BalanceCascade-SVM模型即为最优模型。
5. 最优ADASYN-BalanceCascade-SVM模型与其余预测模型的性能对比研究。为展现ADASYN-BalanceCascade方法在处理不平衡样本问题上的优越性能以及ADASYN-BalanceCascade-SVM模型在竞争力预测中的优势,本文对SVM、BalanceCascade-SVM、ADASYN-SVM与ADASYN-BalanceCascade-SVM模型进行对比研究,实验研究结果如图3和图4所示。需要说明的是,该实验是基于i=20、s=20、r=0.5、k=5的参数设计而完成的。
从图3和图4可以看出,不论基于训练样本集还是测试样本集,传统SVM模型的G和F值都为0,表明当面临非均衡样本时,传统SVMsaga往往会将少数类样本错误地预测为多数类样本,无法克服非均衡样本问题。然而,与传统SVM模型相比,非均衡样本处理方法与SVM相结合的模型,其G和F值却有十分明显的提升,表明引入非均衡样本处理方法后,SVM能够更为有效地预测少数类样本,具备了克服非均衡样本问题的能力。
尽管非均衡样本处理方法有助于SVM解决非均衡样本问题,然而,从图3和图4也可以看出,不同非均衡样本处理方法的有效性也是不同的。图3中,BalanceCascade-SVM、ADASYN-SVM和ADASYN-BalanceCascade-SVM的G和F值几乎都在90%以上(除BalanceCascade-SVM为88.61%),并且不同模型间的G和F值均差异不大,从而说明单独引入BalanceCascade或ADASYN方法或者将二者相结合,都能够帮助SVM取得良好的学习能力。然而,在图4中,BalanceCascade-SVM、ADASYN-SVM的G和F值都明显低于ADASYN-BalanceCascade-SVM,说明将BalanceCascade和ADASYN方法相结合,比单独引入BalanceCascade或ADASYN方法,能够更为有效地帮助SVM解决非均衡样本问题,从而获得更为良好的泛化推广性能。原因可能在于BalanceCascade和ADASYN相结合的非均衡样本处理方法具备了BalanceCascade在处理多数类样本与ADASYN在处理少数类样本中具有的优势,从而使得最终的ADASYN-BalanceCascade-SVM预测模型具有最为优势的预测性能。
进一步分析,由于BPNN也是具有良好预测性能且被大量学者广泛运用于预测研究的人工智能模型之一,因此,为全面展现ADASYN-BalanceCascade-SVM模型的良好预测性能,本文也将ADASYN、BalanceCascade与BPNN相结合,构建ADASYN-BalanceCascade-BPNN预测模型,并与本文提出的ADASYN-BalanceCascade-SVM预测模型进行性能对比研究。对比结果如图5所示。
从图5可以看出,不论是基于训练样本集还是测试样本集,ADASYN-BalanceCascade-SVM的G和F值都明显高于ADASYN-BalanceCascade-BPNN,从而说明通过引入ADASYN-BalanceCascade非均衡样本处理方法,SVM较BPNN具有更为优越的学习性能与泛化推广性能。
四、结论
商业银行对整个国民经济的健康运行起着至关重要的作用,对商业银行竞争力进行预测研究,一直以来都是理论界与实务界的重要研究课题之一。
本文首先运用DEA方法对商业银行的竞争力水平进行测度,以此作为状态指标变量,并基于非均衡商业银行样本视角,将计算机科学的ADASYN和BalanceCascade两种非均衡样本处理方法与SVM人工智能方法相结合,构建ADASYN-BalanceCascade-SVM智能模型,进而与传统的SVM模型、ADASYN和BalanceCascade分别与SVM相结合的ADASYN-SVM和BalanceCascade-SVM模型以及ADASYN、BalanceCascade与BPNN相结合的ADASYN-BalanceCascade-BPNN智能模型进行了对比研究。实证研究结果表明,非均衡样本处理方法能够有效地解决商业银行的非均衡样本问题,同时,ADASYN-BalanceCascade-SVM较其他预测模型具有更为优越的预测性能。
综上所述,在对中国商业银行竞争力进行预测上,本文提出的ADASYN-BalanceCascade- SVM模型具有良好的预测性能,因而拥有较高的实际应用价值。不论是金融经济管理部门、银行高层管理人员还是投资者,都能够运用本文提出的ADASYN-BalanceCascade-SVM模型对商业银行未来一年的竞争力水平进行准确的预测,从而有效地评估商业银行的竞争力水平,并制定出切实可行的银行监管政策、银行发展战略目标以及投资决策,最终维护金融业的稳定发展并促进国民经济的健康运行。
主要参考文献
Cipollini A,Fiordelisi F. Economic Value,Competition and Financial Distress in the European Banking System[J]. Journal of Banking & Finance,2012(11).
Zhang G,Patuwo EB,Hu My. Forecasting With Artificial Neural Networks: the State of Art[J]. International Journal Forecasting,1998(14).
Vapnik V N. The Nature of Statistical Learning Theory[M]. New York:Springer-Verlag,1995.
Chawla N V,Bowyer K W,Hall L O,KEGELMEYER W P. SMOTE: Synthetic Minority Over-Sampling Technique[J]. Journal of Artificial Intelligence Research,2002(16).
Ishizaka A,Nguyen N H. Calibrated Fuzzy AHP for Current Bank Account Selection[J]. Expert Systems with Applications,2013(9).
Thoraneenitiyan N,Avkiran N K. Measuring the Impact of Restructuring And Country-Specific Factors on the Efficiency of Post-Crisis East Asian Banking Systems: Integrating DEA With SFA[J]. Socio-Economic Planning Sciences,2009(4).
Wanke P,Barros C. Two-Stage DEA: An Application to Major Brazilian Banks[J]. Expert Systems with Applications,2014(41).
Lin T Y,Chiu S H. Using Independent Component Analysis And Network DEA to Improve Bank Performance Evaluation[J]. Economic Modelling,2013(32).
Matthews K. Risk Management And Managerial Efficiency in Chinese Banks: A Network DEA Framework[J]. Omega,2013(41).
Yang C,Liu H M. Managerial Efficiency in Taiwan Bank Branches: A Network DEA[J]. Economic Modelling,2012(29).
段永瑞,孙丽琴,赵金实.基于数据包络分析的中国商业银行运作与服务质量效率评价[J].中国管理科学,2013(11).
芦峰,刘维奇,史金凤.我国商业银行效率研究——基于储蓄新视角下的网络DEA方法[J].中国软科学,2012(2).
丁忠明,张琛.基于DEA方法下商业银行效率的实证研究[J].管理世界,2011(3).
周逢明,张会元,周海,孙佰清.我国商业银行效率评价[J].金融研究,2010(11).
黄宪,余丹,杨柳.我国商业银行X效率研究——基于DEA三阶段模型的实证分析[J].数量经济技术经济研究,2008(7).
魏晓强,李双元.青海旅游业综合竞争力评价与预测分析[J].开发研究,2011(2).
王联兵,米文宝,刘小鹏.宁夏旅游业综合竞争力评价及预测分析[J].旅游学刊,2005(5).
高晓红,郭军.基于BP人工神经网络的企业竞争力预测模型[J].中国矿业,2004(8).
韩立岩,宋晓东,姚伟龙.基于改进支持向量机的上市公司财务困境判别研究[J].管理评论,2011(5).
林宇,黄迅,徐凯.基于RU-SMOTE-SVM的金融市场极端风险预警研究[J].预测,2013(4).
Zhou L G. Performance of Corporate Bankruptcy Prediction Models on Imbalanced Dataset: The Effect of Sampling Methods[J]. Knowledge-Based Systems,2013(41).
游家兴,陈淑敏,徐盼盼.中国金融市场化与开放进程对银行的影响研究[J].投资研究,2011(9).
李平,曾勇,朱晓林.中国银行业改革对中资银行效率变化的影响[J].管理科学学报,2013(8).
Avkiran N K. Developing Foreign Bank Efficiency Models for DEA Grounded in Finance Theory[J]. Socio-Economic Planning Sciences,2004(40).
Mostafa M M. Modeling the Efficiency of Top Arab Banks: A DEA-Neural Network Approach[J]. Expert Systems with Applications,2009(36).
【基金项目】 国家自然科学基金项目“碳无形资产视角下的企业低碳竞争力系统评价研究”(项目编号:70671085);成都市科技计划项目“多目标视角下创新型城市建设中节能减排政策体系的系统评价研究”(项目编号:7RKYB009ZF-010)