2017年
财会月刊(3期)
工作研究
利用财务比率和公司治理指标建构企业信用评级预测模型

作  者
刘小萌1,2,许长新2(博士生导师)

作者单位
1.金陵科技学院商学院,南京211169;2.河海大学商学院,南京211100

摘  要

    【摘要】如何对企业信用评级加以预测,加入非财务信息的公司治理指标的影响如何,是目前大家所关注的焦点。本研究分别利用传统多变量区别分析法及基因类神经网络建立预测模型,以检验两者中何者具有更高的预测能力。在实证方面,以区别分析法选择关键变量建构模型,加入公司治理指标以提升整个模型的完整性及准确度;以基因算法萃取企业风险等级的重要影响变量时,发现公司治理的确对信评结果有高度贡献。在比较区别分析模型与基因类神经网络模型的预测能力方面,基因类神经网络信评预测模型在模型整体的效度、内部效度、外部效度方面,皆高于区别分析模型,表示基因类神经网络模型的预测效果有更佳的一般性,更能让外部关系人将模型应用于样本外的企业风险预测。
【关键词】信用评级;区别分析;基因类神经网络;公司治理
【中图分类号】F230      【文献标识码】A      【文章编号】1004-0994(2017)03-0047-9一、绪论
信用评级机构以简单的等级符号表示被评级公司偿债能力的强弱及可能违约几率的高低,这些等级符号被提供给债权人或投资人作为参考依据,可以降低信息的不对称。信用评级良好的企业,其偿债能力较强、无法偿还债务的几率较低,从而能够增加企业取得信用及资金的渠道,使企业筹资的弹性大为提升,并可以降低贷款成本。
在历经2001、2002年间美国陆续爆发的恩隆和世界通讯等案件及2008年全球金融危机后,许多知名企业陷入经营困境,造成投资大众信心不足。由于公司治理有助于健全金融市场,让资本市场更透明化、更国际化,因此其已成为信用评级机构在进行评级时的评估项目之一 ,也陆续有学者探讨并证实了公司治理变量对信用评级的影响(如Sengupta,1998;Bhojraj和Sengupta,2003;Hollis、Daniel和Ryan,2011)。
由于一般投资大众无法取得如评级机构般完整的评级资料,也未具备分析师的专业分析能力,现有国内外文献大部分采用传统财务比率指标构建模型。为了提高投资人事前评估的参考价值,本文将公司治理因素纳入研究范围,参考Standard和Poor(2008)所提出的公司治理架构以及Hollis、Daniel和Ryan(2012)所整理的以往学者对公司治理的研究,从公司权力运作的四大主轴(董事、监事、股东以及关系人),分别从公司股权结构、董事会组成与报酬、关系人交易以及信息披露透明与否四个构面选取公司治理变量,以建构一个整合了财务比率及公司治理指标的信用评级预测模型。
本研究分别利用逐步区别分析及多变量区别分析模式(Multivariate Discriminate Analysis,MDA)、基因类神经网络(Genetic-Algorithm-based Artificial Neural Network,GAANN)建立信用评级预测模型,随后比较区别分析模式与基因类神经网络所建构模型之击中率(HR),以鉴定两者中何者具有更高的预测能力。希望此模型的预测结果能量化企业信用风险,并成为外部关系人(如股东、公司债持有人、银行等授信者等)评估投资策略以及风险管理的一项参考依据。
二、文献综述
本研究主要目的在于建构一个整合了财务比率及公司治理指标的信用评级预测模型,故先回顾信评级预测的相关理论与文献。
(一)探究问题之类型
早期关于信用评级预测的研究多专注于长期公司债的债信评级分类问题,较近时期则有一些短期票券评级的研究。这些研究大多着重于分析债信评级与企业融资成本的关联,并假定融资成本大多是由发行者特征及发行风险所决定(Horrigan,1966;Kaplan 和Urwitz,1979;Boardman和McEnally,1981;Lamy 和Thompson,1998;Ziebart和Rieter,2002),忽略了良好的治理机制能确保公司资源妥善配置及维护股东、债权人(公司债持有人或银行等授信者)等利益相关者的利益。
Sengupta(2008)以及Bhojraj和Sengupta(2010)试图研究公司治理对债信评级及融资成本的影响,但研究中将范畴专注于某些变数。Hollis et al.(2013)则完整地探讨并证实了公司治理变量对信用评级的影响。因此本文尝试整合财务比率及公司治理指标以建立预测模型。
(二)评级方法
在研究方法上,20世纪80年代前的研究多使用传统的多变量统计方法,包括多元线性区别分析(Pinches和Mingo,1973;Belkaoi,1980;Ederington,1985)、多元非线性区别分析(Pinches和Mingo,1975)、直线回归法(Horiggan,1966;West,1970;Ederington,1985)、几率回归模型Probit Regression (Ederington,1985)、Logit Regression(Ederington,1985)及多元尺度法(Molinero、Gomez和Cinca,1996),这些统计方法往往需满足特定的统计假设(例如数据符合常态分配)才能适用。20世纪80年代后期,才陆续有研究者将人工智能的方法导入信用评级领域,如倒传递类神经网络(Dutta和Shekhar,1988;Surkan和Singleton,1990;West,2000)、Genetic Algorithm与CBR整合方法(Shin and Han,1999)、类神经网络与CBR整合方法(Kim和Han,2001)、CBR(Shin和Han,2001)、模糊类神经(Malhotra R.和D. K. Malhotra,2002;Amorim、Vasconcelos和Brasil,2007),这些方法预测效果良好,分类正确率较高。
无论是传统学术理论架构下的单变量分析、区别分析、Probit 分析、Logit 分析,还是经过改良的现代模型,都有一些模型假设和条件限制,然而这些模型的假设或条件限制,往往都与现实环境条件有所出入,故出现了类神经网络研究模型。Odom和Sharda(2010)延续Altman(2008)所用的五个财务比率变量,将样本分为训练样本及测试样本,并同时用区别分析和类神经网络两种模型进行研究,结果在训练样本中类神经网络的正确判别率高于区别分析,类神经网络正确率高达100%,而区别分析亦有86.64%的正确率。Coats和Fant (2011)亦以Altman的Z计分模型为基础提出了五个变量,分别对区别分析和类神经网络进行模型建立和实证研究。结果显示类神经网络对财务危机公司判别的正确率高达91%,同样对正常公司判别的正确率也有96%;而区别分析对财务危机公司的区别率仅72%,对正常公司的区别率也仅有89%,故其实证显示出类神经网络的预测能力较佳。Altman et al. (2014) 则以2002 ~ 2012年的意大利公司为研究对象,比较区别分析及类神经网络模型之优劣。结果发现两个模型均有90%以上的正确判别率,不过类神经网络的正确率小胜一筹。同时,此研究认为,由于类神经网络的理论根据与黑箱作业类似,结果也较难分析解释,故建议两个模型并用,相互参考。   
类神经网络发展至今已有许多不同模式,但无论何种模式,尽管使用不同的最佳化算法,局部最小值的问题一直存在。在本研究中,尝试配合基因算法的全域搜索能力,并根据适存度函数随时调整,以解决局部最小值的问题。因此,本研究将以基因类神经网络模型作为主要研究方法,并与传统区别分析进行比较,希望此模型的预测结果对于量化企业信用评级有较好的帮助。
(三)输入变量选取
在输入变量的选取上,有些研究采用多变量统计方法的主成分分析、因素分析及逐步选取的方式选取重要的输入变量(Pinches和Mingo,1973、1975;Shin和Han,1999、2001;Kim和Han,2001),有些学者基于经济合理性主观选取适当的输入变量(Horrigan,1966;Belkaoi,1980),这些变量往往因数据的可取得性而多侧重于企业财务信息(尤其是财务信息)和信用投资公司的发行条件(公司债的从属性),鲜少考虑其他信息,故Pinches和Mingo(2011)认为这是正确率无法大幅提升的原因,也是信评机构主张分析师主观判断的价值所在。
为提高预测的正确性,本研究在输入变量方面,除了财务比率还加入了涉及主观判断及质化评估的公司治理变量。其中财务比率指标以财务五力之收益力、安全力、活动力、成长力及生产力为分析构面整理出37个变量;公司治理指标则参考Standard和Poor(2012)提出的公司治理架构以及Hollis、Daniel和Ryan(2013)所整理的以往学者对公司治理的研究,从股权结构、董事会组成与报酬、关系人交易及信息透明度四个构面汇整出14个变数。
三、研究设计
本文的研究设计一共分为以下三个部分:首先,介绍变量定义与衡量方式;其次,描述本研究的样本选取与数据来源;最后,分别介绍采用的研究方法——区别分析与基因类神经网络的详细理论内容与建构方式。
(一)变量定义与衡量
本研究以大公国际所公告的企业信用评级指标(CRI)为输出变量。评级结果共分9级,等级愈低,表示信用状况愈佳,这9个等级又被分类成三种风险级别。如表1所示:

 

 

 

本研究之输入变量大致可分成两大类,分别为财务比率以及公司治理变量,其中财务比率以各企业的财务报表为分析依据,来自财务五力之五个构面,即收益力、安全力、活动力、成长力;公司治理指标则来自股权结构、董事会组成与报酬、关系人交易及信息透明度四个构面。
(二)样本选取与数据来源
1. 研究对象。本研究使用的数据来自国泰安数据库(CSMAR),以2015年年底为基期,计算公司市值,取中国市值前百大企业作为研究对象,涵盖不同产业类别,以期获得通用结果。
输出变量CRI主要以一般产业为评级范围,但金融、保险与证券业的行业特性与管制环境均异于一般产业,故将属于上述产业的27家公司予以剔除,最终有效样本为73家企业。
2. 资料来源与研究期间。财务比率构面下的各变量以及信用评级数据主要来自国泰安数据库(CSAMR)和大公国际信用评级网站,而公司治理构面下变量之数据,部分来自上述数据库,部分则参考各公司的年报。研究期为2013 ~ 2015年。
在验证本研究建构模型之准确度时,如果以所有个案数据建构模型,再以同样的个案数据评估模型准确度,极可能会高估模型预测能力,因此本研究以研究期间的前两年,前百大企业筛选后的73家企业2013 ~ 2014年的146个数据,作为建构模型的训练样本,并同样以其2015年的73个数据作为测试样本,以评估模型的效度。
(三)研究方法
本研究旨在整合传统财务比率变量及公司治理相关变量,并分别利用区别分析及基因类神经网络建构企业信用评级预测模型,比较人工智能方法的预测结果是否优于传统区别分析,以作为投资人参考以及金融机构选择贷款对象的依据。
本研究的第一个模型是由逐步区别分析法筛选出对信评结果具有区别力的变量,并利用区别分析法建构信用评级预测模型,以验证加入公司治理指标预测模型的预测能力;第二个模型则是采取基因类神经网络建构模型,首先运用基因算法交叉测试不同的演化代数及基因长度的设定,以找出击中率最高的组合,再将此变量组合作为倒传递类神经网络模型的输入变量,以观察基因类神经网络的预测结果是否优于区别分析的结果。
1. 逐步区别分析模型。区别分析是早期最常使用的信用评级方法,Altman(1968)预测财务困难公司时采取逐步区别分析法决定样本的区别模型。之后针对公开债信等级提出类似预测模型的研究很多,例如Pinches和Mingo(1973,1975)、Belkaoi(1980)等。
区别分析的基本逻辑是,在两个(或多个)不同的群体中分别抽样,就抽样出来的样本寻找能够区分两个群样本的一组关键变量,衡量各关键变量的区别能力后,予以加权组合而得到一项区别函数,将其作为区别两个群体(或多个群体)的模型,这就是所谓的区别模型。其方法主要是在全体数据点归属群体已知的前提下,求取最能将各群体数据点区别清楚的线性函数,亦即各群体在此一线性函数上的投影,其群体间离差(Between-group Dispersion) 相对于群体内离差(Within-group Dispersion) 的比值为最大。
而本研究的输出变量为信评结果的风险类别,分别为低风险(Y=1)、中度风险(Y=2)以及高风险(Y=3)三个群体。其中每两个群体便需要一个区别函数,而区别函数的建构原则为,使其组间差异平方和相对于组内差异平方和(或总差异平方和)的比值为最大,目的是使所有预测变量投影到区别轴上,从而有效地将群组分离。
鉴定区别函数的预测能力,可由击中率(Hit Ratio)评估。所谓击中率,是以归类矩阵中预测出的结果个数除以总数目的比率算得,也可由归类矩阵中的对角线个案数目除以总个案数得出,如下列方程式所示:击中率=正确归类个案数/总个案数。具体见表2。

 

 

 

 

 

尽管使用区别分析建构模型预测信用评级相当普遍,但其本身存在颇为严格的假设:各项变量须服从多元常态分布;每一变量都不是其他变量的线性组合;失败与未失败公司间的样本变异数-共变量矩阵必须相等。然而在检验实际数据时,绝大多数都不符合这样的假设要求,故本文试图结合人工智能分析工具中的基因演算与类神经网络建构预测模型,以比较两种方法的不同之处及进行效益评估。
2. 基因类神经网络。由于信评的目的是评估企业未来的信用强度,若仅靠财务报表中历史绩效的量化分析则有所不足。而对于主观判断及质化评估,在研究方法中,属类神经网络最能仿真人类思考模式,也能设法辨认输入数据当中的隐藏关系,并以此关系来预测未来趋势。而类神经网络至今所发展出的多种学习模式中,运用在信用评级或财务危机上的,以监督式学习中的倒传递类神经模式(Back-Propagation Network,BPN)最具代表性,因此本研究也采用此法。
鉴于当类神经网络模式学习时间较长且输入层变量太多时有不易收敛的缺点,本研究以基因算法建立筛选的准则,采用经验法则及试误法,交叉测试不同的演化代数及基因长度的设定,以更有效地选取对信评结果贡献性较强的变量,并将其作为类神经网络的输入层变量,提供良好的类神经网络学习起始值,再利用BPN进行数据分析,以寻求最佳的分类预测效果。  
3. 基因算法。基因算法是John Holland在1962年根据达尔文的自然界进化论(物竞天择、适者生存)所提出的,其主要特征是来自遗传科学及自然淘汰的想法,运用数学方法模拟生物演化特性,即选择(Selection)与复制(Reproduction)、交配(Crossover)及突变(Mutation)等过程,将适存性较好的母代基因遗传到下一代,而在不断的进化过程中,适存性最强的物种便由此产生。换句话说,基因算法是一种效仿生物演化来求解最佳化问题的工具。
传统的最佳化方法是以单点搜寻方式,依照一定的数学模式产生下一次迭代值,如此反复计算求得最佳解;而基因算法则是以随机方式产生许多个点同时搜索最佳解,族群中的每一个个体都相当于一个搜索点,从这一代演化到下一代,每个搜索点都朝向更佳解迈进,此特性使得基因算法可找到绝对最佳解。以下就其演算步骤及运作过程中的专有名词作说明与解释:
(1)定义适存度函数。适存度的意义在于决定一个个体的基因组合是否符合需要,不符合就得遵循“不适者淘汰”的法则。适存度函数是基因算法的性能指标(Performance Index),它是由最佳化参数所构成的函数,为了能达到模型的精确度,本研究以击中率(Hit Ratio)建立适存度函数,其方程式及费雪归类矩阵同逐步区别分析模型。
(2)编码(Encoding)。基因算法把问题的解答表示成一个个染色体(Chromosome),即为编码。至于采取何种编码方式,则必须依据问题本身的特性来决定。编码方式可分为实数形式、整数形式与二进制。在实数形式中,个体并非由0与1 所组成,而是一个数字就代表一个个体,所以实数形式有别于二进制形式,实数形式并没有编码(把实数换成二进制,以利交配、突变的运算)的动作,因此也就不需要译码(Decoding)。一编一解中都要花费计算机计算时间,若再加上族群数大、世代数多和参数范围广,那么总共所要花的时间就很惊人了。实数形式的基因算法不用作编码及译码的繁复运算,且能有效克服准确度不足的问题,因此实数形式的基因算法执行速度较快。
(3)选择(Selection)。一群染色体组成族群(Population),根据族群中各染色体的适应值,挑选出一个新的世代(Generation)的过程,称为选择。利用选择机制去挑选出较好的个体(Individuals),或将较好的个体保留下来,以进行再一次的演化程序。选择模式共有五种:轮盘法(Roulette Wheel Selection )、衡量适应值的轮盘法 (Scaled Fitness Roulette Wheel Selection)、区段选择法(Section Selection)、排序基础选择法(Rank-based Selection)以及竞争法(Tournament Selection)等。
其中以轮盘法最为常用,其次是竞争法。轮盘法利用射飞镖的概念, 根据染色体的适应值来进行挑选,因较好的染色体所占的面积较大,有较大的几率可能被射中,因此利用轮盘法随机挑选染色体的过程中,较好的染色体较容易存活到下一世代进行演化,但其缺点是面积大的个体比较容易被选中,而导致一些问题产生。竞争法是将族群随机区分为k个(两个或多个)染色体为一组的竞赛组,将各组依适应值大小排列,再从其中挑选出最好的适应值存留下来,进行下一世代的演化。竞争法的优点是可避免当母代存有超级优秀的染色体时,而导致演化过早收敛。
(4)交配(Crossover)。引用自然界中生物繁衍的概念,使染色体基因交配产生子代,子代存有部分母代的部分基因,目的在于使基因组合多元化。交配方式有四种:单点交配(One-point Crossover)、均等交配(Uniform Crossover)、算术交配(Arithmetic Crossover)、顺序基础交配(Order-based Crossover),另也有多点交配(Multi-point Crossover)。
其中以单点交配与均等交配最为常用,单点交配是指在基因池中任选两个母代并选取任一交配点,以此交配点为主,将其前或其后的基因进行互换, 产生两个新的子代。均等交配首先须随机产生一个与母代等长的染色体作为模罩(Mask),以此作为交配的指示器,每个基因依模罩将一个染色体与另一个染色体互换,亦即随机均等地将两个母代交配成一个子代。
(5)突变(Mutation)。突变过程在基因算法中是一个相当重要的机制,它可以产生前两个步骤(选择、交配)所不能产生的新字符串。突变的意义是母代个体中,部分基因发生改变,增加个体的变化程度,且可避免求解过程陷入局部最佳化,而达到全域最佳化的目的。突变的方式有四种:点突变(Point Mutation)、算术突变(Arithmetic Mutation)、顺序基础突变(Order-based Mutation)以及非均等突变(Non-uniform Mutation)。当初始群体的个体不够优良时,若仅藉由交配方式亦无法得到突破性的优良解,则效仿生物的基因突变,借以创造新的基因组合,以使演化过程朝全域最适解方向前进,用无形的力量牵引突变方式,得到最佳解。
(6)终止条件。演化的过程为一个循环,因此必须设定停止执行的判断,用以表示演化结束。停止的时机通常可以参考两个项目,一个是时间成本,一个是收敛程度。时间成本直接受演化代数影响,若希望演算在可预期的时间内结束,可以将演化代数设为固定值。收敛程度则较为弹性,当某一代的族群染色体的适应值趋近一致的时候,则停止演化。
两者并没有绝对的好坏,可根据需要而选用,亦可同时采用,即演化进行到某个代数前,停止条件参考的是收敛程度,而最多进行到该代数为止,使得演化能在可预期的时间内结束。
4. 倒传递类神经网络(Back-Propagation Network,BPN)。倒传递类神经模式是利用最陡坡降法(Gradient Steepest Descent Method) 的观念将误差函数予以最小化。倒传递类神经网络架构分为三层,分别是输入层(Input Layer)、输出层(Output Layer)及隐藏层(Hidden Layer),每一层均由数个神经单元组成,而隐藏层的数目可以是一层或多层,下图即为单一隐藏层的类神经网络架构。

 

 

 

 

 

在训练方法上,BPN运算的基本原理是运用最陡坡降法。输入层将数据传给隐藏层,经计算与转换后,将结果送至输出层。而在计算网络输出值与目标实际值的差距后,再回传给隐藏层去修正连接键的权值。通过调整权值变动的幅度不断重复地进行,将网络的实际输出值与目标输出值间的误差函数最小化,来达到网络的训练目的,直到误差收敛至预设条件为止,以求得最佳非线性输出对应模式。以下就相关函数形式分述如下:
(1)转换函数。在Logit 回归模式中,反应变量仅有两个可能类别结果,用0与1表示。为使反应变数的估计值均落于(0,1)之间,必须先针对反应变量进行对数转换,以保证几率估计值必落在(0,1)之间。本研究中所采用的转换函数有两个:Yh及Yo。其中,Yh为输入层至隐藏层的转换函数,Yo为隐藏层至输出层的转换函数。此两个函数皆使用罗吉斯转换函数,其公式如下:[Yh=11+e-(zh)]                                     (1)
[Yo=11+e-(zo)] (2) 
其中,Z为罗吉斯转换系数,可被定义为:
[Zi=Xiβ=β0+iβiXij+εi]
其中:Xi为第i个解释变量;Zi为相对应的被解释变量。
(2)误差函数。监督式学习中的误差是指目标值 Oj与网络预测值Dj之间的差距,误差函数的计算方式为输出处理单元与目标值之间差异平方和的一半,代表网络的学习绩效,其公式如下:
[E(w)=12Oj-Dj2] (3)
其中:w代表此网络中所有权重的和;Oj代表第j个神经元的实际输出值,即信用评级的实际结果;Dj代表第 j 个神经元的预测输出值,即类神经网络的预测结果。   
(3)通用差距法则。学习法则的目标就是使上述误差函数最小化,本研究以通用差距法则(Generalized Delta Rule)为学习法则,用其来更新类神经网络权重,以达成此项目标。通用差距法则基于最陡坡降法来使误差函数达到最小,最陡坡降法是指每当输入一个训练样本,即小幅调整网络权值,调整的幅度与误差函数对该网络加权值的敏感程度成正比,也即与误差函数对加权值的偏微分值大小成正比,其基础公式如下:
△Wij=-η∂E/∂Wij (4)
其中:Wij为介于第 n-1 层的第 i 个处理单元与第 n 层的第 j 个处理单元间的权值;η为学习速率,用于控制最陡坡降法最小化误差函数的步幅;△Wij 为通用差距法则所调整的幅度。
(4)倒传递类神经网络的输出函数——击中率(Hit Ratio,HR)。所谓击中率,是指以归类矩阵中预测出的正确结果个数除以总数目,可由归类矩阵中的对角线个案数目除以总个案数得出,详见表2的费雪归类矩阵。
3. 整合基因算法与类神经网络的模型。本研究运用SAS-IML程序指令,自行设计整合基因及类神经网络程序,以建构信用评级模型。在进行实证分析的过程中,首先将类神经网络中的学习率与罗吉斯转换系数设定为一个计算机随机选取的值,再运用基因算法强大的搜寻变量能力,交叉测试不同的演化代数及基因长度的设定,从而找出击中率最高的组合。
首先,比较交叉测试演化代数及选取基因数的不同,以找出击中率最佳的选取准则。在基因组合方面,过去文献对于信用评级所筛选出的重要自变量组合,其数值皆介于5 ~ 10个之间。因为过少的自变量会无法解释模型的关系,过多的自变量会造成解释力降低,故本研究测试基因组合数为5 ~ 10个基因,演化代数设定为1 ~ 700代,以找出击中率最高的染色体。在找出击中率最高的染色体后,依据此最佳击中率求得类神经网络最佳的隐藏层处理单元数(J)、学习率(ηh、ηo)、罗吉斯函数的转换系数(λh、λo) 、调整权重次数(Q)及网络学习次数(N)。
四、实证结果分析
(一)区别分析
1. 逐步区别分析结果。本研究采用逐步选择(Stepwise Selection)方式筛选,以P值小于0.1为选取准则。经由各个待选变量所执行的单因子变异数分析,F值最大所对应的变量首先被选入,其余就所选定的变量判定是否可以被移除,再以所选定的变量作为共变异数,就剩余未被选入的变量执行共变异数分析。选择 F 值最大者作为下一个进入的变量。接着重复前面的方式,互相以另一选定变量为共变异数,以决定是否有选定变量需要被移除。之后继续重复,直到没有新的变量可以再增加为止。
本研究除了财务比率变量,还加入了公司治理变量,一同进行关键指标变量的筛选,其重要性排序及统计量经整理后如表3所示,总共14个变数。

 

 

 

 

 

 

 


以财务比率整合公司治理变量建构区别分析模型,投入的关键变量共14个。为将研究对象之评估等级分为低中高三种风险群组,利用估计出的三个线性区别函数来预测样本所属风险等级。
低风险群组之区别函数:
Z1=-0.41+0.64X2+0.34X19-0.07X20+
0.001X21+0.21X28-0.39X29+0.04X34-0.18X37+
0.19X38-0.16X41+0.13X42+0.14X43-0.13X44-
0.11X51
中度风险群组之区别函数:
Z2=-2.94-2.07X2-0.68X19+0.48X20-0.4X21-
0.39X28+092X29+0.3X34+0.51X37-0.5X38+
0.77X41-0.32X42-0.41X43+0.3X44+0.46X51
高风险群组之区别函数:
Z3=-15.36-1.91X2-4.13X19-1.8X20+2.88X21-
2.85X28+3.75X29-3.16X34+0.99X37-1.37X38-
1.34X41-1.09X42-0.86X43+1.3X44-0.45X51
2. 区别分析实证结果。整合公司治理变量之区别分析模型建构完成后,由表4的归类矩阵结果可知:正确归类的个案数共196个,击中率为89.50%;错误归类之型一误差:低估标的企业之风险,共有17个样本个案风险被低估,错误率为7.76%;型二误差:高估标的企业之风险,有6个财务比率以及公司治理状况评估结果应为健全之个案企业,被归属于中度违约风险,因此错误归类之型二误差错误率为2.74%。

 

 

 


击中率=(162+30+4)/219×100%=89.50%
3. 区别分析模型效度验证。为了验证本研究模型内外部效度,将73家个案企业三年研究期间共219笔资料区分成建构模型之2013 ~ 2014年间146个数据的训练样本,以及2015年73个数据的测试样本。其中训练样本为模型已知的数据,因此分类正确之能力即为内部效度的评估依据;测试样本则为模型未知的数据,以此得出模型之外部效度。表5及表6分别就训练样本与测试样本的区别模型进行了验证汇总:    

 

 

 

击中率=(97+24+3)/146×100%=84.93%

 

 

 

击中率=(50+9+2)/73×100%=83.56%
由上述两表得知,以区别分析法建构的信评预测模型中,内部效度146个样本个案,正确归类的个案数有124个,击中率为84.93%;而对模型未知的样本数据,预测准确的比率为83.56%,也就是区别分析信评预测模型的外部效度。由此可说明,此模型对于信评预测之内外部效度皆达到一定水平。
(二)基因类神经网络模型
鉴于当类神经网络模式学习时间较长且输入层变量太多时有不易收敛的缺点,本研究在进行实证分析的过程中,运用SAS 8.2之IML程序指令,以基因算法强大的搜寻变量能力,采用经验法则及试误法,交叉测试不同之演化代数及基因长度之设定,以更有效地从中选取对信评结果贡献较大的变量作为类神经网络的输入层变量,以提供类神经网络学习良好之起始值,再利用BPN进行数据分析,以寻求较佳的分类预测效果。 
1. 最佳演化代数及基因长度。为了提供类神经网络学习良好之起始值,本研究采用基因算法建立筛选变量的准则,以之前通过逐步区别分析选取具区别力之变量为筛选范围,采用经验法则及试误法,交叉测试不同的演化代数并设定基因长度。为了更有效地从中选取对信评结果贡献性较强的变量,本研究测试演化代数为1 ~ 1000代,基因长度则设定为5 ~ 10个基因数目,交叉测试找出最佳演化代数与最佳基因选取个数组合下击中率最高之输入变量组合。测试结果为当演化代数为500代、基因长度设为9时,击中率达91.43%,模型解释能力为71.52%。
2. 基因筛选后之关键变数。在上述最佳演化代及基因选取组合下,利用基因算法筛选出关键变量共9个,被选取的顺序分别为X29净值成长率、X42董监持股质押比例、X38机构投资人持股比例、X34常续净利成长率、X2净值报酬率(税后)、X21现金流量允当比率、X41内部人持股比例、X51信息披露、X43董事会规模,代表相应变量对信评结果影响之重要性程度由强至弱。其中财务比率指标有四个变量获选,公司治理指标对信评结果有过半数之解释力。

 

 

 

 

 

3. 模型击中率。表8为总样本的信评风险预测之分布情形。在本研究建构的类神经网络模型中,准确击中率达90.41%。

 

 

 

击中率=(162+32+4)/219×100%=90.41%
4. 最佳参数设定。在倒传递类神经网络模型之运作中,网络学习通过不断反向传递修正输入层、隐藏层与输出层间的连接值,由SAS-IML程序中仿真挑选出最佳的击中率,也就是在演化代数为500代、基因数目为9、模型击中率最高时的参数组合。最终建构完成模型之参数内容,其重要参数之结果呈现如表9。其中,ηh及ηo分别为隐藏层及输出层之学习率;而λh及λo分别为隐藏层及输出层之罗吉斯转换系数。

 

 

5. 基因类神经模型效度验证。由表10可知,以基因演算及类神经网络方法建构的信评预测模型,其内部效度146个样本个案的分类击中率,正确归类的个案数有130个,击中率为89.04%;而对模型未知的样本数据,预测准确之比率为87.67%,如表11所示,也就是基因类神经信评预测模型之外部效度。由此亦可说明此模型对于信评预测之内外部效度皆达到了一定水平。

 

 

 

击中率=(101+29+0)/146×100%=89.04%

 

 

 

击中率=(53+10+1)/73×100%=87.67%
(三)实证结果汇整
本研究为了测试使用不同的分析工具建构信评预测模型是否会影响预测的能力,同时使用了区别分析和类神经网络建构模型。在实证分析中,分别针对两个模型的三年研究期间的219个总样本、研究期间前两年的146个训练样本、研究期间最后一年的73个测试样本,比较实际评级值与本模型预测的评级值所属的风险类别是否存在误差。本研究通过计算其击中率来进行评估,为了更加清楚地进行比较,现将实证结果整理如表12:

 

 

以上实证结果表明,在预测公司发生危机的方法上,类神经网络模型的准确率在内外部效度上皆高于区别分析模型;在变量选取方面,区别分析选取了14项比率变量建构模型,而类神经网络模型则选取了9项比率变量建构模型,且整体模型之解释力及准确度皆高于区别分析模型。由此可发现,应用基因类神经网络建构出的信用评级模型有较佳的预测效果。
五、结论与建议
本研究以2015年中国市值前百大企业为研究对象,并整合了公司治理指标建构信评预测模型。模型建构的方式为,首先用逐步区别分析以及基因算法对两类变量进行关键变量之筛选,再分别用区别分析及基因类神经网络建构预测模型,并以击中率来检验模型的预测效果。实证结果为:使用逐步区别分析所筛选出具区别力的14个变量中,包含8个财务比率变量以及6个公司治理变量;在最佳演化代数及基因选取组合下,使用基因算法筛选出的9个关键变量中,公司治理指标则占5个。换言之,公司治理变量占全体关键变量组合接近一半甚至以上之比例,足以证明公司治理的确是评估企业风险不可忽视的警讯指标。加入公司治理指标建构模型,的确能提升整个模型的完整性以及对信评结果预测及分类的能力。
在比较区别分析及类神经网络模型的预测能力方面,类神经网络信评预测模型在模型整体之效度(击中率90.41%)、内部效度(击中率89.04%)、外部效度(击中率87.67%)方面,皆高于区别分析模型。此外,在两个模型之投入变量中,区别分析模型利用了14个变量进行预测,而类神经网络更进一步地从中选取出9个变量。从投入产出方面来说,类神经网络模型以较少的投入变量建构模型,且整体产出得到更佳的结果。   
本研究以2015年中国市值前百大企业为研究对象所建构的跨产业的信评预测模型,虽然可被广泛地运用于许多产业,但没有依据产业不同而对变量选择做出区别,可能对本研究建构之模型准确度造成偏误。而样本比例偏重低风险样本,对于记忆式学习的类神经网络而言,是一大挑战,将影响模型对中、高、低等级个案的预测能力。而对于性质偏属低风险等级的百大企业而言,若模型将高风险的样本误判为低风险,是相对严重的错误。故建议后续研究可依选定的产业性质,加入合适的解释变量,以开展更为详尽的探讨。

主要参考文献:
陈超,郭志明.我国企业债券融资、财务风险和债券评级[J].当代财经,2008(2).
陈小悦,徐晓东.股权结构、企业绩效与投资者利益保护[J].经济研究,2001(11).
何平,金梦.信用评级在中国债券市场的影响力[J].金融研究,2010(4).
Altman,E. I..Financial Ratios,Discrimination Analysis and the Prediction of Corporate Bankruptcy[J].Journal of Finance,1968(23).
Altman,E. I.,G. Macro,F. Varetto. Corporate Distress Diagnosis:Comparison Using Linear Discriminate Analysis and Neural Networks(The Italian Experiences)[J].Journal of Banking and Finance,1994(18).
Bhojriaj,S., P. Sengupta. Effect of Corporate Governance on Bond Ratings and Yields:The Role of Institutional Investors and the Outside Directors[J].The Journal of Business,2003(16).
Boardman C.,R. McEnally. Factors Affecting Seasoned Corporate Bond Prices[J].Journal of Financial and Quantitative Analysis,1981(16).
Coats P.K., L.F. Fant. Recognizing Financial Distress Patterns Using a Neural Network Tool[J].Financial Management,1993(22).
Hollis,A.,W. C. Daniel,L. Ryan. The Effects of Corporate Governance on Firm"s Credit Ratings[J].Journal of Accounting and Economics,2006(12).
Kim,K.-S., I. Han. The Cluster-indexing Method for Case-based Reasoning Using Self-organizing Maps and Learning Vector Quantization for Bond Rating Cases[J].Expert Systems with Applications,2001(21).
Lamy R.,R. Thompson. Risk Premia and the Pricing of Primary Issue Bonds[J].Journal of Banking and Finance,1988(12).