【作 者】
张国政1(副教授),姚 珍2,杨亦民3(博士生导师)
【作者单位】
湖南农业大学商学院,长沙410128
【摘 要】
【摘要】虽然现阶段应用于信用风险评价的方法较多,但在农户小额信贷风险的评价上,有针对性的定量分析还较少。鉴于此,运用Logistic回归方法,对永州市某商业银行的200个农户小额贷款相关数据进行定量分析,结果显示,影响农户个人信用风险的主要因素是借款人年龄、家庭人数、劳动力人数、居住价值、行业分类、家用电器价值和年收入,并在此基础上建立了农户个人小额信贷信用评分模型。
【关键词】农户;小额信贷;Logistic回归;风险评估;个人信用评分
【中图分类号】F830.58 【文献标识码】A 【文章编号】1004-0994(2016)27-0063-4一、引言
我国农业人口规模大,资金问题一直是一块抑制农村经济发展的短板,且在很大程度上制约了农户个人收入和农村整体经济的增长速度。小额信贷业务始于 20 世纪 70 年代的巴西和孟加拉国,最初的小额信贷机构为非政府组织,由当地政府和公共机构出资设立。发展至今,已成为一种帮助低收入者扩大生产经营规模、为农业的良好发展提供资金支持与服务的重要方式。然而,由于农户小额贷款的信用风险评估体系极不完善,导致农村金融风险管理环节薄弱,不利于推动农业的现代化、集约化发展。
本文基于某国有商业银行200个农户小额贷款相关数据,使用交叉表对变量指标进行筛选,然后采用Logistic回归方法探究影响农户还贷风险的影响因素,最后基于Logistic回归模型构建了农户小额信贷的信用评分模型。
二、文献回顾
农村小额贷款是支持“三农”金融扶贫中的先行者,在国家的鼓励和支持下,农村小额贷款公司已逐渐成为农村金融体系的“毛细血管”(段一群和曹玲,2013)。但是,由于农村信用基础薄弱,农民风险控制能力有限,且结合农户在小额信贷中以信用作为主要的风险管理手段、不需要抵押担保等特点,使得商业银行、农村信用社等金融机构在贷款过程中面临较大的风险(张英,2014;熊芳和潘跃,2015)。农户违约现象时有发生,使得农户小额信贷不良还款比率持续位居“榜首”,很大程度上影响了普惠金融贷款的整体质量,阻碍了小额信贷在农村金融体系中的可持续健康发展(梁丹丹, 2014)。因此,建立具有较强科学性和适用性的农户小额信贷信用风险评估模型,是现阶段的重要任务(扈文丽和高铭,2012)。
(一)小额贷款信用风险评估方法
谭民俊、王雄和岳意定(2007)以及戴立新、李泽红和杨方文(2008)将层次分析法和模糊模式相结合,对小额贷款的信用风险进行了评价。李婷婷(2014)基于遗传算法构建了个人信用组合评估模型,对贷款者个人信用风险进行了评估。魏岚(2013)构建了定性和定量分析相结合的小额信贷风险评价模型。张国政、陈维煌和刘呈辉(2015)构建了基于Logistic的商业银行个人消费信贷风险评估模型。
(二)农户贷款风险影响因素
谭飞燕和李孟刚(2014)从农户个体、家庭特征、项目生产经营状况方面选取指标,构建有序Logistic模型和Tobit模型分别检验了影响农户信贷的主要因素,结果表明项目规模、家庭收入等因素的影响比较显著。罗雨柯和符刚(2015)研究显示,农户的户主年龄、家庭劳动力人数、长期在外打工人数、资产总值、社会评价和行为信用记录等对于小额信贷的获得具有显著影响。李菲雅(2014)研究发现,除户主个人特征、家庭人口构成等内在因素对贫困农户借款行为影响显著外,农村金融供给状态也是重要的外在性影响因素。潘雅琼和宋泽群(2015)研究发现,家庭劳动力人数和家庭总资产与农户贷款信用风险呈显著负相关关系。朱莹和吕德宏2015)运用 Logistic模型识别农户小额信贷信用风险影响因素,结果表明不同类型农户小额信贷信用风险影响程度存在显著差异。
由以上分析可知,科学、有效的信用评价模型的构建,有利于金融机构对贷款申请者个人信用状况进行预测判断,进而做出贷款发放决策。现阶段,信用风险评估方法虽然较多,但在农户小额信贷评估方面的定量分析还较少。综合目前农村小额信贷市场的风险影响因素、指标的筛选,我们发现选取合适的模型进行定量分析仍是现阶段研究的一个难点。
三、Logistic回归分析
日常生活中,如果我们认定一个事物是由另外几个事物引起变化时(此处我们称为“自变量”和“因变量”),就会寻找办法将自变量和因变量的关系用一个公式表示出来(张国政、陈维煌和刘呈辉,2015)。例如,因变量Y是由自变量x1,x2,x3,…,xn引起变化的,这时我们就要想办法找到参数集β0,β1,β2,β3,…,βn使得自变量和因变量满足关系式Y=β0+β1x1+β2x2+β3x3+…+βnxn,这种寻求参数的方法叫做线性回归。由于自变量有多个,因此被称为多元线性回归。在应用统计学中,我们用最小二乘法来解决这个问题。但是,我们在研究经济变量时,有时因变量Y并不是一个连续型变量,例如Y是一个二分类变量(yes or no)。这时最小二乘法在这里便会失效。Logistic回归模型就是研究因变量非连续型变量情况的分析模型。其中,解决这个问题的核心方法称为极大似然估计法。下面将进行详细介绍:
(一)建立一般线性模型
E(Y)=β0+β1x1+β2x2+…+βkxk (1)
对于0-1变量Y(此处为Y取0或者1),E(Y)=P(Y=1)=P
式(1)可以用来预测Y=1的概率:
P=β0+β1x1+β2x2+…+βkxk+ε (2)
(二)为简化模型的复杂程度,对P进行Logit变换
Logit(P)=Ln(P/1-P)
Ln(P/1-P)=Logit(P)=β0+β1x1+β2x2+…+βkxk+ε
(3)
odds(优势)=[P1-P],该值表示事件发生与不发生的概率之比。
所以:Ln(odds)=Logit(P)=β0+β1x1+β2x2+…+βkxk+ε
则当xi增加一个单位时:
Ln(odds/xi+1)=Ln(odds/xi)+βi
Ln(odds/xi+1)-Ln(odds/xi)=βi
[Lnodds/xi+1odds/xi=βi][⇒][odds/xi+1odds/xi=eβi]
由此,可以得到逻辑回归关于P{Y=1|x}的预测。即通过在x的情况下Y=1的概率大小,判定Y取0还是取1。通常以0.5为界,若P的估计值大于0.5,取1;若P的估计值小于0.5,则取0。
(三)极大似然估计
设Y是0-1变量,x1,x2,…,xk是与Y相关的自变量,n组观测数据为(xi1,xi2,…,xik,y1)(i=1,2,…,n),则y1,y2,…,yn的似然函数为:
L=[i=1np(yi)=i=1np(xi)yi1-p(xi)1-yi]
等式两边同时取自然对数:
等式两边分别对β0,β1,β2,…,βk求偏导数,使得似然函数的取值最大,得到β0,β1,β2,…,βk的估计值 。
在农户小额贷款中,我们把因变量Y定义为:Y=0代表违约客户,Y=1代表非违约客户。在模型中,如果某客户得到的P的估计值小于0.5,则该客户被认为是违约客户,即Y=0,反之则Y=1。根据实践调查发现,商业银行在进行客户的贷款申请录入时,比较重视借款人的年龄、受教育程度、家用电器价值、个人月收入等基本信息。
四、实证分析
(一)数据来源及变量的筛选
本文通过数据调查得到湖南省永州市内某国有大型商业银行200个农户小额贷款的相关数据,剔除一些由于操作人员失误而明显错误的数据,最终得到166个有效数据。其中履约客户数为158,违约客户数为8。候选指标如表1所示:
在影响农户信用状况的指标中,有哪几个应该被选入信用评分模型、哪几个指标应该被剔除,不作为研究个人消费贷款违约情况的考虑因素。如表1中,在166个农户小额贷款数据中,贷款的金额全部为5万元,这就说明贷款金额是非影响因素,在研究中应该剔除。在应用统计学中,通常用交叉表来初步分析自变量和因变量的关联性,下面将使用该工具进行初步统计,计算优势,详见表2。
由表2可以看出,随着年龄的增大,履约客户比呈现增长趋势,这说明年龄越小、个人违约风险越小,年龄越大、违约风险越大。但是,农户的还款风险中年龄与个人的其他因素也有关,如由于劳动能力不同而收入层次不同等,因此不能一概而论。由文化程度指标可以看出,受教育程度越高,个人信用违约风险越小,反之越大,所以受教育程度是一个重要因素。家庭人数的优势比可以看出,家庭人数越多,个人信用违约风险越小,反之越大,所以家庭人数是一个重要因素。劳动力人数越多,履约客户的比率呈上升趋势,这说明借款人的家庭劳动力人数越多,还款风险越小。耕地面积越小履约客户优势越大,这说明耕地面积越大,还款风险越大,耕地面积情况是本文应该考虑的因素。居住条件好的贷款履约率要高于居住条件差的贷款履约率,这说明居住条件越差,违约风险越大。家用电器价值越低,违约率越高。因此,家用电器价值应该纳入回归模型。年收入越低,违约率越高。因此,年收入应该纳入回归模型。
综上所述,在初步筛选中,由于贷款金额都为5万元,因此本文将贷款金额指标剔除。进入模型的指标为年龄、文化程度、家庭人数、劳动力人数、耕地面积、居住价值、行业分类、家用电器价值、年收入。
(二)建立Logistic个人信用评分模型
当引入模型中的指标时,若为数值型变量则直接引入模型,若为非数值型变量则应该事先进行量化以进入模型。量化过程如表3:
在使用SPSS软件进行Logistic回归分析时,为了避免“虚拟变量陷阱”,虚拟变量个数比该项总指标数要少一个。每个虚拟变量赋值为0或1。“文化程度、行业分类”的赋值原则为,若其中一项赋值为1,则其他为0。例如:如文化程度1=1,则文化程度2和文化程度3均赋值为0;如行业分类4=1,则行业分类1、行业分类2和行业分类3都赋值为0。
在之前的筛选中,只是对变量进行初步筛选,这里还需要利用统计软件进行进一步筛选,SPSS运算结果显示如表4所示:
通过显著性水平检验(如表4),我们发现通过检验的指标为年龄、家庭人数、劳动力人数、居住价值、行业分类、家用电器价值和年收入七个指标。在本次实验中,从方程中剔除的指标是“文化程度”和“耕地面积”。根据以上结果,可以得到Logistic回归方程为:
Ln[P/(1-P)]=Logit(P)=-1.472+0.154×年龄-1.869×家庭人数+1.023×劳动力人数+0.414×居住价值+0.495×行业分类-11.209×家用电器价值+5.585×年收入
在模型中,得到Logit(P)的方式为客户所属的虚拟变量为1时则用1代入,为0时则用0代入,数值变量直接代入方程。基准分的评定:具体方法是设履约客户发生比为1∶1时的分数为50,当履约客户发生比为2∶1时信用分数增加20分。
信用分数=50+20×Ln[P/(1-P)]/Ln2
各项指标信用分数如表5所示:
个人信用评分=35.1+68.2×年龄+37.7×家庭人数+62.3×劳动力人数+48.1×居住价值+49.3×行业分类+14.9×家用电器价值+86.3×年收入。农户信用评分方法是某借款人的以上指标为真时,则取1;为假时,则取0代入上式。
五、结论
通过建立模型与实证分析,在初步筛选的9个变量中,有借款人年龄、家庭人数、劳动力人数、居住价值、行业分类、家用电器价值和年收入7个变量在0.05的水平上显著。因此本文认为影响个人信用风险的主要因素是借款人的年龄、家庭人数、劳动力人数、居住价值、行业分类、家用电器价值和年收入,这对农村商业银行及农村信用社或金融机构的授信业务有一定的参考价值。在模型的运行过程中,“文化程度”指标被剔除。从实际情况分析,可能是因为农户绝大多数学历不高,所以该指标对于农户信用风险没有显著影响。 “耕地面积”这一指标也被剔除,可能是因为现在农户的主要收入来源于非农业。
从表5的信用分数分配情况来看,可以总结出在这七项显著性影响因素中,借款人的“劳动力人数”、“家用电器价值”和“年收入”三项指标所占权重较大,是最主要的影响因素。从实际情况看,劳动力人数少的违约风险明显高于劳动力人数多的,这是因为劳动力人数多的家庭年收入普遍较高,还款概率较高。在“家用电器价值”这一指标中,可以认为使用的家用电器价值较高的农户生活水平普遍较高,那么还款率相对较高。在“年收入”这一指标中,年收入高可以反映农户家庭总体资金压力比较小,所以还款的可能性也会大大提升。在表5的信用评分中,劳动力人数和年收入信用分数分别为62.3和86.3,相对其他变量数值较高,可见该信用评分模型具有一定的准确性。
由于数据采集地点仅在湖南省某市的国有大型商业银行,且样本数为200,使得本文的研究结果具有一定的局限性。因信贷约束状况也存在明显差异,与中西部地区相比,东部地区农户面临的信贷约束可能更加严重(谭飞燕、李孟刚和吴伟,2015)。但是在当前国内农村区域经济发展水平较一致的情况下,此方法应用前景仍十分广阔。
主要参考文献:
段一群,曹玲.天气灾害小额保险与农村小额贷款的合作效用分析[J].统计与决策,2013(24).
张英.农村金融系统对农村居民生活状况影响的实证评价[J].统计与决策,2014(5).
李婷婷.基于遗传算法的个人信用风险组合评估研究[D].成都:电子科技大学,2014.
梁丹丹.发展农户小额贷款 助推新农村建设[J].农业经济,2014(3).
扈文丽,高铭.农村信用社小额信贷的风险管理及对策[J].中国集体经济,2012(21).
谭民俊,王雄,岳意定.FPR-UTAHP 评价方法在农户小额信贷信用评级中的应用[J].系统工程,2007(5).
戴立新,李泽红,杨方文.农户小额信用贷款风险及评价研究[J].科技和产业,2008(3).
魏岚.农户小额信贷风险评价体系研究[J].财经问题研究,2013(8).
张国政,陈维煌,刘呈辉.基于Logistic模型的商业银行个人消费信贷风险评估研究[J].金融理论与实践,2015(3).
谭飞燕,李孟刚,吴伟.我国农户信贷约束及其影响因素分析[J].统计与决策,2014(21).
罗雨柯,符刚.农户小额信贷可获得性的影响因素实证分析——基于四川省兴文县农信社的调查数据[J].农村经济,2015(9).
李菲雅.NGO小额信贷对农户借款决策、借款额度影响因素的实证分析——基于河北省7县822个农户的调查[J].经济经纬,2014(2).
潘雅琼,宋泽群.农户贷款信用风险影响因素的实证研究[J].会计之友,2015(23).
朱莹,吕德宏.不同类型农户小额信贷信用风险影响因素研究——基于Logistic-ISM模型的实证分析[J].浙江金融,2015(6).