2017年
财会月刊(5期)
财经论坛
怎样识别P2P网贷问题平台

作  者
高 波1(博士),任若恩2(教授)

作者单位
1.北方工业大学理学院,北京100144;2.北京航空航天大学经济管理学院,北京100191

摘  要

    【摘要】在P2P网贷行业迅速发展的同时,问题平台的数目也不断增多。本文通过比较正常平台和问题平台的经营信息,研究能够成功区分两类平台的指标和模型。结果发现:在14个经营指标中,人均借款金额、投资人HHI等指标的识别效果较好;SVM模型、Logit模型、判别分析模型的识别能力依次递减;问题平台的业务局限在较小的范围内,没有得到较多投资人和借款人的认可。因此,投资者应该选择广为人知的平台,经营者需要拓展平台的投融资渠道,监管者应该监控活跃度不高的平台。
【关键词】P2P网贷;问题平台;识别模型;识别指标
【中图分类号】F830      【文献标识码】A      【文章编号】1004-0994(2017)05-0124-5一、引言
我国的P2P网贷行业发展很快,但是问题平台占有很高的比例。宜信和拍拍贷分别成立于2006年和2007年,属于我国最早的一批P2P网贷平台。截至2015年9月,我国正常运营的平台已有2417家,参与人数13.3万人,贷款余额77.1亿元。但是,我国的问题平台累计已经达到1031家,仅2015年9月就新增问题平台55家,而问题事件主要表现为跑路、提现困难和停业,其中跑路占一半以上,部分还涉及恶意经济诈骗。
为此,我国政府出台了一系列文件,引导和规范P2P网贷行业的健康发展。例如:《关于促进互联网金融健康发展的指导意见》指出,“P2P网络借贷平台作为信息中介,可以为投资方和融资方提供信息交互、撮合、资信评估等中介服务”。它还支持互联网企业依法合规设立网贷平台,禁止网贷平台从事非法集资活动。《非银行支付机构网络支付业务管理办法》限制P2P网贷平台和非银行支付机构进行第三方支付合作。《最高人民法院关于审理民间借贷案件适用法律若干问题的规定》确定了受法律保护的贷款利率上限。
在这种背景下,本文通过搜集P2P网贷平台的经营指标,利用它们比较正常平台和问题平台的经营状况,寻找有效区分两类平台的指标和模型。这些探索将有助于运营者明确平台的风险点,降低平台的风险水平;有助于投资者选择相对安全的投资平台;有助于监管者制定完善、有效、易行的行业管理条例。
本文的创新点主要体现在三个方面:第一,研究P2P网贷平台的风险水平和投资价值,适应了经济社会发展的需求,摆脱了依托平台研究借款人信用风险的框架。第二,广泛收集了P2P网贷问题平台的经营信息,选择数据全面的32家问题平台作为样本,运用14个经营指标比较其和正常平台的差异。第三,综合运用三种常见的分类模型:判别分析模型、Logit模型和SVM模型,并且按它们对问题平台的识别能力进行了顺序排列。
二、文献综述
在P2P网贷平台,借款人需要充分披露项目信息,减少信息不对称问题。Larrimore等(2011)认为,借款人应当润色其语言,充分运用定性和定量的语言多角度地详细介绍项目前景、资金用途等信息,这样才更容易从P2P网贷平台筹得资金。Chen等 (2014)和Tang等(2014)指出,为了增强贷款人的信任感,借款人应该清晰地描述其贷款用途。Yang (2014)通过研究借款人的照片信息和他们的信用等级、融资数量的关系,发现评级较高的借款人能够借到更多的资金。
P2P网贷的借款人需要维护和提升自身的信誉水平。Herzenstein等(2011)认为借款人的信誉等信息会影响贷款人的放款意愿。Yum等(2012)指出,小微企业会努力维持其优秀的信誉,以便在平台上多次获得贷款。Duarte等(2012)发现,看起来信誉更好的借款人获得贷款融资的可能性更大,并且他们的确具有较高的信用评分和较低的违约率。Lin等(2013)发现,借款人的朋友越多,融资成功的概率越大,贷款的利率越低,事后的贷款违约率也越低。Xu等(2015)指出,在中国社会资本主要影响融资的可得性,而在美国社会资本主要影响融资的利率。
P2P网贷信用风险的影响因素。Emekter等(2015)认为P2P网贷的违约率取决于借款人的信用等级、债务收入比、FICO评分和还款期限等。肖曼君等(2015)指出P2P网贷的信用风险主要与借款人的个人特征、信用变量、历史表现和借款信息等有关。傅彦铭等(2014)发现,P2P网贷的状态主要有7个影响因素,分别是贷款金额、贷款期限、贷款利率、信用等级、工作时间、房产情况、年度收入。
P2P网贷平台的等级评估。一些门户网站做了大量基础性、探索性的工作,但是相关的学术论文还比较少见。网贷之家选择成交积分等9个指标、运用加权法确定平台的等级。网贷天眼选择投资指数等9个指标,运用多元线性模型确定平台的等级。冯旭日和韩晶晶(2014)采用网贷之家的早期评价指标,运用费歇判别法确定平台的等级。郭海凤和陈霄(2015)选择成交金额、营收额等15个评价指标,采用因子分析法确定平台的等级。
综上所述,P2P网贷的文献主要研究借款人的哪些做法有助于提高融资成功率,部分文献也探讨了P2P网贷的信用风险、P2P网贷平台的评级问题。但是,针对平台频繁出现的问题事件,怎样识别P2P网贷问题平台,寻找平台的安全管理办法,才是更为重要和迫切的任务。
三、识别指标和模型
P2P网贷的问题平台在运营期间和比较优秀的平台会存在一定差距,这种差距将表现在它们的经营指标上。本文全面搜集了P2P网贷平台的经营指标,以其作为问题平台的识别指标。这些指标包括:成交量、利率、历史待还金额、资金净流入、投资人数、借款人数、人均投资金额、人均借款金额、借款标数、平均借款期限、待投资人数、待还款人数、投资人HHI、借款人HHI。其中:历史待还金额指历史累计投标金额减去历史累计还款金额;资金净流入指所有投标金额减去所有还款金额;待投资人数指尚未收回投资的投资人数;待还款人数指尚未还款的借款人数;投资人HHI表示平台资金来源的分散程度;借款人HHI表示平台资金运用的分散程度。
确定事物的类别通常应用三类模型:判别分析模型、二元选择模型和智能分类模型。本文将依次应用这三类模型识别问题平台,并且比较它们的区分效果。在判别分析模型里,本文主要考虑费歇判别法和逐步判别法;在二元选择模型里,本文主要考虑Logit模型和逐步回归法;在智能分类模型里,本文主要考虑比较新颖的SVM模型。
1. 费歇判别法。判别分析根据人们选择的解释变量预测某个个体的所属类别。费歇判别法是一种常用的判别分析方法,它为样本数据寻找了一个投影方向,使得样本的投影能够尽量划分到不同的组。
假设m个样本来自k个组,a是一个n维向量。以a为法线方向,m个样本的投影的组间平方和SSG=a"Ba,组内平方和SSE=a"Ea,如果k组均值存在显著差异,那么△(a)=a"Ba/a"Ea应该充分大。此时,a等于特征方程|B-λE|=0的最大特征根的特征向量。
而逐步判别法通过适当筛选变量,判断哪些指标是主要因素,适用于指标较多的判别问题。筛选变量的方法多种多样,其中,最为常用的是维尔克斯统计量。假设X1,X2,…,Xn表示n个变量,Λ表示维尔克斯统计量。首先,从n个变量里选出一个Λi最小的变量,假设为X1。其次,从剩余变量里选择一个变量,使得它和X1的组合的Λ1i最小,假设为X2。这样重复进行下去,直至新加入的变量不能提供新的信息。选中的变量将被用于构建费歇判别函数。
2. Logit模型。Logit模型是一种常见的二元选择模型,通常被应用于研究某一事件是否发生等问题。在Logit模型里,被解释变量Y只有两个取值,例如1表示事件发生,0表示事件没有发生。为了研究离散的被解释变量,引入随机变量效用U。假设
          ,其中,   表示Y=1对样本i的效用,
    表示Y=0对样本i的效用。此时,    将是一个连续变量,并且         表示事件在样本i上发生,
表示事件在样本i上不会发生。
   和解释变量X1,X2,…,Xn的计量模型为:

其中,β1,β2,…,βn表示系数,β0表示常数,下同;ε表示残差。如果ε服从逻辑分布,那么上述模型就是Logit模型。β1,β2,…,βn通常采用极大似然估计。它的似然函数比较复杂,表达式为:
L=     [F(β0+β1Xi,1+…+βnXi,n)]yi[1-F(β0+
β1Xi,1+…+βnXi,n)]1-yi
其中,L表示似然函数;X表示解释变量;F表示释变量逐渐增多时,协方差矩阵可能成为奇异阵,这时的参数估计将不再有效。
本文应用逐步回归法,解决协方差矩阵属于奇异阵的问题。首先研究模型中只有一个解释变量的情况,然后每次向模型里增加一个解释变量。在每一步中,本文都选择拟合优度最好的模型,直至模型的拟合优度增加值小于1%,或者所有的协方差矩阵都是奇异矩阵。
3. SVM模型。SVM模型是一种常用的智能分类模型,运用少量样本就能达到良好的分类效果。如果样本存在线性边界,就通过寻找边距最大的超平面,达到最好的分类效果。如果样本没有线性边界,就把样本变换到新的空间,寻找它们在新空间的线性边界。位于边界上的样本被称作支持向量。
当样本存在线性边界时,假设其表达式为
w∙x+b=0,其中,w表示系数向量。通过最小化目标函数f(w)=[12w2]+C([i=1mξi])k,得到w的最优解[i=1mλizixi]。其中,ξi表示松弛向量,C和k表示惩罚项,m表示样本的个数,λi表示拉格朗日乘子,zi表示样本类别。然后,再根据          的符号,判断样本xj的类别。
当样本不存在线性边界时,假设w∙Φ(x)+b=0,用来表示它们在新空间的线性边界,其中,Φ表示变换函数。此时,w的最优解为[i=1mλizi]Φ(xj)。判断样本xj的类别时,需要计算点积Φ(xi)∙Φ(xj),这个点积等于xi和xj的核函数K(xi,xj)。常见的核函数包括线型核函数、多项式型核函数、径向基型核函数和神经网络型核函数等,它们的表达式依次为:
K(xi,xj)=axi∙xj+b
K(xi,xj)=(1+xi∙xj)p
K(xi,xj)=exp(-  xi-xj   2/2σ2)
K(xi,xj)=tanh(k1xi∙xj+k2)
其中,xi,xj表示样本;  xi-xj  2表示xi和xj的欧式距离;tanh表示双曲正切函数;σ、a、b、p、k1、k2均表示参数。
四、实证分析
1. 样本数据。本文的数据来源于网贷之家,它是P2P网贷平台最全面的信息披露网站。截至2015年9月10日,网贷之家共记录了894家P2P网贷问题平台的信息,293家P2P网贷正常平台的信息。在问题平台里,运营时间为0 ~ 5个月的占比最高,为54.81%;在正常平台里,运营时间为11 ~ 20个月的占比最高,为47.70%。
在网贷之家,只有32家问题平台的披露指标和正常平台相同。因此,本文选择这32家平台作为问题平台的样本,它们依次是聚融贷、国瑞财富、恒艳财富、融合天下、缑城贷、金蝶理财、壹投资、锦煜贷、商贸财富、天天投、互益贷、天勤在线、友禾创投、武汉贷、上咸BANK、众合贷、渝商创投、中贸易融、中汇在线、鸿商贷、美冠信投、里外贷、融易信、莱商贷、加诚贷、闽昌贷、美贷网、通融易贷、速可贷、工商贷、盛融在线、畅贷网。
本文选择32家综合得分最高的P2P网贷平台作为正常平台的样本,它们分别是陆金所、人人贷、宜人贷、拍拍贷、投哪网、微贷网、积木盒子、开鑫贷、有利网、鑫合汇、易贷网、和信贷、翼龙贷、爱钱进、银客网、你我贷、生菜金融、信融财富、红岭创投、合拍在线、PPmoney、珠宝贷、银湖网、温商贷、金开贷、团贷网、链家理财、前海理想金融、小牛在线、人人聚财、银豆网、鹏金所。
2. 描述性统计。首先,本文比较问题平台和正常平台的各项识别指标的均值,计算结果见表1。从识别指标的符号看,两类平台在资金净流入和投资人HHI上的均值存在显著差异;从识别指标的比值看,两类平台在借款标数、人均借款金额等指标上的均值差别较大。这表明问题平台没有得到投资者的认可,资金净流入为负,其投资人集中在有限的几个人;也表明问题平台没有得到融资者的认可,没有多少项目到问题平台融资。问题平台把有限的资金借给少数几个人,可能存在资金使用不规范的问题。

 

 

 

 

 

 


然后,本文比较了问题平台和正常平台的各项识别指标的标准差,计算结果如表2所示。从识别指标的比值看,两类平台在投资人HHI、人均借款金额、借款标数、资金净流入等指标上的标准差均差别较大。

 

 

 


最后,本文运用减去均值、除以标准差的方法,标准化识别指标的取值,以避免它们的单位影响其识别能力。
3. 费歇判别法的效果。在采用所有的识别指标时,费歇判别法的判别函数的估计结果如下:
Y=0.69X1-0.57X2-0.07X3+0.04X4-0.57X5+0.32X6-0.60X7-0.29X8-0.19X9+0.94X10+0.67X11+0.09X12+0.07X13-0.25X14
对于32个问题平台,这个判别函数成功识别31个,误判1个;对于32个正常平台,这个判别函数也成功识别31个,误判1个。因此,这个判别函数的识别成功率为96.9%。
在采用逐步判别法时,费歇判别法的判别函数的估计结果如下:
Y=0.77X2-0.58X5+0.46X8
其中,X2、X5、X8分别对应利率、投资人数和人均借款金额。
对于32个问题平台,这个判别函数全部成功识别;对于32个正常平台,这个判别函数成功识别30个,误判2个。因此,这个判别函数的识别成功率也是96.9%。
两个判别函数虽然形式不同,但是具有相同的识别成功率。这表明利率、投资人数和人均借款金额是判别分析里识别能力最强的指标。
问题平台利率较高、投资人数较少、人均借款金额较多,这表明问题平台的经营管理能力有限,只能通过较高的利率吸引投资人,还把大量资金投向少数几个人。这必然会增加平台的资金成本和回收压力,进而增加平台倒闭的概率。
4. Logit模型的效果。首先,以所有的识别指标作为Logit模型的解释变量,结果发现人均借款金额存在完全识别问题。即只要人均借款金额大于等于1500万元(标准化后的数值为-0.3147)的平台就属于问题平台,否则就属于正常平台。
其次,从解释变量中剔除人均借款金额,但是保留所有其他的指标,这时的协方差矩阵属于奇异矩阵,得到的参数估计仍然是无效的。
然后,采用逐步回归法建立和估计Logit模型,最终得到的估计结果如下:
Y∗=88.29-33.65X3+408.24X13-24.60X10
其中,X3、X13、X10分别表示历史待还金额、投资人HHI和平均借款期限。
这个模型的拟合优度为0.94,回归系数能够通过t检验。对于32个问题平台,这个模型的预测结果和实际结果完全一致。对于32个正常平台,这个模型的预测结果有1个和实际结果不同。因此,这个模型的识别成功率为98.4%。
Logit模型的实证分析表明,人均借款金额、历史待还金额、投资人HHI和平均借款期限的识别效果较好。
问题平台的人均借款金额较多、历史待还金额较少、投资人HHI较大、平均借款期限较短,这表明问题平台的资金大部分来源于少数几个人,大部分投向少数的几个人。而且其业务范围有限,没有尝试期限较长的贷款,这意味着问题平台可能只服务于某些人的短期融资需求。
5. SVM模型的效果。核函数采用线型、多项式型、径向基型时,SVM模型的识别成功率都是100%。它们的程序运行时间差别不大。采用线性核函数,程序运行0.38秒;采用多项式核函数,程序运行0.39秒;采用径向基核函数,程序运行0.37秒。
多项式核函数和径向基核函数对应的边界函数都比较复杂。仅以线性核函数为例,说明各个变量对边界函数的影响方向。对于下述边界函数,Y>0表示问题平台。容易看出,X2、X8、X13、X14对Y均具有正向影响,其余变量对Y具有负向影响。
Y=-0.68X1+0.82X2-0.57X3-1.17X4-0.82X5-0.10X6-0.19X7+1.36X8-0.16X9-0.87X10-0.66X11-0.14X12+0.30X13+0.22X14-1.04
上式表明问题平台的利率较高、人均借款金额较大、投资人HHI 和借款人HHI都较大,并且其成交量较小、历史待还金额较少、资金净流入较少、投资人数和借款人数较少、人均投资金额较少、借款标数较少、平均借款期限较短、待投资人数和待还款人数较少。这意味着问题平台没有得到认可,即使提高率,也没有吸引太多的投资人,因此它们发放的多是短期贷款;同时,大部分借款人也不会来问题平台融资。这就导致问题平台的业务局限在很小的圈子里,不会产生规模效应,也容易出现资金管理不规范等问题。
五、结论
P2P网贷是传统的民间借贷和新兴的互连网技术融合发展的产物。它改善了小微企业的金融环境,丰富了城乡居民的投资产品,是“互联网+普惠金融”的重要组成部分。P2P网贷平台的数量和成交金额迅速增长,拓宽了网络经济的发展空间。但是,由于缺乏金融风险的管理经验,很多平台接连发生了跑路、提现困难和停业等问题事件。因此,如何区分正常平台和问题平台,引导和规范所有平台的健康发展,就成为一个迫在眉睫的挑战。
本文通过搜集P2P网贷平台的经营信息,探索能够成功区分两类平台的指标和模型。主要应用网贷之家的14个指标刻画平台的经营状态,实证分析了32家披露全面的问题平台和32家综合能力较强的正常平台。本文发现:识别效果较好的经营指标包括人均借款金额、投资人HHI等,这已经表现在均值、标准差和量化模型里;SVM模型、Logit模型、判别分析模型的识别能力依次递减,它们的识别成功率分别为100%、98.4%和96.7%;问题平台的业务局限在较小的范围内,没有得到太多投资人和借款人的认可。
以上结论为识别问题平台建立了完整的指标体系和科学的量化模型,同时也会促使投资者选择广为人知的网贷平台,促使经营者大力拓展平台的投融资渠道,促使监管者重点监控初创平台和僵尸平台。未来,我们将继续完善平台风险的机理分析、量化指标和模型等。

主要参考文献:
Larrimore L., Jiang L., Larrimore J., Markowitz D., Gorski S..Peer-to-Peer Lending: The
Relationship Between Language Features,
Trustworthiness,and Persuasion Success[J].Journal of Applied Communication Research,2011(1).
Chen D. Y., Lai F. J., Lin Z. X..A trust model for online peer-to-peer lending: A lender"s perspective[J].Information Technology & Management,2014(4).
Tang M. F., Lu Y., Dong D. Y..Trust Building in Online Peer-to-Peer Lending[J].Journal of Global Information Technology Management,2014(4).
Yang X. L..The Role of Photographs in
Online Peer-to-Peer lending Behavior[J].Social
Behavior and Personality,2014(3).
Herzenstein M., Sonenshein S., Dholakia U. M..Tell Me a Good Story and I May Lend You Money: The Role of Narratives in Peer-to-Peer Lending Decisions[J].Journal of Marketing Research,2011(SPL).
Yum H., Lee B., Chae M..From the wisdom of crowds to my own judgment in microfinance through online peer-to-peer lending platforms[J].Electronic Commerce Research and Applications,2012(5).
Lin M. F., Prabhala N. R., Viswanathan S..Judging Borrowers by the Company They Keep: Friendship Networks and Information Asymmetry in Online Peer-to-Peer Lending[J].Management
Science,2013(1).
Xu Y., Luo C., Chen D. Y., Zheng H. C..What influences the market outcome of online P2P lending marketplace? A cross-country analysis[J].Journal of Global Information Management,2015(3).
Duarte J., Siegel S., Young L..Trust and Credit: The Role of Appearance in Peer-to-Peer Lending[J].Review of Financial Studies,2012(8).
Emekter R., Tu Y. B., Jirasakuldech B., Lu M..Evaluating credit risk and loan performance in online peer-to-peer(P2P)[J].Applied Economics,2015(1).
肖曼君,欧缘媛,李颖.我国P2P网络借贷信用风险影响因素研究[J].财经理论与实践,2015(1).
傅彦铭,臧敦刚,戚名钰.P2P网络贷款信用的风险评估[J].统计与决策,2014(21).
冯旭日,张晶晶.基于Fisher判别法的P2P网络借贷平台信誉等级评价模型[J].金融理论与实践,2014(11).
郭海凤,陈霄.P2P网贷平台综合竞争力评价研究[J].金融论坛,2015(2).