• 论文 • 上一篇    下一篇

基于SVM$^{K\text{-}{\rm Means}}$的非均衡P2P网贷平台风险预测研究

张文1,崔杨波2,姜祎盼2   

  1. 1. 北京工业大学经济管理学院, 北京 100124;  2. 北京化工大学经济管理学院,  北京 100029
  • 出版日期:2018-03-25 发布日期:2018-04-25

张文,崔杨波,姜祎盼. 基于SVM$^{K\text{-}{\rm Means}}$的非均衡P2P网贷平台风险预测研究[J]. 系统科学与数学, 2018, 38(3): 364-378.

ZHANG Wen, CUI Yangbo, JIANG Yipan. A Study on Risk Prediction on Unbalanced P2P Lending Data\\ Based on SVM$^{K\text{-}{\rm Means}}$[J]. Journal of Systems Science and Mathematical Sciences, 2018, 38(3): 364-378.

A Study on Risk Prediction on Unbalanced P2P Lending Data\\ Based on SVM$^{K\text{-}{\rm Means}}$

ZHANG Wen1 ,CUI Yangbo2 ,JIANG Yipan2   

  1. 1. School of Economics and Management, Beijing University of Technology, Beijing 100124; 2. School of Economics and Management, Beijing University of Chemical Technology, Beijing 100029
  • Online:2018-03-25 Published:2018-04-25

P2P网贷平台的高速发展, 降低了小微企业的借贷成本, 提高了投资者的收益与效率, 较好地满足了小微企业的融资需求.然而, 现阶段中国的P2P网贷平台在发展过程中也暴露出大量的风险问题, 不仅使投资者财富遭受损失, 也严重危害了P2P行业的健康发展.因此, 对P2P网贷平台进行早期 风险预测, 在风险问题未发生之前对投资者进行风险预警并为投资者提供投资辅助决策是目前学术界广受关注的一个热点研究问题.针对真实P2P网贷平台数据的类别分布非均衡性问题, 文章提出了一种基于$K$-Means聚类和支持向量机(support vector machine, SVM)的非均衡分类方法SVM$^{K\text{-}{\rm Means}}$用以预测P2P网贷平台风险.通过网贷之家真实数据 并以经典的逻辑回归(logistic regression)、支持向量机以及神经网络(back propagation neural network)为基准方法进行的比较试验表明, 文章提出的SVM$^{K\text{-}{\rm Means}}$方法能够更加准 确地在早期进行P2P网贷平台风险预测.

The rapid development of P2P online loan platform reduces the lending cost of startup enterprises and improves profit and return of investors. However, the development of P2P lending platforms in China has exposed a large number of risk problems, which not only hurt investors' wealth, but also seriously endangers the healthy development of P2P industry. Therefore, early risk prediction of P2P lending platform before bursting of loan risks to support investors in decision making on investment is currently a hot problem in the academia research cycle. In most cases, the data from P2P lending platforms is unbalanced, i.e., the number of defrauding loans is small while the number of non-defrauding loans is large. With the real data collected from the WangDaiZhiJia website, this paper proposes a novel approach called SVM$^{K\text{-}{\rm Means}}$ for unbalanced classification problem to predict the early risks of those P2P lending platforms. This paper also uses classic logistic regression, support vector machine and back propagation neural network as the baseline methods for performance comparison. The experimental result shows that the proposed SVM$^{K\text{-}{\rm Means}}$ approach performs better than the baseline methods on early risk prediction of P2P lending platforms.

()
[1] 俞高锋, 李登峰. 网络安全威胁态势评级的变权方法[J]. 系统科学与数学, 2021, 41(9): 2477-2491.
[2] 徐蕾艳, 孟志青. 条件风险值下直营连锁企业供销平衡鲁棒策略研究[J]. 系统科学与数学, 2021, 41(8): 2149-2169.
[3] 黄晓辉, 卢焱, 唐锡晋. 基于在线媒体的新冠疫情社会舆情多视角分析[J]. 系统科学与数学, 2021, 41(8): 2182-2198.
[4] 赵振宇, 张垚, 樊伟光. 基于``资源-项目-需求"链的分布式可再生能源项目适应度研究[J]. 系统科学与数学, 2021, 41(8): 2217-2233.
[5] 谷浩, 毕潇, 王丹, 李刚, 邹晶, 陈明. 基于ResNet和反卷积网络模型的有限角CT图像重建算法[J]. 系统科学与数学, 2021, 41(8): 2349-2360.
[6] 李美娟, 潘瑜昕, 徐林明, 卢锦呈. 改进区间数动态 TOPSIS 评价方法[J]. 系统科学与数学, 2021, 41(7): 1891-1904.
[7] 李爱忠, 任若恩, 董纪昌. 稀疏网络下核范数回归的连续时间Smart Beta策略[J]. 系统科学与数学, 2021, 41(7): 1927-1937.
[8] 赵伟, 王钟梅, 吴纯杰. 结合测量误差的检测多元协方差矩阵的EWMA控制图[J]. 系统科学与数学, 2021, 41(7): 2018-2034.
[9] 彭定洪, 卞志洋. 面向产品设计方案的犹豫模糊 Kansei-TOPSIS 评价方法[J]. 系统科学与数学, 2021, 41(6): 1630-1647.
[10] 左凯, 吴文青, 张元元. 修理工多重休假且修理设备可更换的$n$中取$k$温贮备系统研究[J]. 系统科学与数学, 2021, 41(6): 1729-1741.
[11] 刘艳霞, 王芝皓, 芮荣祥, 田茂再. 广义函数型部分变系数混合模型的估计[J]. 系统科学与数学, 2021, 41(6): 1742-1760.
[12] 罗小丽, 戴璐, 练红海, 李谟发, 邓鹏. 具有时滞概率分布的电力系统负荷频率稳定性分析[J]. 系统科学与数学, 2021, 41(5): 1245-1255.
[13] 张小英, 王平, 冯红银萍. 常微分方程-薛定谔方程耦合系统的输出反馈镇定[J]. 系统科学与数学, 2021, 41(4): 887-897.
[14] 陈振杰, 傅勤, 郁鹏飞, 张丹. 一类四阶抛物型偏微分多智能体系统的协调控制[J]. 系统科学与数学, 2021, 41(4): 898-912.
[15] 杨贵军, 吴洁琼. Pareto $\pi$ps 抽样的~Horvitz-Thompson 估计量方差研究[J]. 系统科学与数学, 2021, 41(4): 1150-1163.
阅读次数
全文


摘要