• 论文 • 上一篇    

 高维纵向数据的模型平均估计

陈心杰1,赵志豪2,3   

  1. 1.远东资信评估有限公司, 北京 100007; 2. 首都经济贸易大学统计学院, 北京 100070; 3. 首都师范大学数学科学学院,北京 100048
  • 出版日期:2020-07-25 发布日期:2020-09-23

陈心杰,赵志豪.  高维纵向数据的模型平均估计[J]. 系统科学与数学, 2020, 40(7): 1297-1324.

CHEN Xinjie,ZHAO Zhihao. Model Average for High-Dimensional Longitudinal Data[J]. Journal of Systems Science and Mathematical Sciences, 2020, 40(7): 1297-1324.

Model Average for High-Dimensional Longitudinal Data

CHEN Xinjie1 ,ZHAO Zhihao 2,3   

  1. 1. Fareast Credit Rating Co., Ltd., Beijing 100007; 2. School of Statistics, Capital University of Economics and Business, Beijing 100070; 3. School of Mathematical Sciences, Capital Normal University, Beijing 100048
  • Online:2020-07-25 Published:2020-09-23

高维数据的模型选择是当今统计学研究的一个热点问题, 但 关于高维纵向数据方面的模型平均却少见研究, 文章提出了一种利用删 组交叉验证准则对高维纵向数据进行模型平均估计的方法, 在最小化预测残差意义下, 以删组交叉验证为准则, 证明了其渐近最优性, 并通过模拟研究表明, 该模型平均方法在估计效果上要优于其它一些传统的模型选择和平均方法.

High-dimensional model selection and model average have received much attention in recent years. However, few investigation has been conducted for the high-dimensional longitudinal data. In this paper, a new model-averaging approach utilising the leave-subject-out cross-validation criterion is developed for high-dimensional longitudinal data model average. To minimize the prediction error, we estimate the model weights using a leave-subject-out cross-validation procedure. We further prove that leave-subject-out cross-validation achieves the lowest possible prediction loss asymptotically. In addition, extensive simulation studies show that the performance of the proposed model average method is much better than that of the commonly used methods.

()
[1] 宗先鹏, 王彤彤. 大规模数据下子抽样模型平均估计理论[J]. 系统科学与数学, 2022, 42(1): 109-132.
[2] 廖军, 文丽, 尹建鑫. 高阶空间自回归模型的选择与平均估计[J]. 系统科学与数学, 2021, 41(5): 1400-1417.
[3] 乔鸽, 周建红, 李新民. 广义线性模型下模型平均的比较研究[J]. 系统科学与数学, 2021, 41(4): 1164-1180.
[4] 高研,周建红,王海涛,张焕焕. 基于Jackknife模型平均方法的中国港口集装箱吞吐量预测[J]. 系统科学与数学, 2020, 40(4): 729-737.
[5] 王苗苗. 基于线性模型平均估计的置信区间[J]. 系统科学与数学, 2020, 40(10): 1866-1881.
[6] 朱容,邹国华,张新雨. 部分函数线性模型的模型平均方法[J]. 系统科学与数学, 2018, 38(7): 777-800.
[7] 王维维,张齐,李新民.  广义矩估计模型平均[J]. 系统科学与数学, 2018, 38(7): 801-812.
[8] 陈全润,杨翠红.  河南省粮食产量预测方法研究[J]. 系统科学与数学, 2018, 38(7): 813-822.
[9] 文丽,卢灿昭. 基于区域房价的空间自回归模型平均[J]. 系统科学与数学, 2018, 38(7): 830-840.
[10] 喻达磊,饶炜东,尹潇潇. 岭回归中基于广义交叉核实法的最优模型平均估计[J]. 系统科学与数学, 2018, 38(6): 652-661.
[11] 孙志猛,马倩雯,李潇宁. 网络结构数据空间回归模型的平均估计[J]. 系统科学与数学, 2018, 38(6): 662-678.
[12] 周建红,赵尚威. 高维泊松回归的模型平均方法[J]. 系统科学与数学, 2018, 38(6): 679-687.
[13] 季琳琳,廖军,宗先鹏. 异方差线性测量误差模型的平均估计[J]. 系统科学与数学, 2018, 38(6): 688-701.
[14] 相鑫,刘秀丽. 四层参数自调整BP神经网络模型及其在人口死亡率预测中的应用[J]. 系统科学与数学, 2018, 38(6): 702-710.
[15] 李莉莉,崔迎鹏,卢睿,乔婧妍. 基于模型平均方法的基金绩效预测研究[J]. 系统科学与数学, 2018, 38(6): 711-724.
阅读次数
全文


摘要