• 论文 •    下一篇

岭回归中基于广义交叉核实法的最优模型平均估计

喻达磊1,饶炜东1,尹潇潇2   

  1. 1. 云南财经大学统计与数学学院,昆明 650221;2. 上海财经大学浙江学院统计系, 金华 321013
  • 出版日期:2018-06-25 发布日期:2018-08-21

喻达磊,饶炜东,尹潇潇. 岭回归中基于广义交叉核实法的最优模型平均估计[J]. 系统科学与数学, 2018, 38(6): 652-661.

YU Dalei, RAO Weidong,YIN Xiaoxiao. Optimal Model Averaging Estimator in Ridge Regression Based on Generalized Cross Validation[J]. Journal of Systems Science and Mathematical Sciences, 2018, 38(6): 652-661.

Optimal Model Averaging Estimator in Ridge Regression Based on Generalized Cross Validation

YU Dalei1 ,RAO Weidong1 ,YIN Xiaoxiao2   

  1. 1. Statistics and Mathematics College, Yunnan University of Finance and Economics, Kunming 650221; 2. Department of Statistics, Shanghai University of Finance and Economics Zhejiang College, Jinhua 321013
  • Online:2018-06-25 Published:2018-08-21

岭回归是一种常用的用于克服多重共线性的压缩估计方法. 文章在存在异方差的背景下, 考察了组合不同岭参数下岭估计量的模型平均方法, 并在广义交叉核实法的框架下构造了相应的权重选择准则. 当拟合模型的设定存在偏误时, 证明了基于广义交叉核实法的模型平均法可以给出渐近最优的预测. 此外, 使用蒙特卡洛模拟考察了所提出的模型平均方法在有限样本下的有效性. 最终, 使用 所提出的方法对一组乙炔反应工艺的数据进行了分析, 所得到的结论进一步表明, 模型平均法在实际数据分析工作中具有较高应用价值.

Ridge regression is one of the most commonly used shrinkage methods for handling the problem of multicollinearity. In this paper, in the presence of heteroscedasticity, we consider the model averaging method for combining ridge estimators based on different ridge parameters. The corresponding weight choice method is proposed based on generalized cross validation. We show that when the fitting model is misspecified, the resulting model averaging estimator leads to the asymptotically optimal prediction. Monte-Carlo simulations are conducted to assess the effectiveness of the proposed method in finite sample setting. An application to the study concerning the acetylene process problem further supports the use of the model averaging method in practical situations.

()
[1] 李莉莉, 靳世檑, 周楷贺. 基于岭回归模型大数据最优子抽样算法研究[J]. 系统科学与数学, 2022, 42(1): 50-63.
[2] 宗先鹏, 王彤彤. 大规模数据下子抽样模型平均估计理论[J]. 系统科学与数学, 2022, 42(1): 109-132.
[3] 廖军, 文丽, 尹建鑫. 高阶空间自回归模型的选择与平均估计[J]. 系统科学与数学, 2021, 41(5): 1400-1417.
[4] 乔鸽, 周建红, 李新民. 广义线性模型下模型平均的比较研究[J]. 系统科学与数学, 2021, 41(4): 1164-1180.
[5] 陈心杰,赵志豪.  高维纵向数据的模型平均估计[J]. 系统科学与数学, 2020, 40(7): 1297-1324.
[6] 高研,周建红,王海涛,张焕焕. 基于Jackknife模型平均方法的中国港口集装箱吞吐量预测[J]. 系统科学与数学, 2020, 40(4): 729-737.
[7] 王彦. 固定设计下计算机模型$L_2$校准的渐近性质[J]. 系统科学与数学, 2020, 40(2): 252-261.
[8] 王苗苗. 基于线性模型平均估计的置信区间[J]. 系统科学与数学, 2020, 40(10): 1866-1881.
[9] 朱容,邹国华,张新雨. 部分函数线性模型的模型平均方法[J]. 系统科学与数学, 2018, 38(7): 777-800.
[10] 王维维,张齐,李新民.  广义矩估计模型平均[J]. 系统科学与数学, 2018, 38(7): 801-812.
[11] 陈全润,杨翠红.  河南省粮食产量预测方法研究[J]. 系统科学与数学, 2018, 38(7): 813-822.
[12] 文丽,卢灿昭. 基于区域房价的空间自回归模型平均[J]. 系统科学与数学, 2018, 38(7): 830-840.
[13] 孙志猛,马倩雯,李潇宁. 网络结构数据空间回归模型的平均估计[J]. 系统科学与数学, 2018, 38(6): 662-678.
[14] 周建红,赵尚威. 高维泊松回归的模型平均方法[J]. 系统科学与数学, 2018, 38(6): 679-687.
[15] 季琳琳,廖军,宗先鹏. 异方差线性测量误差模型的平均估计[J]. 系统科学与数学, 2018, 38(6): 688-701.
阅读次数
全文


摘要