• 论文 • 上一篇    

 大数据下广义线性模型的参数估计算法

李晨露   

  1. 上饶师范学院数学与计算机科学学院, 上饶 334001
  • 出版日期:2020-05-25 发布日期:2020-08-21

李晨露.  大数据下广义线性模型的参数估计算法[J]. 系统科学与数学, 2020, 40(5): 927-940.

LI Chenlu. Parameter Estimation Algorithm of Generalized Linear Model for Big Data[J]. Journal of Systems Science and Mathematical Sciences, 2020, 40(5): 927-940.

Parameter Estimation Algorithm of Generalized Linear Model for Big Data

LI Chenlu   

  1. School of Mathematics and Computer Science, Shangrao Normal University, Shangrao 334001
  • Online:2020-05-25 Published:2020-08-21

在大数据下, 全样本量很大, 未知参数极大似然估计的计算变得十分困难. 文章主要对于广义线性模型参数的极大似然估计研究一种有效的计算方法. 首先证明了随机抽样算法下的估计量的渐近正态性, 由此提出了入样概率的选取准则及两步随机抽样算法. 模拟研究表明, 绝大部分情况下, 运用文章提出的方法所得到广义线性模型极大似然估计量的均方误差低于与之对比的简单随机抽样.

In big data era, the calculation of the maximum likelihood estimator for unknown parameter becomes very difficult due to the large full sample size. This paper studies an effective calculation method for the maximum likelihood estimation of parameter in generalized linear model. First, the asymptotic normality of the estimator under the random sampling algorithm is proved, and then the selection criteria of sampling probability and the two-step random sampling algorithm are proposed. The results of simulation study indicate that, in most cases, the mean square error of the maximum likelihood estimator of the generalized linear model using the proposed method is smaller than that of the simple random sampling.

()
[1] 乔鸽, 周建红, 李新民. 广义线性模型下模型平均的比较研究[J]. 系统科学与数学, 2021, 41(4): 1164-1180.
[2] 杜梅慧,李莉莉,张璇. 基于两步子抽样算法的P2P信用风险预测研究[J]. 系统科学与数学, 2021, 41(2): 566-576.
[3] 牛娟,谢田发,郭媛媛,孙志华. 协变量有测量误差时Tobit回归模型的估计[J]. 系统科学与数学, 2020, 40(9): 1672-1686.
[4] 琚春华,傅小康,邹江波. 融入社会关系强度的个人信用价值度量模型研究[J]. 系统科学与数学, 2020, 40(3): 448-468.
[5] 王彦. 固定设计下计算机模型$L_2$校准的渐近性质[J]. 系统科学与数学, 2020, 40(2): 252-261.
[6] 贾锴. DRE年龄性质的非参数检验[J]. 系统科学与数学, 2019, 39(6): 977-989.
[7] 方方,尹相菊,张强. 海量数据下模型平均的分治算法[J]. 系统科学与数学, 2018, 38(7): 764-776.
[8] 王江峰,范国良,温利民. 删失指标随机缺失下回归函数的复合分位数回归估计[J]. 系统科学与数学, 2018, 38(11): 1347-1362.
[9] 王勇,董恒新. 大数据背景下中国季度失业率的预测研究------基于网络搜索数据的分析[J]. 系统科学与数学, 2017, 37(2): 460-472.
[10] 贾效伟,李梦,贾忠伟. 从健康系统工程谈口腔影像学大数据研究伦理[J]. 系统科学与数学, 2016, 36(2): 219-.
[11] 邹清明,朱仲义. 部分线性单指标模型的M-估计[J]. 系统科学与数学, 2016, 36(11): 2099-2117.
[12] 郭文雯,崔恒建.  带自回归过程的单指标模型的参数估计及其渐近性质[J]. 系统科学与数学, 2015, 35(12): 1463-1478.
[13] 刘强. 缺失数据下非线性半参数EV模型的估计[J]. 系统科学与数学, 2010, 30(9): 1236-1250.
[14] 冯井艳;张日权;张志强. 不同自变量的变系数模型的估计[J]. 系统科学与数学, 2010, 30(2): 225-235.
[15] 李耀武;王霞. 随机截尾情形下Rayleigh分布参数的最大似然估计[J]. 系统科学与数学, 2009, 29(6): 761-778.
阅读次数
全文


摘要