• 论文 • 上一篇    下一篇

基于LDA主题模型的网络舆情研究

李振鹏,黄帅   

  1. 大理大学数学与计算机学院统计系, 大理 671003
  • 出版日期:2020-03-25 发布日期:2020-05-30

李振鹏,黄帅. 基于LDA主题模型的网络舆情研究[J]. 系统科学与数学, 2020, 40(3): 434-447.

LI Zhenpeng,HUANG Shuai. Analysing on Network Public Opinion Based on LDA Topic  Model[J]. Journal of Systems Science and Mathematical Sciences, 2020, 40(3): 434-447.

Analysing on Network Public Opinion Based on LDA Topic  Model

LI Zhenpeng ,HUANG Shuai   

  1. Department of Statistics, School of Mathematics and Computers Science, Dali University, Dali 671003
  • Online:2020-03-25 Published:2020-05-30

基于天涯杂谈2015年全年帖子, 对其标题进行文本挖掘, 通过LDA主题 模型分类, 计算主题比率. 再通过对帖子的点击量, 回复量, 回复点击比, 持续热度各前100的帖 子进行词频统计, 得到上述4个指标的TOP100热帖. 进一步, 对比分析了 TOP100热帖的主题比率与全部帖子的主题比率. 文章的研究结 果可以捕捉到2015年天涯网友的热点关注方向, 结合情感分析技术, 研究 结果清晰地勾勒出天涯杂谈版块的网络舆情方向和网民态度.

In this paper, based on text mining and LDA topic model, we analyzed all posts on Tianya Zatan in 2015. We obtained TOP100 hot posts according to indexes such as clicking quantity, replying quantity, replies vs. clicks ratio and topics ratio. Furthermore, we compared the topics ratio of TOP100 and all posts. The empirical results can capture the focuses of Tianya Zatan netizens in 2015. Combined with emotional analysis technology, the research results clearly outline the public opinion direction and netizens' attitudes of Tianya Zatan.

()
[1] 张小英, 王平, 冯红银萍. 常微分方程-薛定谔方程耦合系统的输出反馈镇定[J]. 系统科学与数学, 2021, 41(4): 887-897.
[2] 陈振杰, 傅勤, 郁鹏飞, 张丹. 一类四阶抛物型偏微分多智能体系统的协调控制[J]. 系统科学与数学, 2021, 41(4): 898-912.
[3] 杨贵军, 吴洁琼. Pareto $\pi$ps 抽样的~Horvitz-Thompson 估计量方差研究[J]. 系统科学与数学, 2021, 41(4): 1150-1163.
[4] 张俊芳,周礼刚,金自强. 基于Pythagorean犹豫模糊熵和交叉熵的绩效评价方法[J]. 系统科学与数学, 2021, 41(2): 436-448.
[5] 陈宇峰,朱志韬,屈放. 国际油价、人民币汇率与国内金价的非对称溢出及动态传 导机制 ------ 基于三元VAR-Asymmetric BEKK (DCC)-GARCH (1, 1)模型[J]. 系统科学与数学, 2021, 41(2): 449-465.
[6] 吴红星,程国飞,王胜华. 细菌种群增生中Rotenberg模型解的渐近稳定性研究[J]. 系统科学与数学, 2020, 40(9): 1539-1549.
[7] 杨靛青,韩清云. 基于TOPSIS的网络舆情态势等级模糊多指标综合评价模型[J]. 系统科学与数学, 2020, 40(8): 1352-1364.
[8] 陆文星,戴一茹,李楚,李克卿. 基于改进PSO-BP神经网络的旅游客流量预测方法[J]. 系统科学与数学, 2020, 40(8): 1407-1419.
[9] 张培文,吴江,汪瑜,孙宏. 机队运力配置和USApHMP问题的联合决策模型与算法[J]. 系统科学与数学, 2020, 40(8): 1432-1446.
[10] 焦建军,陈兰荪,李利梅. 污染喀斯特环境下具瞬时与非瞬时脉冲效应的单种群动力学模型[J]. 系统科学与数学, 2020, 40(7): 1286-1296.
[11] 崔春生,王雪,李文龙. 基于用户在线评论的旅游景点推荐算法研究[J]. 系统科学与数学, 2020, 40(6): 1103-1116.
[12] 赵峰,王淼,高峰阳. 基于改进NSGA-II算法的次同步附加阻尼控制器的优化设计[J]. 系统科学与数学, 2020, 40(5): 751-760.
[13] 李振鹏,陈碧珍,罗静宇.  基于文本挖掘的网络舆情分类研究[J]. 系统科学与数学, 2020, 40(5): 813-826.
[14] 李继红,赵仕静. 不同价格水平下排队策略研究[J]. 系统科学与数学, 2020, 40(3): 510-520.
[15] 王浩宇,张崇岐. 基于特殊混料模型$D$-最优设计搜索的交换点式门限接受算法[J]. 系统科学与数学, 2020, 40(2): 210-224.
阅读次数
全文


摘要