自然语言处理NLP:情感分析疫情下的新闻数据

2021-01-15 20:01| 发布者: |

  新冠肺炎的爆发让今年的春节与往常不同。与此同时,新闻记录下了这场疫情发展的时间轴。为此我们分析了疫情相关的新闻内容、发布时期以及发布内容的主题和情感倾向这些方面的数据,希望通过这些数据,能对这场疫情有更多的了解。通过对疫情相关的新闻进行主题分析和情感分析,我们可以得到每个主题的关键词以及情感分布。

  症状检测主题的新闻内容表达出最多积极情感,该话题下讨论的是医院中检测患者的症状,其次是城市服务以及学校相关的新闻内容,讨论了商店关闭,社区隔离和学校延迟开学等话题,生活主题也表达出较多的积极情感(关键词:时间、家庭),疫情增加了家人相处的时间(图1)。新闻表达的情感倾向随时间变化考虑到新闻发布的时间、新闻相关的线显示了通过情感交叉分析得到的结果。图表2

  从话题排名来看,不同时间段的新闻中最热门的话题都有经济、出行和政治。从情感分布来看,1月份的经济主题新闻表达出较多的负面情绪(如股市因对冠状病毒的日益关注而下跌)。3月份随着疫情逐渐好转,城市主题新闻(如疫情期间保证商店服务和生产经营)的热度排名超过防护主题(关键词:口罩,洗手,健康等)。从1月到3月,各个主题下的积极情感比例都在不断增加。新闻对不同主题关键词的关注度考虑到不同线显示了高频关键词的分布。图表3

  从中我们可以看到疫情相关的新闻中最关注的方面,首先是健康,家庭和隔离和出行,其中健康出现的频率最高。然后关注的话题,包含冠状病毒、疫情期间的工作和病毒检测。其次关注的话题包含区分健康和感染的症状。其他关注的热门关键词包含学校、商业、旅行和经济等。本文章中的所有信息(包括但不限于分析、预测、建议、数据、图表等内容)仅供参考,拓端数据(tecdat)不因文章的全部或部分内容产生的或因本文章而引致的任何损失承担任何责任。

  最受欢迎的见解1.小红书用户行为数据采集洞察:婚礼种草指南2.机器学习助推快时尚精准销售预测3.单车上的城市:共享单车数据洞察4.用机器学习识别不断变化的股市状况—隐马尔科夫模型(HMM)的应用5.数据盘点:家电线.在r语言中使用GAM(广义相加模型)进行电力负荷时间序列分析7.虎扑论坛基因探秘:社群用户行为数据洞察8.把握出租车行驶的数据脉搏9.智能门锁“剁手”数据攻略

<
>
关于我们
AB模版网成立于2014年,我们是一家专注用户体验设计开发与互联网品牌建设的设计公司,创立至今为2000多位客户提供了创新与专业的设计方案。设计服务范围包括:交互原型设计、产品视觉设计、网站设计与开发建设、移动及软件产品界面设计、图标设计、品牌及平面设计等。

联系我们

服务时间:9:00-18:00)

官方微信官方微信

部门热线

前   台:
业务部:
客服部:
技术部:
人事部:

咨询电话 返回顶部
返回顶部