突发公共卫生事件网民关注度的时空特征分析
文/孙雪柳 徐春  2021年第8期第143页  2021-07-19

  摘要:以2019年12月底爆发的新型冠状病毒事件为突发公共卫生事件研究样本,将百度指数和微博热搜数据作为网民公众关注度的测量指标,采用百度搜索指数、资讯指数数据和微博实时数据,运用网络数据挖掘法、python数据分析法,分析2020年中国网民对“新型冠状病毒”关注度的时空变化特征。研究发现:1)时间上,网民关注度总体呈现急速上升、指数式衰减、阶段性显著提升的演变轨迹;关注主题遵循早期病毒溯源到后期关注国外疫情的发展规律。2)疫情网民关注度省际差异大,大陆关注度远高于港澳台,东部东北中部西部网民关注度呈现梯度递减规律。

  关键词:突发公共卫生事件; 网民关注度; 时空特征; 新型冠状病毒肺炎

  0.引言

  突发公共卫生事件是指突然发生,造成或者可能造成社会公众健康严重损害的重大传染病疫情、群体性不明原因疾病、重大食物和职业中毒以及其他严重影响公众健康的事件[1]。2019年12月下旬以来,新冠肺炎疫情在武汉大规模爆发,并很快蔓延至全球。为了有效控制疫情,切断病毒传播途径,2020年1月23日武汉政府关闭了离汉通道,并对武汉及其周边城市采取隔离措施。2020年2月11日,世界卫生组织将新型冠状病毒肺炎正式命名为COVID-19。2月23日以来,疫情发展趋于稳定状态,新增病例数逐步下降至个位数,中共中央作出统筹疫情防控和经济社会发展,有序复工复产重大决策。5月13日以来境内疫情总体呈零星散发状态,局部地区出现个体病例引发的小规模聚集性疫情,境外输入病例基本上得到控制。由于疫情的突发性、非预期性、影响范围大等特点,其对社会的危害性非常大,因此对突发公共卫生事件的预警防控显得尤为重要[2]。在非特征疫情迹象显现后更早、更有效地做出反应,那么死亡人数、基础设施的损耗以及最终反应的规模都会大大减少[3]。不明原因传染病爆发后的应急管理前期的风险评估和监测预警,需要对与疫情事件相关的关键词指标进行监测[4]。在此期间,我国网民通过百度搜索引擎、新浪微博平台搜索疫情相关信息,这为探索突发公共卫生事件中中国网民关注度提供很好的机会和资料。

  网民关注度是一种稀缺资源,其反应了在一定时间、一定资源范围内公众的信息偏好和注意力分配[5]。突发公共卫生事件网民关注度是指在突发公共卫生事件期间网民对互联网信息的偏好和注意力,其一定程度上反映了网民对突发公共卫生事件一体的关注程度、信息需求和特定意见[6]。对其进行分析,有助于提升疫情期间政府信息供给效率、满足公众需求和提供社会支持等。自新冠肺炎发生以来,疫情引发的病例数据牵动人心,与疫情相关的信息亦引起公众的普遍关注。互联网的普及和地理信息技术的发展,使得疫情动态的网络资讯成为当下公众获取疫情信息的主要来源。公众关注度是学界当前研究的热点,公众对某些议题是否关注,关注程度如何,学者们能通过对网民的主动搜索行为进行分析从而揭示公众对某些议题的偏好度[7]。研究发现,基于搜索数据的公众关注度能较好地反映公众在疫情发生期间的认知需求变化[8]。在公共卫生领域,公众关注度在疫情防控中发挥着预测疾病暴发[9]与追踪传染病扩散[10-11]的重要作用。如以谷歌搜索数据作为实时追踪疾病的手段已经成为“数字流行病学”开展相关研究的主要趋势[12]。但是,被时间、空间因素影响时,基于搜索趋势分析的手段在预测疫情进展中的准确性受到一定质疑,尤其是大众媒体报道引发的信息搜寻行为、其他利害关系人/团体的参与、疾病在人群中的实际传播等三者都会受到时空因素的影响[13]。因此,疫情公众关注度的时间与空间因素不可忽视。无论是新闻议题或社会议题的发展,由兴起→聚焦→衰退,都是一个逐渐扩大和深化的时空过程[14]。社会大众对议题的关注度强度,在不同阶段存在不同的信息需求。公众注意力的分配,不是由个体独立支配的行为,而是由组织、制度、技术与社会环境共同作用而达成的行为[17],反映了公众对于公共议题认知的稳定性[16]。因此,通过对互联网中关于突发公共卫生事件信息的采集、整理、加工和分析,监测突发公共卫生事件发展态势,探索事件传播模式并作出相应的预警,使得政府更加迅速有效的监管成为可能[18]。

  鉴于此,本文以新冠状病毒肺炎事件为研究对象,开展网民关注视角下疫情的时空特征分析。使用百度指数和新浪微博热搜数据,及时跟踪和聚焦网民关注新冠状病毒肺炎疫情事件的发展情况,研究网民关注度的变化趋势、特点等内容。从而为政府研判突发公共卫生事件发展趋势提供信息支持,为提升政府舆论引导啊能力、公众沟通能力和公共服务效果提供决策支持。

  1.数据来源与研究方法

  1.1 数据来源及处理

  1.1.1 数据来源

  研究数据主要来源于百度搜索指数、百度资讯指数、《中国统计年鉴-2019》。选取百度指数的原因在于百度搜索引擎是全球最大和国内市场占有率最高的中文搜索引擎,具有较强的代表性。本文使用新浪舆情大数据平台的微博数据作为测量网民关注度的另一主要数据来源,该平台拥有新浪微博全量数据库,每天存储新浪微博数据超过6000万条,可获得微博每日热搜数据。2019年12月底新型冠状病毒疫情暴发,引起了全国网民的广泛搜索并迅速成为热点。本文采用网民使用百度搜索引擎搜索某一关键词和微博热搜数据,把新型冠状病毒肺炎疫情用户搜索量作为网民关注度的代理变量。

  1.1.2 数据处理

  首先用百度指数检索关键词“新型冠状病毒”“冠状病毒”“肺炎”,确定初步语料范围,并从数据源中抽取数据。通过在基础数据库中检索对应的关键词,并对关键词词频进行加权平均后作为对应的态势指标。通过初步筛选关键词后,统计每个关键词的词频和每个关键词在当日出现的相对比例。然后对每日相对比例进行平均后得到每个关键词在分析时间段内的平均比例。将每个关键词的平均比例进行排序,筛选出累计比例超过99%的关键词作为最终入选的关键词。结果显示“新型冠状病毒”、“疫情”是网民搜索量最多的关键词,因此本文使用“新型冠状病毒+疫情”组合词的百度指数数据和微博热搜数据作为研究用户关注度与实际疫情的关联性的有效数据。百度指数与实际疫情数据采用2020年每日数据。

  1.2 研究方法

  1.2.1 网络数据挖掘法

  借鉴已有时空差异的分析方法,采用标准差衡量突发公共卫生事件网络关注度时空演化中的绝对差异,采用变异系数、赫芬达尔系数、集中指数、首位度、基尼系数等衡量其相对差异,标准差与变异系数符合经典统计学方法,利用python软件对空间分布可视化。

  基于百度指数平台,以新型冠状病毒肺炎疫情为研究对象,筛选疫情相关的关键词“新型冠状病毒+疫情”作为搜索关键词,获取2020年1月1日-12月31日内全国和31个省(港、澳、台地区除外)的每日网民关注度和百度媒体报道指数,并利用EXCEL等工具进行初期整理、汇总、统计、归纳。

  1.2.2 python工具空间分析法

  利用python计算机工具以及百度开源的可视化数据库Echarts对空间数据进行分析,使空间数据的分析更直观、更具体。本文对全国31个省(港、澳、台地区除外)的新型冠状病毒肺炎疫情事件情况以及网民关注度进行等级划分处理,挖掘各省份、直辖市、自治区网民关注度情况,并进行空间相关性分析。

  1.2.3 多元回归分析法

  (1)赫芬达尔系数。反映突发公共卫生事件网络关注度在时间或空间上的集聚程度,其计算公式为:H=■ni=1pi2

  式中:为某地区或某月突发公共卫生事件网络关注度所占关注度的比值:H为赫兹达尔系数,H值越趋近于1,突发公公共卫生突发事件的相对差异越大。

  (2)集中指数。用来考察突发公共卫生事件网络关注度的分布状况,其计算公式为:C=100-100(h/n)。式中:h为突发公共卫生事件网络关注度按降序排列后累计达到一半的时间单位或地区个数;n为时间单位总数或总地区数量;C为集中指数,C值为50表示绝对均衡分布,值越大代表时间或者空间分布不平衡。

  (3)首位度。计算方法为:P=P1/P2。式中:P1与P2分别表示在时间或空间上排位为第一与第二位的突发公共卫生事件网络关注度指数;P为首位度。

  (4)基尼系数。用来考察突发公共卫生事件网络关注度的相对差异。公式如下:

  G=1+■-■(x1+2x2+3x3+…+nxn)

  式中:为基尼系数,G处于01,G值越小,表明其相对差异越小;x1+x2,xn,为降序排列的各地区突发公共卫生事件网络关注度。

  2.突发公共卫生事件网民关注度时空演化特征分析

  2.1突发公共卫生事件网民关注度的时间演化特征

  2.1.1突发公共卫生事件网民关注度总体时序演变趋势。

  2020年1月1日至2020年12月31日,一年时间内“新型冠状病毒+疫情”网络关注度为180923200,其演变主要表现为“极速上升”、“指数式衰减”、“阶段性显著提升”3个特征。2020年新型冠状病毒肺炎事件爆发后,网民关注度迅速提升达到峰值,并在一段时间具有明显的“峰峦”特征,而且在2月13日开始极速回落,这与全国疫情情况走势高度相似。从时间维度上可以看出,2020年新型冠状病毒肺炎事件,网民关注度高峰聚集在二月份,疫情最严重的时间也是在2月份。网民关注度可以直接反映突发公共卫生事件的严重程度。图1反映了新型冠状病毒肺炎事件下网民关注度对舆情的影响。其余三个高峰依次出现在4月4日、6月17日、10月12日,分别为重大节假日清明节、端午节、国庆节假期前后,充分说明节假日人流迁徙量增加,人们对疫情未知的恐慌转化为对疫情信息的需求。

  图1 新型冠状病毒肺炎实践网民关注度变化整体趋势

  2.1.2突发公共卫生事件网民关注主题演变特征

  前面的分析有助于把握我国网民关注度总体变化趋势,但微观探索不足,难以指导具体实践。为此,本文进一步探索突发公共卫生事件网民关注主题变化趋势,帮助管理部门掌握疫情期间网民对各类信息的关注程度、具体需求,了解不同阶段话题分布特点。

  为了网民关注主题变化趋势进行分析,本文还对热门微博数据集的内容进行了标注分类。具体方法为,首先人工阅读每一篇热门微博,根据其描述内容设定相应类目,若后续数据属于已有类目则归入该类,若后续数据不属于已有类目则新建一类目。为了确保分析的精确性,本文采取传统方式对所有数据样本进行人工标注。最终,本文将1825条微博数据划分至疫情、医情、民情、政情、媒情五个子系统,关于疫情、医情、民情、政情、媒情五情主题词的确定标准,具体参见(表2)。

  表2 疫情、医情、民情、政情、媒情五情主题词的确定标准

  通过初步筛选主题后,对每个热搜主题进行归类划分至20个类目(表3)。依据划分的20个热门微博话题,做疫情热门微博主题分布图(图2)。可见在疫情发展的不同阶段,网民热门主题的关注也呈现出不同特点。

  表3 疫情热搜主题所占比例

  在疫情潜伏期(2020年1月1日-2020年2月5日),由于信息不对称,网民更关注疫情动态、病毒来源及类似案例带来诸多不便,网民开始关注政府的信息发布和回应等话题。另外,在强大的媒体宣传攻势下,网民转发了许多有关防疫的倡议建议以及对医护的鼓励支持,1月24日后,捐献赠送转发在网络中大量涌现。

  疫情爆发期(2020年2月6日至2020年2月23日),我国开始进入抗议攻坚阶段,病人救治情况、医护状况成为人们关注的热点,防疫次生问题开始涌现,如:少数病人得不到救治开始在线上求助、知名人士因病去世、医护警察因公殉职等。为满足公民诉求,一些组织和机构捐赠赠送医疗物资和资金,如:口罩、防护服等获得大量关注。与此,2月15日后,随着疫情的全球蔓延,国外疫情开始受到大量关注。

  疫情波动期(2020年2月24日-2020年5月12日),疫情得到基本控制,我国网民注意力开始分散,其他话题比例明显增多,复工复产、教育复课、交通运输状况成为主流,网民开始期待疫情结束后的生活。另外,政务系统的疫情信息公开,网民对疫情动态信息关注度依旧很高。

  疫情常态化期(2020年5月13日-12月31日),微博热搜数量急剧下降,国外疫情成为国民关注的热点,检查诊断的每日新增确诊数据依旧是网民关注的热点。另外,疫情常态化时期网民对疫苗的研制状况投入了更多的关注。

  图2 新冠疫情热搜主题变化趋势图

  2.2突发公共卫生事件网民关注度的空间特征

  对大陆31个省份与港澳台逐日突发公共卫生事件网民关注度按地区进行加总平均后,获得各地区日均数据。按大陆与港澳台将研究样本分为两组,发现,大陆日均关注度指数为16620,远高于港澳台的704;港澳台三地也存在差异,其中澳门日均关注度为401,香港为1150 ,台湾为560。利用Echart对日均突发公共卫生事件网民关注度进行可视化处理,得到突发公共卫生事件网民关注度的省域分布(图3)。图3中颜色越深表示该省区的突发公共卫生事件网民关注度越高,由图可知,突发公共卫生事件网民关注度省际差异大,强弱分布呈现空间跳跃特点,强网络关注度省区主要集中在广东、北京、山东、江苏、河北、浙江、四川、河南等省区,广东是突发公共卫生事件网民关注度最强地区;而西部网络关注度普遍偏低。

  为进一步考察突发公共卫生事件网民关注度不同区域的特征,特将中国划分为东部、中部、西部、东北与港澳台5个区域,东、中、西、东北按照惯例划分(表4)。表4显示,从均值来看,港澳台显示出弱网络关注,东部、东北、中部、西部呈现网络关注度梯度递减规律;从标准差映射的绝对差异来看,从大到小排列依次为东部、东北、中部、西部。变异系数、赫芬达尔系数、集中指数、基尼系数4个指标可反映区域内部的突发公共卫生事件网民关注度相对差异,表4显示4个指标呈现出一致性的结果,充分说明地区内部相对差异呈现出东部、东北部、西部、中部依次递减规律。

  图3 全国新冠病毒疫情网民关注度区域分布图

  表4 突发公共卫生事件网民日均关注度分区域统计

  3.结论

  基于百度指数和微博数据,本文探究了2020年1月1日-2020年12月31日全国除港澳台外的31个省、自治区和直辖市对”新型冠状病毒“的网络公众关注度。分析了疫情爆发前后4个阶段的网络关注度时空分布特征,得出以下几点结论:

  ①时间分布上,年际总体呈现“极速上升”、“指数式衰减”、“阶段性显著提升”3个特征;在过去的一年中,假期效应明显,重大节假日前后网民关注度明显增加,节后关注度高于节前关注度。网民月度关注度为加速收敛波动态势,月内分布相对差异有均衡化趋势。网民对疫情关注度最高,其次是政情,关注主题从疫情潜伏期的病毒来源、捐献赠送,疫情爆发期的防疫举措、回应关切,疫情波动期的医疗救治、到后期的关注国外疫情、教育复课。

  ②空间分布上,疫情网民关注度情况大体上符合中国的人口、资源分布;疫情网民关注度空间分布特征上,呈现明显的空间分异和极化特征。总体上,位于东南、华南、华北、西南地区的省市网民关注度较高,华中、东北地区次之,而西北地区网民关注度较低;局部上,沿海省份高于内陆省份,且与疫情高发区域基本吻合。

  4.讨论

  掌握疫情网民关注度的时间与空间变化规律,可为突发公共卫生事件治理提供参考。对疫情发生的节假日时期,必须进行突发公共卫生事件实时重点监测,并密切关注新闻媒体的有关舆论报道,强化政府与媒体之间的及时沟通,以阻断式或者减少疫情有关不当舆论的扩散;就舆情传播与网民参与下网民关注治理而言,本文为政府掌握疫情期间不同阶段下民众的需求,以便进行有效治理与及时回应提供了方向。同时,对网络发达程度高、经济发展水平好的地区更加应该密切监测当地舆情关注度的变化,减少负面舆论引发的次生危机。C

  (作者单位:新疆财经大学信息管理学院)

  基金项目:新疆自然科学基金项目(2019D01A23);新疆高校科研计划科学研究面上项目(XJEDU2017M02)

  参考文献

  [1] 中华人民共和国国务院.突发公共卫生事件应急条例[S]. 北京:国务院,2003.5.9.

  [2] 王佳, 程实, 陈波涛, et al.我国突发公共卫生事件应急管理探讨[J].医学与社会, 2017 ,(10):4-7.

  [3] Siedner, Mark, Gostin, Lawrence O, Cranmer, Hilarie,et al. Strengthening the Detection of and Early Response to Public Health Emergencies: Lessons from the West African Ebola Epidemic [J].Plos Medicine,2015,12(3):e1001804.

  [4] 邵东珂,吴进进,彭宗超.应急管理领域的大数据研究:西方研究进展与启示[J].国外社会科学,2015,(6):129-136.

  [5] 王心瑶,郝艳华,吴群红,等.社交媒体环境下H7N9事件网络舆情演变与比较分析[J].中国公共卫生,2018,(9):1232-1236.

  [6] 王晶晶.百度指数在我国H7N9与登革热疫情分析上的应用研究[D]. 2015.

  [7] 孟天广,赵娟.大数据时代网络搜索行为与公共关注度:基于2011-2017年百度指数的动态分析[J].学海,2019,(3):41-48.

  [8] 刘维斯, 攸小瑾, 马晓薇,等. 互联网搜索指数与埃博拉认知需求相关性分析[J]. 医学动物防制, 2018, 034(012):1146-1148,1151.

  [9] Eysenbach G . Infodemiology: Tracking Flu-Related Searches on the Web for Syndromic Surveillance[J]. Amia. annual Symposium Proceedings, 2006, 244:244-248.

  [10] Ripberger J T . Capturing Curiosity: Using Internet Search Trends to Measure Public Attentiveness[J]. Policy Studies Journal, 2011, 39(2):239-259.

  [11] Signorini A , Segre A M , Polgreen P M . The use of Twitter to track levels of disease activity and public concern in the U.S[J]. PLoS ONE, 2011, 6(5):e19467.

  [12] Marcel, Salathé, Linus, et al. Digital Epidemiology[J]. Plos Computational Biology, 2012.

  [13] Sherry T , Shehzad A , Gilbert B , et al. Mass media and the contagion of fear: The case of Ebola in America[J]. PLoS ONE, 2015, 10(6):e0129179.

  [14] 安璐,突发公共卫生事件的微博主题演化模式和时序趋势——以Twitter和Weibo的埃博拉微博为例[J].情报资料工作,2016.

  [15] 黄河, 翁之颢. 移动互联网对网络评论受众注意力分配的影响——基于时间社会学的视角[J]. 编辑之友, 2019, No.273(05):56-62.

  [16] Wang C J , Wang P P , Zhu J J H . Discussing Occupy Wall Street on Twitter: Longitudinal Network Analysis of Equality, Emotion, and Stability of Public Discussion[J]. Cyberpsychology Behavior & Social Networking, 2013, 16(9):679.

  [17] Jean-Paul Chretien, Caitlin M. Rivers, Michael A. Johansson. Make Data Sharing Routine to Prepare for Public Health Emergencies[J]. Plos Medicine, 2016, 13(8):e1002109.

  [18] M.IkramUllah Lali, Raza Ul Mustafa, Kashif Saleem,et al. Finding Healthcare Issues with Search Engine Queries and Social Network Data[J]. International Journal on Semantic Web & Information Systems,2016,13(1).


【编辑:editor】
上一篇:煤炭港口物流集疏运系统协同管理模式分析
下一篇:大数据背景下自媒体平台的信息甄别、筛选与定向精准推送研究
文章二维码分享至手机