贾焰 刘江宁
舆情是指在一定的社会空间内,围绕中介性社会事件的发生、发展和变化,民众对社会管理者产生和持有的社会政治态度。它是较多群众关于社会各种现象、问题所表达的信念、态度、意见和情绪等表现的总和。网络舆情是舆情的一种重要形态,它是随着互联网、通讯网、广播电视网等人类通信网络的发展而迅速形成和发展的,并正在对社会生活产生着巨大影响。尤其在“9?11事件”之后,世界各国都加速开展了关于国家安全与社会安全方面的工作,加大对危害国家安全和社会稳定信息监控方面的投入,加强了网络舆情的研究。网络舆情信息作为社会万象的映射,最直接、最快速地反映了社会舆情的状况和发展态势。对网络舆情进行快速获取、有效分析、持续跟踪、及时预警、有效调控,有助于对形成群体问题的因素及时进行判断与引导,有助于对社会舆情进行有效的掌控。
目前,随着Web 2.0技术及相关互联网应用的不断普及,微博等新型媒体已经成为网络舆情的重要舆论场。由于微博具有用户基数大、传播速度快、信息上载方便等特点,近两年在我国形成爆炸性增长态势,并已经成为我国舆情爆发的主要策源地和传播媒介。微博上的违法和不良信息也层出不穷,尤其是各种谣言滋生蔓延,造成了很大的社会危害。
一、微博及其在舆情传播中的特点
微博客(Micro-blogging)是一种允许用户及时更新简短文本(通常在140字左右)并可以公开发布的博客形式。它允许任何人阅读或者只能由用户选择的群组阅读。其核心特点是可以通过短信、即时通信工具、电子邮件、MP3、网页等方式联动。一些微博客也可以发布多媒体,如图片或影音剪辑。在微博中,每个人都是信息源,可以接受别人的信息,也有别人接受自己的信息;可以将获取的信息转发给自己的粉丝,由此形成一种以人际为核心的快速传播网络。
微博的主要功能包括四个方面:关注——用户可以选择性地关注其他用户,实时接受被关注用户所发布的信息;被关注——用户可以被其他用户(俗称“粉丝”)所关注。用户发布的信息可以实时地推荐给粉丝;一键转发——拥有粉丝多的人可以将他人的信息转发给自己的粉丝,起到扩散机器人的作用;热门用户和话题的推荐——微博管理者会根据用户的喜好向用户推荐热门的话题和微博人物,便于用户去关注。目前国内主要的微博平台包括新浪微博,腾讯微博,搜狐微博,网易微博等,境外的微博平台主要是Twitter。其中,新浪微博创建于2009年8月,到2011年底,用户数已经达到2.5亿,其主要特点是力推名人圈,舆论领袖效应明显,如影视明星姚晨,其粉丝达到2057万,她发出的微博,2057万人能够实时获取;腾讯微博创建于2010年初,通过利用QQ已有的用户资源并与QQ客户端绑定,2011年底用户数也接近2亿;境外的Twitter用户数也超过两亿,这3个微博平台每天的博文数均超过1亿条以上。
作为一种新型网络媒体,微博具有如下舆情传播特点:
1. 发布和接收信息简便。对于新闻中的相关人物,微博提供一键关注;对于传统新闻或论坛中的内容,微博可以一键发布;通过手机等移动终端,可以轻松地发送和接收微博。
2. 传播信息快捷。如2009年11月5日7时31分,西安发生4.4级地震,新浪微博仅在1分钟后即发布信息,而国家地震台网在15分钟后才第一次发布信息。
3. 裂变式信息传播模式。发布消息后,所有粉丝同时收到,他们可能再传播给自己的粉丝,微博转播的放大效应使信息呈现“核裂变”式的几何级数扩散态势。
4. 意见领袖具有强大话语权。意见领袖是指在突发事件的产生、发酵、传播等环节中起主要推动作用的网民,他们在特定的领域拥有强大的话语权,潜意识里影响着数以万计的围观群众。
二、互联网新媒体管理的当务之急:遏制微博有害信息滋生和蔓延
传统媒体具有一套“审核”机制,起到了“把关”和“过滤”的作用,信息发布的准确性高、公信力强。相对传统媒体而言,微博等新媒体比较开放、自由,缺乏严密的“把关”和“过滤”机制。微博传播具有零门槛进入、广泛性、同时性及匿名性等特点,且传播起点难以界定,网民不必对传播的信息负责。这也是微博中的流言、谎言、谣言频频出现并泛滥的原因。如果造谣者对社会现实严重不满或别有用心,并借助网络谣言以网络舆论的形式广泛传播,将对社会造成很大的负面作用。网络谣言产生的非理性情绪表达形成的网络舆论造成的危害更大,形成的网络舆论往往容易失控。
我国微博客快速发展,一些人利用微博客传播快、覆盖广的特点,肆意传播淫秽色情和低俗信息,污染社会环境,损害未成年人身心健康;各种电子商务欺诈行为居高不下;特别是对于我国社会转型期出现的一些敏感话题,微博往往成为主要的舆情场。
大连PX事件中的不实信息传播是典型案例。2011年8月,微博上开始疯传各类不实信息,如PX剧毒会导致胎儿畸形、发达国家一般距离人口稠密区至少100公里、大连PX项目自厦门搬迁而来、一个原料罐被卷入海水等。由于当地政府对微博舆情监测和响应不及时,大连8月14日爆发大规模群众游行集会抗议PX在大连设厂事件。
在国外,微博对信息的传播也产生了很多负面影响。2011年6月,英国爆发大规模暴力冲突。骚乱前,英国民众通过Twitter等网络手段频繁联系,使英国警察疲于应付。事后分析表明:Twitter等社交媒体访问量和集会关系密切,对暴力冲突起到了巨大的鼓动和聚集作用。
由此可见,过滤虚假、有害、错误甚至反动的信息,打击网上犯罪,有效遏制有害信息的滋生和蔓延,是我国互联网新媒体监控的当务之急。但是,由于微博平台用户数为亿级规模、每天产生的博文也以亿为单位,舆情传播速度为分秒级,且博文信息本身为非结构文本信息。因此,靠人工被动监测无法满足舆情监管的需求,且以往适用于新闻论坛等媒体的舆情监测手段,在微博舆情监管需求的压力下也往往不能奏效,需要有新的针对微博的专用舆情监管软件。
三、基于微博监管平台的管理手段
为了解决国家重大应用需求,必须通过信息化手段来支持网络舆情的及时分析和快速响应。微博舆情监管软件成为支撑各级业务管理部门的重要技术手段。它通过整合微博信息采集技术及信息智能处理技术,对微博海量信息进行自动抓取、分类聚类、主题检测、专题聚焦,并针对用户的舆情监测和专题追踪等信息需求,做出正确舆论引导。
面向微博监控业务,有效的管理方法需要实现监测、告警、分析、引导、评估五位一体,即监测持续稳定、告警及时准确、分析全面关联、引导简单易行、评估细致周到。
(一)管理面临的技术屏障
针对微博所具有的海量非结构化文本数据、大用户数和实时性强的特点,研究有效的微博舆情监管软件平台需要突破以下技术屏障。
1. 微博数据源的采集、存储。如何采集海量的微博数据源信息,并对其进行有效的分类、组织和存储管理。快速、准确、全面地掌握数据,是借助信息技术对微博进行监管和引导的前提基础。
2. 微博数据处理的实时性。微博舆情服务必须持续收集互联网中海量的微博信息,实时更新存储和计算,并针对信息实行实时分析与挖掘及更新服务信息。
3. 不良信息研判的准确性。微博舆情监控软件在分析和挖掘海量信息时,需要准确从海量信息中去除干扰信息,得出正确的、有价值的结果。当前海量信息中干扰信息过多,信息挖掘能力有限,得到准确的结果需要系统对信息的判断能力和挖掘能力的提升。
为应对上述挑战,可通过建立海量数据架构和统一数据处理平台,综合运用搜索引擎、文本检索、自然语言处理和智能分析等技术,对海量微博信息进行自动获取和分析,提供面向微博的不良信息监测、分析、挖掘、溯源以及报表展示等功能,满足微博舆情监控和不良信息追踪工作过程中各个环节的用户需求。(二)主要管理手段
微博上高聚集的人气和信息快速传播的能力,以及虚拟世界和物理世界的高度相互作用,要求不同于新闻论坛的管理手段。
1. 及时发现问题苗头:基于微博系统提供的全文检索功能,实现不良信息、重点人物信息在线监控。
2. 深入分析重点人物:基于以上在线监控系统获得的数据,挖掘发现关键人物及其社会关系、相关社区及意见领袖,并对不良信息和违法人员进行重点分析。
3. 建立舆论导向的引导功能:用技术和人工相结合的手段建立自己的舆论引导机制,引导舆论发展。舆论引导包括“跟随辩驳”和“集中辟谣”两部分。
跟随辩驳功能:微博等社会化媒体上不良信息爆发时,信息的传播往往具有不对称的特点,当负面虚假信息占据主流并大肆传播时,需要及时作出正面引导。跟随辩驳的目标就是在负面信息传播的同时,伴随跟进正面信息,达到正面引导信息的定向投放目标。其目的是遏制虚假消息的传播,将真实的信息及时推送到普通用户手中。跟随辩驳可以在不实信息大肆传播的时候,通过跟随的方式发帖,将正面的信息传送给不实消息的接收者,与之交锋,从而遏制不实信息。
主动辟谣功能:主动辟谣机制是指对于已经查实的不实信息,在信息上明显地进行标识为“谣言”,对于传播不实消息的用户,主动知会传播者正在传播的信息为谣言,并限制其继续进行传播。此外,还可建立可信的官方消息发布平台,集中对识破谣言的依据、辟谣的过程、实际的事实进行澄清。
(三)有效管理的技术要求
微博的监控系统需要具备以下技术要求:
1. 必须具备分秒级实时监测与报警功能。这是尽可能早地发现微博不良信息的基本要求。对于一些预定义的不良信息或违法事件,实时监测响应速度需要在分钟以内;对于未定义的不良信息或违法事件发现也应该在10分钟以内。对于社区与重点人物分析,系统处理与响应速度在10分钟以内。并应该提供直接的分钟级别的报警功能(如短信报警),这样才能满足微博监控的实时性要求。
2. 必须具备海量数据处理能力和系统可扩展性。系统存储模型基于大规模分布式文件系统,与Google、Yahoo等保持同构;程序设计模式采用计算找数据模式,支持MapReduce并行化;通信模式基于消息中间件,计算节点间全异步通信,并具有良好的兼容性;计算模型采用全局算法的分布化,实现全局数据的弱一致性维护;服务部署模型底层支持云环境,并支持虚拟机部署。
3. 必须支持“人在回路中”。用户体验是系统成功的关键。系统必须能够灵活支持用户体验,并基于半监督学习技术的系统推荐+人工确认方法进行话题归纳、子话题归纳及关键词推荐和联想,系统还可以通过不断地主动学习、(半)监督学习和协同学习算法,持续改善用户体验。
四、鹰击——一种微博舆情监测与引导系统
鹰击系统是由国防科技大学计算机学院和湖南蚁坊软件联合研发的微博舆情监测与引导平台,它依托“天河”超级巨型计算机强大的信息处理能力,基于自主研发的搜索引擎、文本挖掘、情感计算和可视化分析技术,实现了对互联网海量微博信息中潜在的网络舆情进行快速获取、有效分析、持续跟踪、及时预警、有效引导,为政府和企业领导层全面掌握舆情动态和恰当引导舆论,提供了决策分析依据。
鹰击系统包括微博数据搜索与采集、加密数据的信息还原、微博数据智能分析、微博突发事件展示、预警、引导,以及大规模微博数据的存储与管理等。
微博突发事件展示、预警、引导子系统面向海量微博数据的监控应用,支持用户定义事件、微博监控源及监控策略等,实现对从微博数据流中实时发现不良信息和违法事件,并通过直观合适的界面技术展示出来,根据预定义的预警策略进行突发事件预警,根据预定义的引导策略辅助业务人员实现处置与引导,并对引导结果的有效性进行量化评估与展示。
微博数据智能分析子系统以面向服务的方式对微博数据进行智能处理,分析、挖掘微博数据中的违法事件和不良信息的特征以实现早期预报,同时发现与之相关的社区及重点人物。
目前,鹰击系统已经在我国数十个部委及省市互联网舆情主管部门、大型企业得到成功应用。配合相关部门,鹰击系统已经在多项网络违法及不良信息处置中发挥了重要作用。系统对微博关键人物、社会关系、煽动信息传播趋势进行准确分析,使舆情主管部门能够更加准确地了解信息、减少盲动;通过使用鹰击的定向引导、伴随辩驳等技术,打压了一些谣言和不良信息传播者的嚣张气焰,使很多网民认清了事件真相,取得了良好的社会效益。
五、微博舆情监控的平台化、行业化和服务化趋势
微博舆情监控软件正向着平台化、行业化和服务化的趋势发展。目前,一般的互联网舆情监控系统基本上还是各个应用部门从各自的局部需求出发而构建的,缺乏系统化和平台化的产品研发思路。由于平台技术架构和总体应用架构方面的不足,使得很多网络舆情监控软件难以形成整体应用效果,影响了我国对网络舆情引导和掌控的能力;同时,网络舆情分析软件市场未来的发展方向是行业化与服务化,行业化主要是指舆情分析要与各行业的特点紧密结合,保证不同行业对微博数据处理的个性;服务化是舆情分析软件的另一个重要趋势,以软件运营服务模式,由专业的服务提供商提供外包服务,避免了很多重复建设和规模受限等问题。网络舆情分析软件运营服务正在成为一种新的发展模式。
(贾焰系国防科技大学计算机学院法学教授、博士研究生导师、网络与信息安全研究所副所长,中国计算机学会计算机安全专业委员会常务委员;刘江宁系湖南蚁坊软件有限公司总裁、高工;周斌系国防科技大学计算机学院教研室副主任、研究员)
(责任编辑:李志强)