陈昫:关于特朗普,大数据能告诉我们什么?
来源:观察者网
2018-06-14 08:05
【文/观察者网专栏作者 陈昫】
6月12日“特金会”的成功举行,使特朗普又一次成为了媒体聚光灯下的焦点。
这位蝉联2017年和2018年“《时代》全球百大最具影响力人物”的总统,自入主白宫以来,始终是媒体争论的焦点,例如《美国新闻与世界报道》的评论员利兹·麦尔称特朗普在执政第一年的成果“很有可能是历任总统中最棒的”;而《华盛顿邮报》的专栏作者丹纳·米尔班克则认为特朗普的执政能力糟糕透顶,对其极尽揶揄讽刺之能事。
在这位“争议总统”身上,有着太多的矛盾、不解和谜团,在特朗普上任近一年半之际,我们不禁想问,世界媒体究竟如何看待特朗普?
新闻类大数据库为我们解答这一问题打开了一扇窗,但处理并分析大数据,通常要求使用者具有较强的专业背景知识,对初学者而言难度较大。针对这一问题,著名的“全球事件、语言与语调大数据库”(GDELT)率先给出了解决方案。
2017年11月底,GDELT正式上线了“总结”(GDELT Summary)功能。GDELT Summary是一个基于浏览器的大数据可视化处理平台,能够对海量的全球新闻文本和图片进行整合分析,其参考资料库每15分钟更新一次,监控并收录包括65种语言在内的全球新闻报道。该平台提供了强大的自定义分析功能,使用者既能够实时了解最新消息,也能够对感兴趣的主题进行深度跟踪研究。基于GDELT Summary,笔者尝试回答如下四个问题:
问题一:和其他国家领导人相比,与特朗普有关的新闻会更偏消极吗?
新闻呈现为消极或者积极,其实指的是新闻的综合语调指数(Tone)。
对语调进行量化界定,是GDELT最强大的功能之一。一般而言,新闻中积极、正面、肯定的要素,会被视为是积极的语调;而消极、负面、否定的内容则可能被判断为消极的语调,用积极的语调减去消极的语调指数,便可得到新闻的综合语调指数,GDELT Summary中所呈现的皆为新闻的综合语调指数。
在进行比较分析之前,不妨先来看看过去一年中,涉及特朗普的全球媒体报道所呈现的综合语调指数究竟如何:
在上图中,横轴表示新闻报道所呈现的综合语调指数,从左至右逐渐从消极向积极转变。纵轴代表符合相应语调指数的新闻数量。
由图可知,与特朗普有关的新闻报道,偏消极语调的新闻占绝大多数。根据新闻数量和各项语调指数值,我们可以对全部新闻的平均语调值进行计算,得到平均值为-2.43。那么和其他国家领导人相比,这一数值总体处于何种水平呢?
为了回答这一问题,笔者选取了除新任意大利总理朱塞佩·孔特之外,八国集团的各国领导人作为参照,包括英国首相特里莎·梅,俄罗斯总统普京,法国总统马克龙,德国总理默克尔,加拿大总理特鲁多,日本首相安倍晋三,以及美国前总统奥巴马,计算过去一年中与之相关的全球新闻的平均语调指数,并进行横向比较分析。如下图所示,纵轴代表新闻的平均语调指数。
我们惊讶地发现,涉及上述所有领导人的新闻报道,其平均语调指数都是负数,即偏消极的。涉及特里莎·梅的报道负面指数最高,而与安倍晋三有关报道的负面指数最低。此外,涉及特朗普的报道负面指数优于特丽莎·梅、普京、马克龙和默克尔,稍逊于特鲁多和美国前总统奥巴马。
这样看来,看来这位喜欢“推特治国”且经常批评“Fake News”的特朗普总统,其“媒体口碑”总体上似乎还算不错,甚至优于英法等老牌欧洲资本主义国家。
但正如龚为纲在《世界如何报道中国——大数据的视野》一文中所指出,媒体报道的倾向性会不会对这一结果造成影响呢?换言之,不同国家的媒体,在报道特朗普相关新闻时,是否存在新闻语调方面的差异?
问题二:不同国家涉及特朗普的新闻报道,其新闻平均语调指数是否存在差异?
在此分析阶段中,笔者主张考察“官方语言新闻”的影响力,即对国家和新闻文本语言进行“配对”。例如,在收集与特朗普有关的中国媒体报道时,将地域和语言分别限制为中国和中文,这样可以排除《China Daily》等非中文媒体报道对分国别的新闻语调指数所可能产生的影响。以中国为例,如果仅考察“涉及特朗普的中国新闻”,则相关报道的平均语调指数为-1.94;而如果考察“涉及特朗普的中国中文新闻”,则平均语调指数为-1.70。
笔者选取中、日、韩、英、法、德、俄七国,对过去一年中和特朗普有关的“官方语言”新闻报道进行分析,并计算其平均语调指数,如下图所示:
该图揭示了一些很有趣的现象:俄罗斯媒体在报道与特朗普有关的消息时,其平均语调指数最为消极,考虑到特朗普上任以来,美俄关系较为紧张,这种宏观局势很可能会影响报道的语调倾向性。但美国的传统盟友英国、法国、德国,在报道与特朗普有关的新闻时,其平均语调指数也都偏消极。而中国、韩国、日本三国媒体,涉及特朗普的新闻报道,其平均语调指数优于西方国家,特别是日韩两国在涉及特朗普的新闻语调方面,明显向中立的方向靠拢。
问题三:特朗普治下的美国电视媒体热点,和奥巴马执政期间有区别吗?
GDELT Summary于今年2月新增了“电视节目比较”(TV Comparer)模块,这为我们研究特朗普和奥巴马执政期间,美国电视媒体的热点(高频词汇)差异提供了可能。
笔者选取了CNBC、CNN、FOX NEWS、CSPAN、MSNBC共五家美国境内频道,分别以两人执政第一年为查询时间段,以“美国”(United States)为关键词进行联想查询。在剔除president,Mr.等部分无实际意义的单词之后,可以得到特朗普和奥巴马执政第一年期间,电视媒体关注的前二十大“热词”如下:
总的来看,奥巴马和特朗普执政期间的美国电视媒体热词有着明显的差别。
首先从词性的角度来看,奥巴马执政首年期间的热词,其中有3个为褒义的形容词,包括good,great,supreme等,可以说充满了“正能量”。而特朗普执政首年的热词则“务实”得多,几乎全部是名词。(North Korea,White House等专有名词中的形容词不纳入计数),而在这些名词中,朝鲜、俄罗斯、中国、墨西哥等国家名称的出现,表明特朗普政府的对外工作目标具有鲜明的国家针对性,这也体现在特朗普“修墙”、“贸易战”等一系列对外政策之中。
其次,同样是执政首年,特朗普的名字已经稳居热词榜的次席,相比之下,奥巴马连榜单前十都进不去。在感慨特朗普“刷存在感”的同时,其实这也在一定程度上反映了特朗普受到媒体的关注度更高,也反映了特朗普政府对媒体的影响力与控制力,较之前任很可能有所增强。
再次,特朗普执政时期的热词榜出现了贸易(Trade)这一关键词,奥巴马执政首年也有市场(Market)、公司(Companies)等与商业有关的词汇,但海军(Navy)这一军事性用语首次出现在热词榜之中,结合近期中美贸易争端的发展态势,或许可以推断在未来较长一段时间内,美国都会较为倚重军事和经济筹码,以维护其世界主导地位。
问题四:通过大数据分析,我们可以得到哪些启示?
通过对新闻报道的平均语调的分析,以及对特朗普和奥巴马执政首年期间电视节目热词的比较,笔者认为,可以推断特朗普政府和奥巴马政府,在运作方针、政治战略、工作重点等方面存在差异,但其具体的政治含义、战略对策和启示,不在本文的探讨范围之列。笔者希图以社会学研究者的身份,就“大数据视角下的新闻语调”这一问题,简单谈谈些许不太成熟的想法。
首先必须承认的是,对同一事件、人物有关的新闻语调,可能因政治、文化、撰稿人自身因素之影响,而出现差异,也即“一千个人眼中有一千个哈姆雷特”。但东西方媒体在报道涉及特朗普的新闻时,平均语调所存在着的差异,则不能简单地用“个人好恶”、“东西方文化差异”等理由搪塞过去,而是要注意到一个关键问题:我们所采用的语调指数,是通过一定的算法,对原始文本进行处理而得来,也就是说,其实是二手数据。
受到算法的限制,针对某些内容,比如汉语文本,以及日语平假名、片假名、汉字共用的文本,其综合语调的计算可能会产生一些匪夷所思的结果。例如,中国日报网于今年5月14日刊载了一则题为《特朗普录母亲节视频赞扬自己母亲,只字不提梅拉尼娅》的新闻,从新闻标题到内容怎么看都不像是一篇完全正面的报道,但在GDELT数据库中,该文的综合语调指数却高达6.0,相当“正能量”。这也意味着对大数据进行处理的相关算法,还需要在未来的应用和实践中,进一步优化与完善。
其次,新闻大数据的语调不能告诉我们媒体对特朗普给予了“哪些”评价,但却能很好地阐释破除对特朗普“刻板印象”的重要性。
我们经常可以在网上看到诸如特朗普领导班子运作不稳,人员更迭频繁等相关消息,似乎特朗普本人及其领导成员处境不佳。但数据分析的结果表明,在这一系列看似消极的新闻背后,特朗普在新闻语境中的真实形象可能并没有我们想象的那么糟。所以,我们应当小心不要轻易形成对特朗普本人及其领导成员的“刻板印象”,从而在战略上忽视了特朗普统治集团这个强大的对手。
在个人层面,要注意对特朗普“听其言,观其行”;在集体层面,应关注特朗普统治集团的动向,透视美国政界所可能发生的微妙变化,时刻把握美国统治阶级对华态度与政策的转变。在这一过程中,大数据,特别是新闻大数据将可能发挥越来越重要的作用。
本文系观察者网独家稿件,文章内容纯属作者个人观点,不代表平台观点,未经授权,不得转载,否则将追究法律责任。关注观察者网微信guanchacn,每日阅读趣味文章。