新华社的写稿机器人拿了新闻一等奖,人类要不要担心被抢饭碗?

来源:观察者网综合

2017-11-24 17:09

【观察者网TMT报道】新华社11月23日报道,在2017年度“王选新闻科学技术”颁奖大会上,新华社机器人采访和写稿项目荣获一等奖。

新华社i思机器人

据了解,新华社首个机器人记者i思正是这一项目的重要组成部分。今年两会期间,i思机器人记者以首款实体智能机器人的身份亮相,将声控识别、人脸识别、情绪识别等技术集于一体,达到模拟人类记者实际采访的程度。不仅如此,写稿项目还建设了能动态学习的中文知识图谱,使得“i 思”拥有两会以及记者相关的采访知识,还掌握了上亿的中文知识图谱,涵盖社会、文化、生活、天气等百科知识。

会议期间,i思跑两会系列报道综合点击量达4500多万,被30多家媒体和专业杂志报道,在Twitter、Youtube、Face Book等海外四大媒体平台广泛传播。

看到这个消息的小编心中一紧,机器人写稿水平到这个程度了?这背后的技术原理是什么,怎么成稿的?博大精深的中华语言艺术,就这么轻轻松松被机器人攻破了?

国内外全面发展,机器人写稿成常态

2015年11月7日,新华社正式推出了机器人写稿项目——“快笔小新”,应用于新华社体育部、经济信息部和中国证券报,可以写体育赛事中英文稿件和财经信息稿件。

据新华社此前报道,“快笔小新”能够生成中、英文数据消息,包括每轮比赛的成绩公报和积分排名。在中证网内容总监李蔚看来,在几个月的测试中,从一句话的报盘到一段话的公司财报,再到根据“行情触发”写出“站上/跌破某某整数点位”快讯,“快笔小新”越来越聪明。

不只是国社一家,据人民网此前不完全统计,至少有10家新闻媒体推出了13个智能新闻机器人产品或应用,进行线上线下融合创新报道。

而相比于国内近几年才关注到机器人写稿,国外早已成立多家知名公司,例如ARRIA、AI、NARRATIVE SCIENCE,这些机器人主要应用于天气预报、空气质量、医疗报告、财经、体育等领域的写作。

其中比较比较有名的机器人编辑有两个。一个是Automated Insights公司的Wordsmith,美联社和雅虎在用;一个是《纽约时报》数字部门开发的Blossom。

2014年,美联社使用机器人一个季度就完成了3000家公司的财报文章,大大解放了人力。据虎嗅报道,AI公司的公关经理James Kotecki称,Wordsmith平台每周可以写上百万篇文章,系统每秒甚至能生产2000篇文章。

虽然在系统试行前期,每篇自动撰写的报道都会再经过人工处理润色,错误的地方会记录下来并反馈给AI公司作调整。但从2014年10月份开始,系统已经能够不经人工辅助,全自动生产内容。

机器人如何实现写稿?

北京大学计算机科学技术研究所研究员万小军曾在“全球人工智能与机器人峰会”上作出机器人写稿的分享,他表示目前机器人写稿主要有两种方式,原创和二次创作

原创即借助结构化的数据来生成稿件,比如利用数据库可以直接写成天气预报、财报和年报的稿件。二次创作即借助这些报道进行一些拼凑、改写成为新的稿件。

今年8月8日晚,四川九寨沟发生7.0级地震,中国地震台的写稿机器人仅用25秒就完成了这次的地震速报。

原创和二次创作所依赖的技术也是不太一样。原创采用的是自然语言生成技术,是从结构化数据/意义表达生成自然语言语句。二次创作采用的是自动摘要技术,从已有的文字素材中摘要,从而生成一个新的稿件。

还有一些其他相关的技术,例如文本信息推荐技术和文本复述技术

文本信息推荐技术即机器人自动推荐给用户需要的信息;文本复述技术即用不同的术语对原文进行进行重新表述。例如,“梅西获得了5座金球奖”,可以改为“梅西是五届金球奖得主”,也可以改写为“金球奖5次颁给了梅西”,这样就可以避免版权的问题,也可以让写作更加生动。

机器人写稿有何思路?

万小军介绍,就新闻资讯而言比较简单,输入结构化数据以及现有稿件,即可生成长度可控的几十个字到几千字的稿件。

如果是长篇报道,以体育赛事长篇报道为例,可以通过机器学习的手段,把在比赛过程中解说员的精彩评论和描述挑选出来,放到报道中。具体来说,首先借助机器学习的手段,对直播文字进行语句的智能排序,再进行智能选择,最后生成一个平均长度超过1000字的赛事的报道。

如果是娱乐新闻,可以根据明星的数据库,对这个明星做一个简单的描述。比如可以借助明星的微博,利用机器学习的手段,自动判别明星发的哪一条微博具有新闻价值,再判断这个微博下面的哪些评论,具有新闻价值。把微博和它的评论以及相关的背景信息组合在一块,就可以形成一则短新闻。

如果是已有事实较多的新闻,该如何做综述新闻呢?

据了解,这时候就主要以一个个子话题为单位进行组合文章,而不是句子。首先划分子话题,每个话题对应一个段落,然后对它进行一个重要性的排序,最后把这些内容合并即可得到完整事件的综述。

2015年,腾讯财经曾发表了一篇《8月CPI同比上涨2.0%创12个月新高》,虽然是常规数据新闻报道却把人类记者吓得够呛,因为文末赫然写着“本文来源:Dreamwriter,腾讯财经开发的自动化新闻写作机器人,根据算法在第一时间自动生成稿件,瞬时输出分析和研判,一分钟内将重要资讯和解读送达用户”。2017年,来自新华社机器人采访和写稿项目荣获“王选新闻科学技术”一等奖,又把人类记者吓了一跳。

不过,虽然机器人写稿发展迅猛,但在报道的深度和广度上却是远远不及人类的,人类并不用担心被抢了饭碗。如同阿尔法狗虽然打败了柯洁,我们不必感到沮丧,因为阿尔法狗就是我们创造出来的,未来机器人写稿也必将成为人类一大助力。

责任编辑:弘毅
观察者APP,更好阅读体验

习近平同马克龙和冯德莱恩举行中法欧领导人三方会晤

习近平同法国总统马克龙举行小范围会谈

中法欧领导人三方会晤结束

习近平将同马克龙和冯德莱恩举行三方会晤

“五一”近3亿人次出游,较2019年同期增长28.2%