麻省理工科技评论:想理解中文,人工智能还得继续努力

来源:微信公号@闻一哆

2017-07-25 20:05

【综合/观察者网 韩京霏】会写散文的百度大脑、阿里巴巴的天猫精灵,战胜了柯洁的AlphaGo……近年来,人工智能不再只是科学家口中的超前概念,而是逐渐进入到大众的视野当中。

不过,麻省理工科技评论网站7月25日发表了一篇文章,认为识别中文这件事情,不只是对于歪果仁来说有点难度,对于人工智能也不是非常容易。人工智能想要高效识别中文的话,还得再努把力。

麻省理工科技在评论中,列举了来自阿里、百度等中国企业在国内目前具有较强代表性的声音识别类人工智能。

实际上,美国类似产品的火爆,已经引起了中国科技投资者的兴趣。研究公司IDC预测,到2020年,51%的智能驾驶产业、68%的手机和可穿戴设备产业,都会覆盖基于会话的人工智能系统。

最著名的可穿戴设备之一:Google Glass(资料图)

不过,评论认为,人工智能在真正“理解”中文的路上,可能还需要再努力一些。

首先,在输入文字方面,输入中文就要稍微难一些。现在,如果想用键盘输入中文,我们最常用的途径就是拼音输入法。

但是,中文的特点是它有四个音调,于是同一个拼音组合下可能会出现不同音调的汉字,而且还存在着非常多的同音字。这样的话,我们就不得不进行一个“选字”的工作,在很多同音字中,选出自己想要的那一个。

毕竟,如果不选字的话,“季姬急极屐击鸡”和“石室诗士施氏,嗜狮,誓食十狮”这种千古奇文,实在是不知道应该怎么打出来……

面对博大精深的中华文化,我的心情非常复杂

一些比较智能的输入法,可能会根据上下文去试着推荐一些字符,但是这种推荐的精度也相对有限。

所以,可能正因为如此,中国的主流通信应用程序(如微信),是主打用语音来传递信息的。而在美国,这种程序的主要沟通方式一般是文本。

面对这个问题,一些人工智能的开发者,会试图用语音命令的方式实现人机沟通。在这种方式下,机器将用户的语音转换为文本,再根据文本的意义作出反馈。

这种方法在针对某些特定任务时非常有效,比如,用户可以对机器说话,要求手机实现“查询天气”或者“把某个词语翻译为英文”之类的特定指令。但是,一旦对话里有多个不同的话题,或者有上下文的话,这个方法就不太灵了。

解决中文对话的另外一个挑战,就是作为一种语言,中文本来就很复杂。比如,即使是完全相同的文字,以不同的顺序排列可能也会出现完全不同的含义,比如“脑满肠肥”和“满脑肥肠”……或者“雾锁山头山锁雾,天连水尾水连天”。

这种情况下,想要理解一句话的含义,就必须得通过上下文了。

而且,中文句子也不会像英文句子那样,用空格把单词之间彼此隔开。所以语言处理人员就必须要让算法能够正确地断开单词。

另外,中文没有时态,所以机器在判断时间轴方面,也存在着一定的困难。

“我不知道怎么调戏Siri,反正它已经调戏得我快哭了” 图/知乎用户@姚米兔


图/@同桌来成为我机智的幼驯染吧

人工智能面对的挑战,还包括对中文语义的理解。

中国幅员辽阔,存在着大量的方言,而方言与方言之间彼此可能完全不同,比如福建人和广东人虽然长期相爱相杀,但是未必能顺利对话。

而且,同一句话在不同语境下的意义,可能也会变得完全不同,最典型的就是逼疯外国人的“如果你来早了,你就等着吧;如果你来晚了,你就等着吧。”

那么,应当怎么解决处理中文指令时遇到的这些问题呢?

一位清华大学教授指出,如果想真正理解讲话者的意图,实现恰当的沟通,计算机就需要把语调和压力这些细微的线索也考虑进来。

另一位副教授也表示,计算机需要适当地理解人类的情绪,因为人类的决策并不是完全依赖于逻辑的。

会说方言的siri 图自华人街/@我和siri的故事

好在,中国研究人员的一大优势是,数量巨大的用户群提供了海量的数据——由于支持电脑进行语音理解的神经网络需要大量的数据进行训练,因此,公司拥有的数据越多,它的神经网络就会越来越智能化。

百度和阿里巴巴这样的公司,就都受益于广泛的用户群。麻省理工科技评论给出的数据显示,截至2016年底,百度的月活跃移动用户达到了6.65亿;而截至今年3月份,阿里巴巴的月活跃移动用户也达到了5.07亿。

除此之外,阿里巴巴的一位研究人员也给出了另外的解决方法:运用关联主题下的数据来调教神经网络,而不是全部都依靠大数据。

比如说,如果想要训练神经网络理解与“运动医学”这个主题有关的指令,就可以利用“运动”和“医学”两个话题中的数据来进行。

这种方法不如大数据好用,但是如果缺少大数据的话,这种方法至少能确保,在某些话题下,技术人员依旧能够对神经网络进行训练。

这样看来的话,说不定,能否顺利掌握中文,可以成为测试人工智能语言理解功能的试金石呢~

责任编辑:韩京霏
人工智能
观察者APP,更好阅读体验

以色列“有限复仇”:选在了伊朗核计划中心

以色列“报复”开始:伊朗多地传出爆炸声

5.3%,一季度“开门红”能转化为“全年红”吗?

“以色列精心策划俩月,但严重低估了伊朗反应”

美国胁迫下,阿斯麦CEO最新涉华表态