合合信息:专注文字识别15年,“我们是人工智能行业老兵”

来源:观察者网

2021-07-09 09:55

【文/观察者网 周远方 编辑/刘惠】

2021世界人工智能大会于7月8日-10日在上海世博展览馆召开。

人工智能是上海落实国家战略部署、重点发展的三大先导产业之一,在这片沃土上,近年来人工智能领域出现了许多创新场景和前沿进展。

合合信息作为上海本土科技企业代表,2019和2020年成功在世界人工智能大会举办金融科技落地论坛,并先后邀请两位诺贝尔奖获得者参与发言。

比起今天在人工智能赛道上叱咤风云、炙手可热的“四小龙”们,合合信息要低调得多。

图片来源:合合信息

“我们其实可以称得上人工智能行业的‘老炮儿’”,合合信息董事汤松榕在接受观察者网采访时说道,“2006年刚成立时,人工智能专业毕业的人其实是不太能找到好工作的,因为大家当时都不知道人工智能可以干什么。”

但合合信息的创始团队是名副其实的正规军,大部分骨干来自摩托罗拉人工智能实验室的,创始人镇立新本人,则是中国科学院模式识别与智能系统专业的博士。

我们作为一个技术驱动的团队,选定了人工智能文字识别的方向,就是十几年一直坚持不断地投入。

“文字识别,也称为OCR,是一个比较冷门的方向”,汤松榕介绍,可能很多人觉得OCR是个非常开源的技术,像Google、百度、微软都发布了开源的OCR。但实际上,复杂场景下的文字识别技术难度很高,可能一份文件模糊到连肉眼无法分辨清楚,我们深度学习的人工智能技术能够把文档更清晰地识别出来,特别是在移动端,比如我们拍照过度曝光、反光、抖动、微弱光线等等情境下,我们拍出来的文件用传统OCR是无法识别的,我们解决的就是这种复杂场景下的文字识别能力。

合合信息是第一个把AI文字识别技术应用到移动端的公司,2009年推出第一个产品“名片全能王”,帮助商务人士捕捉名片上的信息,录入到通讯录中。就是这样的产品成为第一个帮助苹果手机跟商务社交领域打通的APP,也给苹果用户带来更好的体验。

15年默默的深耕,打磨出这次人工智能大会上的一大亮点。

甲骨文作为我国最早的成熟文字、世界四大古文字之一,因刻写在龟甲和兽骨上而得名。目前,已出土的甲骨碎片多达16万余件。可惜的是,这些甲骨碎片被埋在地下多年,经历了地下活动的冲击和挖掘造成的磨损,多数甲骨残缺严重;又由于随着人类历史的迁徙遍布于世界各个角落,很难有完整的信息。

图片来源:合合信息

随着人工智能的引进,通过图像识别技术,可以进行甲骨的自动识别、撮合,为甲骨文学者的工作提质增效。目前,这一技术处于内测阶段并首次在人工智能大会上展示,安阳殷墟景区作为这一技术的学术支持单位。

智能文字识别技术主要包含了智能图像处理,基于深度学习的复杂场景文字识别,自然语言处理三个核心技术层。智能图像处理技术主要对用户拍摄的复杂文档图像进行预处理,使得文档图像质量得到大幅度提升。例如对图像进行增强,让图像看起来更清晰,对形变图像进行还原矫正,对图像中因光照不均产生的阴影问题进行处理,对不同角度拍摄的图像进行定位和透视变换矫正。基于深度学习的复杂场景文字识别技术主要利用合合信息自研的手写印刷混排识别,抗强干扰识别,扭曲文字识别,复杂印章和手写识别等一系列先进深度学习识别技术来解决各种不同复杂场景下的文字识别问题。而自然语言处理技术,则是对识别出的结果进行进一步的语义理解。

目前,合合信息的智能文字识别技术支持中、英、俄等56种语言的文档图像、100+种证件的快读智能分类,以及全球不同国家、不同行业的卡证、票据、定制识别等多个AI场景的产品和解决方案。

谈及为什么那么专注于人工智能文字识别,汤松榕介绍,首先这是我们当初选择的方向,其实,合合信息也尝试过语音识别和人脸识别,但我们团队最终判断,语音识别和人脸识别解决的问题场景更多是面向未来,而文字是人类几千年来一直用来记录世界的工具,是人类社会运行的基础设施,所以,做好文字识别,能够更多地解决当下面临的问题场景。

图片来源:合合信息

如今,合合信息为多家知名手机大厂提供内置的文字识别的引擎。从识别名片切入,也为合合信息后续服务企业客户的业务打下基础。

“名片其实很复杂,有不同的字体,不同的排版,不同的语言”,汤松榕介绍,“我们能够快速识别名片,那自然就能识别发票上的所有字段、识别各类票据,这就很自然地切入到帮助企业实现财税自动化,提高效率;随后就是企业的档案管理和合同管理。”

接着,合合信息又切入了大数据方向,通过合规地积累政府公开数据和商业数据,合合信息2015年上线面向C端的产品“启信宝”,2018年帮助招商银行开发大数据风控管理平台。

正是在服务银行、券商等B端客户的时候,合合信息发现,B端客户的需求跟C端不同,“比如国家出台支持人工智能企业的产业政策,经常有证券投研机构来问我们,人工智能企业在哪里?这时候我们就用大数据技术去挖掘我们2.3亿家、超过1000亿条动态企业数据,找出其中有多少跟人工智能相关企业,他们都在做什么,他们都在哪,他们经营质量如何。”

通过多次这样的挖掘,合合信息形成了一个数据标签体系,什么叫瞪羚企业?什么叫独角兽企业?什么叫新经济?什么叫新基建?用数据和数字标签,就能给企业做更精准的数字画像。

这又衍生出两种业务,一是帮助龙头企业管理供应链;二是帮助政府管理产业生态。

“例如钢铁行业龙头企业,拥有2万多家公司的供应链,用传统的方式去管理供应商是很难实现的”,汤松榕说,“通过企业的标签画像库,用大数据技术来选择供应商,验证供应商,监测供应链风险,供应商评级评分,形成一个数字管理体系。”

“第二步,也是合合信息这么多年来坚持在做的‘苦活累活’,就是把企业和企业联系起来看,发展产业链数据库”,汤松榕说,“比如在某生物制药产业园,我们能够说清整个生物制药产业链的构成,有做试剂的、做临床的、做研发的、做生产的、做配套的,每个环节的质量如何,这些企业跟全中国平均水平比较,处在什么样的位置?哪些企业迁入迁出?我们可以为地方政府提供这样充分的数据,辅助政府判断和决策,动态、实时地管理整个产业生态。”

基于这些能力,合合信息推出“信息数字政务大脑”,对全量企业、全产业链和区域经济进行多维度政企数据融合、分析、挖掘。

“数字政务大脑”由四个主要部分构成:区域经济数字监测大脑、产业链数字招商大脑、辖区企业数字监管服务大脑、精准政策数字服务大脑。

区域经济数字监测大脑:通过企业全域数据采集,将区域经济运行情况进行数字化动态监管,将企业基本信息、企业特征、融资情况、风险状况等数字化内容进行结构化、可视化、交互化的呈现。

产业链数字招商大脑:数字招商地图,精准招商提供决策支持。通过对重点产业发展分析与研判,发现本地优势企业,寻找区域产业发力点,为政府数字化精准招商提供决策支撑。

辖区企业数字监管服务大脑:对企业进行一企一档全生命周期管理,实时量化和监测区域市场主体活力。帮助政府及时发现不同产业、不同发展阶段的优质企业,监测企业多维经营风险。让数据懂业务,让数据帮助决策。

精准政策数字服务大脑:数据智能一体化,推动政务政策精准服务。“数字政务大脑”可以实现政策扶持与企业需求的一站式对接,自动化识别不同企业的个性化发展诉求,为政府精准政策扶持和高效服务提供决策支撑。

作为人工智能及大数据科技企业,合合信息通过智能文字识别及商业大数据领域的核心技术、C端和B端产品以及行业解决方案为全球企业和个人用户提供创新的数字化、智能化服务。

谈及人工智能行业的前景,汤松榕仍然很务实:“我们的投资人说,你们是极少数能够靠人工智能来赚钱的企业”,近年来,人工智能作为最热门赛道之一,涌入了大量资本,曾有一段时间,人工智能似乎被宣传得无所不能,把前景想得太美,但最近似乎又遇到一些发展瓶颈。

“凡事都有一个发展规律”,汤松榕说,“这两年有点收紧,但我觉得这些行业的应用空间也还是会继续成长的,总体来讲,对人工智能这个行业,我们相信它还在一个比较健康的方向上前进。”

本文系观察者网独家稿件,文章内容纯属作者个人观点,不代表平台观点,未经授权,不得转载,否则将追究法律责任。关注观察者网微信guanchacn,每日阅读趣味文章。

责任编辑:刘惠
人工智能 2021世界人工智能大会 世界人工智能大会
观察者APP,更好阅读体验

美方对俄隐瞒了部分信息?克宫回应

这条中马“一带一路”重点铁路项目 “或延伸至泰国”

国防部表态:中方不会在南海问题上任菲胡来

关于ASML出口管制,荷兰首相在华表态

警惕!“隐秘”的调查暗藏国家安全风险