您做在的位置: 中国投资 > 产业企业 > 科技创新要加大基础研究投入——专访科大讯飞智慧城市BG副总裁童剑军

科技创新要加大基础研究投入——专访科大讯飞智慧城市BG副总裁童剑军

科技创新要加大基础研究投入——专访科大讯飞智慧城市BG副总裁童剑军

文|张盼

 导 读 

如果加大数学、物理等基础科学的研究投入,人工智能技术的另一方向——类脑科学的质变可能发生在中国

政府和市场要能容错

企业需有埋头苦干精神

成为全球语音交互领导者


政府和市场要能容错

《中国投资》:人工智能核心技术是在美国,但中国的场景落地比美国更具优势,现在业界很多学者和研究者认为人工智能领域未来二十几年内在中国都不会有特别大的突破,您怎么看?

童剑军:人工智能技术现在最主流的叫做深度学习框架,深度学习框架是美国人2006年提出来的,是一个公开的一个理论体系,这个框架的提出是人工智能技术发展的一次质变,也就是核心科技创新,而基于这套框架,世界上一些研究人员、企业进行相应产品、系统的开发和应用,则属于量变,属于场景应用创新。从本质上来说,深度学习的框架是基于概率论的基本逻辑的,基于大量数据,数据越多效果越好。正好因为经济体量和市场规模巨大,所以中国国内的场景需求和数据远多于美国,做得也会比美国更深入,应用更为广泛,市场效益也更明显,这都是场景应用创新带来的,也是企业非常看重的方向。

除了基于数据概率逻辑的深度学习框架,人工智能技术另一个研究方向是研究人的本质学习逻辑,这个方向在学术上称之为“类脑科学”。它与深度学习框架最大的区别在什么地方呢?比如让一个人类来认一个“张”字,只要学习不到10个“张”字的图案就基本学会了。但基于深度学习框架训练的人工智能机器人,它需要把所有不同字体的“张”字输进去才能基本认识这个字,机器它本身并不具备想象力和联想空间,但人脑却能够用非常少的数据和能量来完成非常复杂的智能运算和判断,它的运行机制和和我们已知的机制有很大不同,研究这个问题我们称之为“类脑科学”。
行业内普遍都相信,类脑科学将是人工智能技术的下一次质变,但类脑科学质变到现在为止还没有非常显著的成果出来,目前中国也有很多团队在研究这个课题。如果我国从政府,到企业,上上下下加大在数学、物理、核心科技研究等基础科研究学的投入,人工智能的下一次质变也可能发生在中国,但如果只关注场景应用创新,那就只能跟在别人屁股后边跑,永远无法领先。

《中国投资》:现在其实科技公司还挺多的,您如何评价现在的技术创新公司?

童剑军:科技公司往往以科技创新作为口号,有些是在核心技术方面取得一些突破,有些则拓展了某一技术的应用场景或者模式。在现在这个竞争激烈的市场环境下,没有创新,抱残守缺肯定没有出路。

行业不同,技术不同,领域不同,让我去评价现在众多的创新公司,说谁好谁不好,没有谁有这个能力。就我个人观点认为,越是具有自主核心能力的科技企业,其发展后劲会越足,也越可能受到资本市场的青睐。

《中国投资》:政府对这些科技企业的补贴力度很大,您认为中国的产业政策核心应该是解决什么问题?

童剑军:就人工智能产业方向而言,应该解决两个方面的问题。
其一,是应用产业政策,鼓励人工智能创新应用,在这方面,因为人工智能技术的固有特性,需要一定的市场宽容度。就拿语音识别技术来举例,当年开始的时候准确性也只有百分之六七十,但在应用中锤炼,在项目中同步进行数据采集和训练,逐步提升识别准确性,识别越来越准确,使用范围越来越广,最终带动了很大的产业发展,这个过程需要时间,需要持续的政策扶持,其他人工智能技术应用也是一样的。

其二,是对于基础源头技术开发的政策支持。基础技术的投入是存在一定的不确定性的,它是研究性、探索性的事情,许多科学研究是无法度量和预测的。所以对科研人员而言,需要有板凳能做十年冷的精神,对政府和市场来说,需要有宽容度和容错率,要鼓励科研单位或者企业在源头技术方面进行探索和开发,这是造发动机的事。

企业需有埋头苦干精神

《中国投资》:据您所说每一家公司都能去围绕核心技术去做应用的研发,那语音技术的门槛到底是在哪里?在智能语音技术领域,科大讯飞不仅面临同类型语音技术公司的竞争,互联网巨头也入局开始分割市场的蛋糕,科大讯飞的竞争壁垒是什么?

童剑军:科大讯飞的搞技术开发的人一般都知道有个“二八定律”。简单来说,就是使用20%的投入,能够获得80%的效果,但剩下的20%的效果,却需要付出80%的投入才能达到。如果把二八定律套到语音技术方面,一些小的初创公司或者研究所进行小的投入,就基本可以完成语音转文字的识别功能,机器念出来也字正腔圆,像模像样的。这就是使用20%的投入,获得了80%的效果,那么剩下的20%的效果呢?就得解决很多实用化过程中的困难问题了,比如说口音问题,方言问题,口头禅语气词的过滤,还有高噪声环境下的准确识别等,解决这些问题需要付出80%以上的精力或者投入。经过二十年多年在语音合成“自然度”方面的努力,现在的合成效果已经让人很难分辨出是真人发声还是机器合成了。市场上做语音技术的企业不止科大讯飞一家,但能够投入这80%的精力,去把那20%的效果解决,科大讯飞应该是做得比别人都要深,都要细,都要好,这就构成了科大讯飞语音技术相对同行来说的一个壁垒。并且这个壁垒的建立是需要花大量的时间和采集大量的数据,经过大量的尝试和摸索得到的成果,不是随便砸钱就能砸出来的。从这个角度来说,就语音相关核心技术领域而言,科大讯飞不怕对手的追赶。

《中国投资》:科大讯飞1999年成立,2008年上市,您觉得今天科大讯飞能在语音上领先,主要原因是什么?

童剑军:在这个比较浮躁的市场环境中,缺少的是埋头苦干,奠定源头技术基础的企业。我们一直把核心技术开发作为本义,为此,科大讯飞组建企业级研究院,每年投入数亿元开展核心技术的开发,正如此,科大讯飞今天才迎来价值升华期。

《中国投资》:国内人工智能产业兴起,需要大量的人才,科大讯飞在这方面有些什么建议?

童剑军:在人工智能领域,中国缺少足够的人工智能产业人才,特别是应用型人才。有公开资料提到中国的人工智能和大数据人才缺口达到500万,缺口巨大,科大讯飞目前正在采取校企合作的方式,由企业去帮助学校建立人工智能专业,进行双师教学,效果很明显。举个例子,安徽省有一个二本高校,叫安徽信息工程学院,简称“安信工”,与讯飞进行了好几年的人才联合培养计划,这个学校计算机系的学生毕业之后,实践操作能力很强,半年内的平均工资薪资已经高于一本院校同专业学生,并很快成为开发骨干,对比非常明显。

成为全球语音交互领导者

《中国投资》:今年科大讯飞在教育方面已经走向国际,与联合国的教科文组织有合作,科大讯飞现在在一带一路的沿线国家上有哪些布局?有无国际化的考虑?

童剑军:不仅仅是教育,在翻译、听见转写、医疗、城市等业务上,科大讯飞都在积极探索国际化。比如在国内企业往外走的方向上,科大讯飞具有先天的语言优势,出国必然会碰到外语,科大讯飞翻译机目前可翻译语种已能覆盖全球近200个国家和地区,其中就包括几十个一带一路沿线国家和地区。去年在保加利亚举行的中国-中东欧国家地方合作成果展上,李克强总理自掏腰包购买了一台讯飞翻译机赠予保加利亚总理。

国际化是讯飞发展战略中的重要一部分,但从股权结构上来说,作为掌握语音核心技术的公司,讯飞本身没有任何外资成分,暂时也没有吸引外资参股的想法和计划。

《中国投资》:科大讯飞下一步目标和计划是什么?

童剑军:展望未来十年,语音将成为重要的人机交互方式。科大讯飞有信心成为万物互联时代语音交互的全球领导者、成为全球机器翻译的领导者、成为多领域A.I.赋能的全球领导者。



编辑 | 张盼

设计 | 孙子悦