联系
我们
投稿
反馈
评论 返回
顶部

内容字号: 默认 大号超大号

段落设置: 段首缩进取消段首缩进

字体设置:切换到微软雅黑切换到宋体

声智科技CTO冯大航:AI章鱼系统架构在智慧城市的进展与应用

2019-09-22 16:24 出处:互联网 人气: 评论(
梵克雅宝招聘 股票网 tonight merry christmas 股票行情查询 天下财经投资者说 good boy 鬼眼狂刀游戏 热血无赖飞膝击晕

声智科技CTO冯大航:AI章鱼系统架构在智慧城市的进展与应用

作者:网络

分享

  9月21日,中国人工智能大会2019(Chinese Congress on Artificial Intelligence 2019,简称“CCAI 2019”)于青岛胶州方圆体育中心盛大开幕,本届大会以“智变融合”为主题,由中国人工智能学会主办,是我国最早发起举办的人工智能大会,声智科技联合创始人兼CTO冯大航受邀出席并发表演讲,此次大会有超过100位国际人工智能领域顶尖人才,800余位国内外人工智能领域专家教授、头部企业高管及行业代表,2500余位专业观众共同参会。

  大会期间,声智科技联合创始人兼CTO冯大航以《智慧城市中声学与AI融合技术的进展与应用》为主题发表了演讲。冯大航表示,中国的智慧城市处在一个快速发展当中,以声智科技为代表的人工智能企业将声学与人工智能融合应用在智慧城市里面的方方面面,例如在智能交通领域进行监测,安防提出的需求是希望给摄像头“装上耳朵”,可以实现对异常声和某些关键词的监测。又比如应用在智能家居里的智能空调、电视等等,以及应用在政务系统中可以极大的方便市民迅速获得需要的服务。这些案例声智科技都已经在参与,并且已经有了一些项目完成落地。

  基于这些项目经验,我们将观察到的现象总结为两大趋势:

  一是在技术上,声学与人工智能正在不断地融合——通过深度学习进行信号处理和语音识别等,应用在智能安防和智慧交通等诸多领域;二是在新的场景下,新的系统架构正在形成——章鱼架构,且具有更强大的计算和控制能力,基于“章鱼架构”的模式声学与人工智能融合的案例已经应用在智慧城市的方方面面。

  交通、安防、政务、教育……城市生活包含着多个场景,也充满着各式各样的设备。以AI为核心的智能化如若要实现在城市的广泛应用,自然需要完成在不同设备间的真正落地。为适应这一新需求,更好的服务客户,声智科技推出了SoundAI Azero 智能操作系统。其具有更加智能的终端控制能力、更强大的计算处理能力、更快速的网络传输能力以及更个性化的定制能力。

  我们认为未来会出现更多的“章鱼”系统,并且进化的更加智能,同时越来越多的“章鱼”系统出现后会产生“智慧的规模效应”,产生一个更大提新型系统。

  据悉,声智科技成立于2016年5月,是全球领先的远场智能交互系统提供商之一,专注于声学语音技术和语言理解技术,致力于通过不断引领真实环境下的人机交互体验,实现“让机器更智能”的使命,达成“用科技改善生活”的愿景。声智科技核心团队来自中科院声学所,聚集了全球著名高校的毕业生和著名企业的商业精英,以及中关村、福布斯、胡润以及IEEE、ACM、ASA、AES、中国人工智能学会、中国计算机学会、中国声学学会等众多高端人才。

  以下为冯大航演讲实录:

  大家好,我是声智科技的联合创始人兼CTO冯大航,我们公司主要专注于声学和人工智能的融合,今天我主要希望分享一下我们公司这几年在智慧城市中的进展与思考。

  首先看一些数据,根据2013-2017年中国智慧城市数量与投资规模的曲线图可以发现,无论是试点的数量还是投资的规模都是一个逐年上涨的过程,可以说中国的智慧城市是在一个快速发展当中,我们公司主要做声学与人工智能的融合应用。声学在智慧城市里面也有很多重要的应用,例如在智能交通领域进行监测,安防提出的需求是希望给摄像头“装上耳朵”,可以实现对异常声和某些关键词的监测。又比如应用在智能家居里的智能空调、电视等等,以及应用在政务系统中可以极大的方便市民迅速获得需要的服务。这些案例我们都已经在参与,并且已经有了一些项目完成落地。  

  基于这些项目经验,我将观察到的现象总结为两大趋势:

  一是在技术上,声学与人工智能正在不断地融合。二是在新的场景下,新的系统架构正在形成。接下来,我将主要就这两条脉络进行阐述。

  我们公司产生之初就致力于声学与AI的融合,2014年以前声学和语音信号处理以及语音处理的交叉不是特别多,都在独立向前发展,特别是深度学习被用于语音识别以来,语音识别率得到了很快的提升。  

  上图展示了语音识别出现以来的错误率曲线,可以看到,最关键的一点出现在2017年微软推出一套语音识别系统,其语音识别错误率达到了5.1%,首次低于人类的语音识别错误率。人类在数据集上达到什么水平呢?通常,一个正常人在数据集上平均值错误率是5.9%,即使受过专业的训练的人,在这个数据集上错误率也达到了5.2%。可以说,至此,语音识别发展已经达到非常成熟的程度。

  其实语音识别在商业应用中受到一些阻力,比如手机上的语音助手应用的不是特别多。但在2014年亚马逊推出智能音箱以来,语音识别得到越来越多的关注,比如说房间的混响、旁边的背景噪声以及人声干扰,在这种情况下,其实信号处理是可以做一些工作的,比如我们可以利用麦克风阵列将目标声音和噪音区分开,从而让语音识别率有一个明显提升。

  这里面便涉及到信号处理与语音识别的融合的过程,接下来我会举一个更简单的例子,当然可能更偏于学术一些,去解释一下背后更深层次的原因。

  以混响为例,现在我在这里演讲,在座的观众听到我的声音其实是我本人的声音和经过强烈的反射后的声音的叠加,在数学上怎么表示呢?可以表示为一个纯净的信号经过房间重新响应得到混响的信号,可想而知,这样一定不会得到一个好的结果。现在一些学者们也在进行深入的研究,比如说让语音信号经过多种房间的重新响应再训练网络,我认为这也不是特别完美的一个过程。首先,即使在同一个房间里面每个点也是不同的,我们有很多的房间,这是很多种组合,相当于同一条语音,可能变化出非常多的一种方式,在这种情况下,让深度学习的网络去学习东西,效果会有所折扣。

分享给小伙伴们:
本文标签:

更多文章

相关文章

  • 蛮便宜网
  • 天猫内部优惠券网
  • Copyright © 2002-2011 版权所有