联系
我们
投稿
反馈
评论 返回
顶部

内容字号: 默认 大号超大号

段落设置: 段首缩进取消段首缩进

字体设置:切换到微软雅黑切换到宋体

无数据不AI,无人工不智能

2016-10-23 10:16 出处:互联网 人气: 评论(
李波儿微博 李继耐的儿子 李丽珍之蜜桃成熟时 李晓波 诺贝尔 李依瑾整容 丽春苑情色论坛 立春过后是立夏 恋爱妙不可言 恋迹社区

ZD至顶网软件频道消息: 今年以来又出现了很多热词,不止大数据,人工智能(AI)、深度学习(deep learning)、机器学习(machine learning)、AR、VR……形色的创业团队鲸吞了市场上相当一大部分的投资。所有这一切好像跟我们相关,但好像离商业价值又那么远,他们之间到底跟数据有什么关系,有没有可能给其他行业创造价值?

进入后数据爆炸时代

其实整个人类的发展历史,就是人类不断的尝试去记录以及去测量自身和世界的过程,无论从古时候人类发明算盘,发明阿拉伯数字,又到近代发明二进制计算机,好像都是这一现象的反应,但是人类对自己,包括对世界的认知好像还是那么浅。比如描述一个人的时候还是只能说这个人的性别是男是女,年龄是老是少,身高、体重等等,我们提到环境的时候还可能说今天气温怎么样,湿度怎么样等等,好像我们对世界的认知还是那么粗浅。但是人类对于数据测量自身的需求一直没有减弱。

根据TalkingData的数据统计,现在在中国,智能手机含平板电脑拥有13.05亿用户,智能手表包括这些可穿戴设备已经达到千万级,这意味着什么?智能手机、智能设备基本上人手一部甚至多部,无处不在,无时不在。而每部智能手机平均携带多达16种的各种传感器,每天产生1G数据,这不仅加强了人类感知以及数字化世界的能力,也让数据以前所未有的速度在产生和发展。所有这一切现象,都揭示了以人为中心的世界正在加速数字化。这是一个数据爆发的时代。

人工智能:“已经过了单纯积累数据量的时代”

移动设备已经成为人类身体的延伸。根据TalkingData的数据统计,我们每天手机使用时长将近四个小时。好像历史上第一次有这么一件东西跟着人在一起,它甚至已经变成人体的一部分,它默默在后台记录着我们,不管上网,还是在现实生活中,在家中,在上班,在吃饭,在旅游,在消费,我们所有的足迹都在被默默地记录下来。好像我们这些数据行业迎来了历史上最好的时刻——数据爆发的时刻。

但是,这已不是一个单纯的积累数据量的时代,这个新的时代,对计算提出了更高的挑战。

第一,   这些数据并不是所有的都被存储和收集。前面提到除了摄像头和话筒,一个手机携带的传感器数量多达16个。这大量的隐形数据的采集、运算、存储、传输等等领域依然存在着巨大的障碍。

第二,   如何从大量的数据里面解读人的动作,识别人的场景是更加重要的一个问题。现在的很多数据都是非结构化的情境数据,例如图像、声音、姿态、动作等等,需要人工智能的帮忙从中间提炼有价值的信息。所有的世界上顶尖的技术公司都在做一件事情,就是尝试用算法用机器学习去还原人在现实生活中的动作,不管视觉、听觉、姿态、感知还是做一些基础的工作,现在语音识别的技术,图象识别的技术都在大规模的发展,但是为什么当数十亿大脑神经元彼此传递信号时,就会出现喜爱、恐惧或者愤怒的主观感受呢?对此,我们依然一无所知。人工智能对世界的认知还停留在早期阶段。

数据促进了人工智能的发展。AI过去与现在的最大区别是,必须的计算能力、原始数据和处理速度现在都有了,因此AI技术现在能大放异彩。目前人工智能在识别,包括在认知,产生很大进展的原因首先是数据量带来的。谷歌在语音识别领域取得了很大的突破,但这背后的原因是谷歌建立了几十亿音频的库,而且用人类的智慧标注它,所以可以用算法,用人工智能找到模式,甚至可以区别口音不同。图像也是同样的:过去几十年里,其实人类花了大量的时间去标注这些图像,我们才能在图像里面切割识别出各种各样的物体,没有这些人的智慧现在人工智能是达不到这样的程度。

无数据不AI,无人工不智能

 

数据的质量和完整性对于人工智能建造高效的模型至关重要

 人的智慧:AlphaGo背后的故事

以AlphaGo人工智能为代表的AI复兴体现对于世界的认知能力正在加强。在过去的几年间,我们看到,机器学习、强大的算法、巨大的处理能力和所谓的“大数据”已经可以让机器做一些让人印象非常深刻的事,比如,实时语言翻译、在复杂的城市环境中安全地开车。要知道,即使是在10年前,这些也还被认为是不可置信的。

AlphaGo战胜人类被视为AI历史上的里程碑事件。大家看到AlphaGo战胜了李世石,但是不知道背后的故事。TalkingData的CEO崔晓波作为亲历者之一(这场棋赛的解说者),看到的角度和大家不同,他看到了数据的力量。

无数据不AI,无人工不智能

TalkingData CEO崔晓波

他认为,在这场比赛中,关键的获胜因素有两个:

第一,要有足够的数据支撑。AI要模拟人,它首先要知道人在面对不同事情的时候是怎么去把握的,而这种判断和把握的能力就是出自于成千上万的海量数据得出的结果。

AlphaGo拥有一个数据库,里面有十几万份人类6-9段职业棋手的对弈棋谱。Alphago从中模仿人类常见的落子方式,根据谷歌透露的数据,模仿的准确率达到了57%。也就是说,单单这一项功能,就可以使Alphago在一步的选择上有57%的概率与人类高等级职业棋手相同。2014年,google来到中国棋院买棋谱,近两年累计记录的棋谱数量是过去几百年记录下的棋谱的总和:根据KGS(一个围棋竞技网站)统计,KGS平台每年专业段位的对局棋谱的累积量,近三年研究的棋谱数量都接近20w。(alphago,darkforest等都用了这个网站的棋谱)。这只是一个平台的棋谱,还有GoGoD平台的累积大约8,5000专业段位棋谱。18w的棋谱一共有将近2500w的局面,每一个局面都可以上下左右、镜面翻转,这个2500w局面就能再乘以8,这个数据量已经能够支撑深度学习。

第二,要有人类的智慧。Alphago在下棋的时候“聪明”得像一个人,大量的数据提供了它“思考”的来源。但AI不是由大数据一手决定的,还有人的经验和智慧;AI会发展成什么样子,打个园艺的比方来说:大数据是土壤和养分,AI是植物,而人就是园丁。土壤和养分让植物长得好,但也离不开人的修剪和培养。代表AlphaGo跟李世石坐下来对战的那个人本身就是六段的高手,他在训练AlphaGo时,后来我们也交流过,加入了大量的人工智慧,加入了大量的人为规则,让它少走弯路,这些都是被人忽略的,我们过大强调AI的作用,我们觉得在目前这个时代,让算法、让机器代替人做判断这个事不会发生,在目前的情况下更现实的还是要引入很多专家的智能,人的智慧,在数据科学以及数据工程不断完善的情况下,去提高AI的水平。

分享给小伙伴们:
本文标签:

更多文章

相关文章

  • 蛮便宜网
  • 天猫内部优惠券网
  • Copyright © 2002-2011 版权所有