第三届世界互联网大会继续在乌镇举行。在上午的移动互联网论坛上,百度公司总裁张亚勤发表主题演讲,他认为人工智能在诞生60年之后,目前进入第三季,正是爆发的时机。百度希望与各个行业共享人工智能平台。
张亚勤在演讲一开始讲了两句话:“人工智能很了不起,人工智能没那么神秘。”过去一年间发生了两件事:第一,人工智能先驱马文·明斯基(Marvin Minsky)去世;第二,AlphaGo战胜了人类棋手李世石。张亚勤回顾,这60年间人工智能有高潮有低谷,目前进入了第三季,是爆发的时机。人工智能真正爆发是在过去10年,特别是过去5年,人工智能在语音识别、图像识别等方面有很大突破,很多人才从研究界走入企业,企业有大量的数据、有很强的计算能力,这是人工智能真正用到服务和产品的主要原因。
张亚勤谈到,人工智能需要超强计算、海量数据和神经网络。百度有多种模型和算法、万亿级参数和全球最大的神经网络。百度在语音和图像识别方面取得了很多成果,目前已经开始应用在医疗、驾驶等方面。希望把百度的平台与行业共享,一起推动中国人工智能和全球人工智能的发展。(温泉)
以下是演讲全文
大家早上好,谢谢小川,今天这场很火,看到大家对人工智能特别关注,最近我去的所有会议或者是论坛,不管是大型的还是私下的聚会,基本上都在谈人工智能。我想讲两句话,首先,人工智能是很了不起的。第二,人工智能没有那么神秘。
今年是人工智能六十周年,有两个标志性的事件:一个是六十年前人工智能主要的提出者去世了,另外一个就是AlphaGO在围棋比赛当中赢了人类,赢了李世石。如果看一下这六十年,人工智能经过了很多波折,有很繁荣的时候,也有它的冬天,现在可以说进入了第三季。我认为第三季应该是爆发的时机。
如果我们看一下的话,最早的时候一开始大家想的很简单,我们对人的大脑更了解之后提出一些规则,还有一些符号,然后把它们用到人工智能系统里面,后来发现这个不奏效,又产生了专家系统,数据多了一些,规则更详细一些,发现还是不够有效。真正的人工智能工作应该是二十年前,这个时候用统计的方式,用机器学习的方式,还没有深度学习,用各种各样的算法,遗传算法、各种算法,其实已经广泛的用到了这个行业,小川他们做搜索的,搜索其实是用人工智能时间最长的,包括一些做推荐广告,用了很长的时间。
真正爆发的话应该是过去的十年,这是快速发展的十年,就是深度学习的算法,在第一篇深度学习文章以后,就发现深度学习用神经网络是一个很有前景的道路。这几年特别是过去的五年,在云识别、图像识别、语言理解都有重大的突破。还有就是很多人才,人才原来从学术界走入企业。走入企业之后有一个很重要的特点,就是企业里面有大量的数据,然后有很强的计算能力,这也是为什么人工智能现在开始成为真正的成为主流,真正应用到服务、应用到产品上的重要原因。
PPT上写了几个公司,百度、谷歌、Facebook、微软,这是最近《财富杂志》评的四个AI公司。其实现在很多公司AI做的很好,刚才联想的元庆讲的把智能设备用到云里面,小川做搜索也相当好,IBM也是我们学习的一个很好的模式。
我刚才提到了三个方面,一、是更先进的算法,二是超计算能力,三是海量的数据。百度公司这三个方面也都有不少的进展,我们的算法现在有许许多多各种各样的模式,有万亿级的参数,有全球最大的深度神经网络,有千亿级的特征训练、千亿级的样本,规模相当大。
10:59[张亚勤]第二点我们的计算能够很强,我们有几十台服务器,而且有很多CPU,有很多CPU集群,这样的一个计算,其实加速了神经网络的收敛,很多数据需要快速的收敛,现在我们可以搭建一百多层的深度神经网络。我记得十几年前我们做神经网络做到三层不得了了,现在一百多层都比较容易了。
另外就是数据,百度有很多很多数据,有很多网页的数据,有很多搜索的数据、定位的数据、交易数据、行为数据。通过这些数据可以很容易地打造独特的知识图谱,打造用户画像以及商业逻辑。这些东西我们把它叫做百度大脑,百度大脑就是有计算有服务器,有许许多多的数据,然后由先进算法组成。这里面有很多模块和能力。
现在相对比较成熟的是四个方面,一是语音识别,也是深度学习用的第一个成功的例子。语音识别目前的准确率已经可以达到在安静环境下达到97%,在方言、速度语速快了以后,比人类还要准确一些。在比较杂音的环境下,在车载环境下可以达到92%—93%左右,最近把一些新的算法用图像训练的方式用在语音识别里面,发现又可以提高10%—15%左右,语音识别现在已经非常实用。
二是图像识别,语音方面已经达到了很高的准确度。我们在语音方面也有很多产品,比如说用手机百度现在可以用语音搜索,你可以听到语音的合成。我们最近有一个产品“度秘”可以用到音响上,也可以用到车里面,这不仅仅是一个自然对话的软件,其实它是一个连接服务的一个载体,所以用“度秘”你可以订餐、订票、管理日程,也可以聊天,也可以帮你做体育解说,也可以唱歌,也可以作诗,后面连接了很多数据和服务。另外在图像和视频方面,刚才Facebook的石峰讲过,很多方面由于有大量的图像和视频,这个时候需要找到一个模式,人脸识别相当成熟,目前已经到99.7%的准确率,比人眼更准确了。在图像视频的自动描述方面,也越来越精确了,比如说根据视频可以知道这是一个小狗在玩水,这边知道是一个火车沿着森林驰过。
所以说AI真正会带来一些新的变革,可以用到每个方面,可以说医疗、教育、金融、交通,也可以用到无人车上,再举一个简单的例子,比如说医疗方面,医疗方面我们最近有一个百度医生的产品,其实就是用一个像医疗的机器人,可以阅读大量的医疗文献、资料、病人的病例,模拟人和医生自然的交流、问诊的流程,然后可以把这些信息告诉医生,也可以把这个信息告诉病人,这对于现在目前我们中国医患紧张问题有很大帮助,现在有很多好医生,但也有很多病人,医生和病人之间的沟通还是有很多的问题。这个可以帮助基层医生提高诊断率,也可以帮忙专家医生,让他们减少问诊的时间,这个系统已经开始使用了,数据越多会越准确,因为这是一个自我学习、自我提升的一个过程。
举一个例子,目前用百度手机医生马上可以实现,我们叫“智能小e”机器人,医生很多时候需要花很多精力了解病人问诊,用“智能小e”就可以省去很多过程。另外一方面就是出行,今天下午我会多讲一下,在智能驾驶方面取得的进展。刚才我觉得杰瑞·卡普兰讲了一个很有趣的例子,人工智能有些方面比较聪明,有些方面比较笨拙,我们经常开玩笑说机器人可以开车,结果打不开车门,所以在智能驾驶方面,目前确实取得进展比我们想象的要快很多,百度有两个路径,一个路径是L3,是一个比较渐进的,在有限的条件下进行自动驾驶、智能驾驶,根据现在的高精地图、精准定位、计算机视觉然后和厂商进行合作,包括车联网、操作系统这种比较现成的技术。
还有一个L4,完全无人驾驶,这对整个环境、技术要求相对比较严格。L3和L4有很多共同之处,大部分的平台数据,包括机器学习的算法都是可以共享的,但是整个假设的环境是完全不一样的。L3我就不细讲了。L4,大家已经体验了,百度去年差不多这个时候,第一次完成了路测,在北京的五环完成的,这一年取得了很大的进展,我不知道大家有没有机会试一下我们的无人车。在乌镇,现在我们有十八辆车,相对去年取得了很多进展,比如说更复杂的路况、像下雨天有雾霾的天气情况下都可以使用,有更多的传感器,有更强的学习能力。这个方面我们收集了很多数据,把数据放在云端进行学习,最后再传到汽车上,但是大部分决策是在汽车上,这样即使不联线,还是可以自动驾驶。
我也提到了人工智能可以用到各个方面,我们也希望把我们的平台和整个行业共享,所以我们今年九月份开放了两个平台。一个是机器深度学习的平台,叫PaddlePaddle。另外一个是百度大脑,我们把这些能力语音、图像、自然语言、用户画像开放给大家,希望大家一起推动中国人工智能以及全球人工智能行业的发展。蛮有意思的,我记得三十年前比尔·盖茨讲希望有一天机器能像人一样听去看去写,用自然语言交流,今天他提的目标在很大程度上已经达到了,人工智能很有意思,我做计算机研究,最早的时候我们学机器语言,学编程。后来是机器来学人的语言。未来一方面机器要向人学习,人也要向机器学习。
这次AlphaGO击败李世石之后,我说当然AlphaGO有各种大数据,有对抗的算法,有增强的算法,但是向人类学习很多东西,学习人类的棋谱。我们人类你有没有向机器人学习,给你什么启示。其实围棋界很多人看AlphaGO的走法,里面有一些走法确实和专家的常规完全不一样,小川做的解说非常精彩,小川不下棋,他之前预测AlphaGO会赢,我也做计算机研究,我也下棋,之前我认为计算机会赢,但是不是今年。不过今年我觉得还是有特别令激动人心的事,就是人工智能的发展。再次感谢大家!