张亚勤：人工智能进入第三季正是爆发时机

AI1年前 (2023)发布 aixure

67 0 0

导读：第三届世界互联网大会继续在乌镇举行。在上午的移动互联网论坛上，百度公司总裁张亚勤发表主题演讲，他认为人工智能在诞生60年之后，目前进入第三季，正是爆发的时机。百度希望与各个行业共享人工智能平台。张亚勤在演讲一开始讲了两句话：人工智能很了不起…

第三届世界互联网大会继续在乌镇举行。在上午的移动互联网论坛上，百度公司总裁张亚勤发表主题演讲，他认为人工智能在诞生60年之后，目前进入第三季，正是爆发的时机。百度希望与各个行业共享人工智能平台。

张亚勤在演讲一开始讲了两句话：“人工智能很了不起，人工智能没那么神秘。”过去一年间发生了两件事：第一，人工智能先驱马文·明斯基（Marvin Minsky）去世；第二，AlphaGo战胜了人类棋手李世石。张亚勤回顾，这60年间人工智能有高潮有低谷，目前进入了第三季，是爆发的时机。人工智能真正爆发是在过去10年，特别是过去5年，人工智能在语音识别、图像识别等方面有很大突破，很多人才从研究界走入企业，企业有大量的数据、有很强的计算能力，这是人工智能真正用到服务和产品的主要原因。

张亚勤谈到，人工智能需要超强计算、海量数据和神经网络。百度有多种模型和算法、万亿级参数和全球最大的神经网络。百度在语音和图像识别方面取得了很多成果，目前已经开始应用在医疗、驾驶等方面。希望把百度的平台与行业共享，一起推动中国人工智能和全球人工智能的发展。（温泉）

以下是演讲全文

大家早上好，谢谢小川，今天这场很火，看到大家对人工智能特别关注，最近我去的所有会议或者是论坛，不管是大型的还是私下的聚会，基本上都在谈人工智能。我想讲两句话，首先，人工智能是很了不起的。第二，人工智能没有那么神秘。

今年是人工智能六十周年，有两个标志性的事件：一个是六十年前人工智能主要的提出者去世了，另外一个就是AlphaGO在围棋比赛当中赢了人类，赢了李世石。如果看一下这六十年，人工智能经过了很多波折，有很繁荣的时候，也有它的冬天，现在可以说进入了第三季。我认为第三季应该是爆发的时机。

如果我们看一下的话，最早的时候一开始大家想的很简单，我们对人的大脑更了解之后提出一些规则，还有一些符号，然后把它们用到人工智能系统里面，后来发现这个不奏效，又产生了专家系统，数据多了一些，规则更详细一些，发现还是不够有效。真正的人工智能工作应该是二十年前，这个时候用统计的方式，用机器学习的方式，还没有深度学习，用各种各样的算法，遗传算法、各种算法，其实已经广泛的用到了这个行业，小川他们做搜索的，搜索其实是用人工智能时间最长的，包括一些做推荐广告，用了很长的时间。

真正爆发的话应该是过去的十年，这是快速发展的十年，就是深度学习的算法，在第一篇深度学习文章以后，就发现深度学习用神经网络是一个很有前景的道路。这几年特别是过去的五年，在云识别、图像识别、语言理解都有重大的突破。还有就是很多人才，人才原来从学术界走入企业。走入企业之后有一个很重要的特点，就是企业里面有大量的数据，然后有很强的计算能力，这也是为什么人工智能现在开始成为真正的成为主流，真正应用到服务、应用到产品上的重要原因。

PPT上写了几个公司，百度、谷歌、Facebook、微软，这是最近《财富杂志》评的四个AI公司。其实现在很多公司AI做的很好，刚才联想的元庆讲的把智能设备用到云里面，小川做搜索也相当好，IBM也是我们学习的一个很好的模式。

我刚才提到了三个方面，一、是更先进的算法，二是超计算能力，三是海量的数据。百度公司这三个方面也都有不少的进展，我们的算法现在有许许多多各种各样的模式，有万亿级的参数，有全球最大的深度神经网络，有千亿级的特征训练、千亿级的样本，规模相当大。

10:59[张亚勤]第二点我们的计算能够很强，我们有几十台服务器，而且有很多CPU，有很多CPU集群，这样的一个计算，其实加速了神经网络的收敛，很多数据需要快速的收敛，现在我们可以搭建一百多层的深度神经网络。我记得十几年前我们做神经网络做到三层不得了了，现在一百多层都比较容易了。

另外就是数据，百度有很多很多数据，有很多网页的数据，有很多搜索的数据、定位的数据、交易数据、行为数据。通过这些数据可以很容易地打造独特的知识图谱，打造用户画像以及商业逻辑。这些东西我们把它叫做百度大脑，百度大脑就是有计算有服务器，有许许多多的数据，然后由先进算法组成。这里面有很多模块和能力。

现在相对比较成熟的是四个方面，一是语音识别，也是深度学习用的第一个成功的例子。语音识别目前的准确率已经可以达到在安静环境下达到97%，在方言、速度语速快了以后，比人类还要准确一些。在比较杂音的环境下，在车载环境下可以达到92%—93%左右，最近把一些新的算法用图像训练的方式用在语音识别里面，发现又可以提高10%—15%左右，语音识别现在已经非常实用。

二是图像识别，语音方面已经达到了很高的准确度。我们在语音方面也有很多产品，比如说用手机百度现在可以用语音搜索，你可以听到语音的合成。我们最近有一个产品“度秘”可以用到音响上，也可以用到车里面，这不仅仅是一个自然对话的软件，其实它是一个连接服务的一个载体，所以用“度秘”你可以订餐、订票、管理日程，也可以聊天，也可以帮你做体育解说，也可以唱歌，也可以作诗，后面连接了很多数据和服务。另外在图像和视频方面，刚才Facebook的石峰讲过，很多方面由于有大量的图像和视频，这个时候需要找到一个模式，人脸识别相当成熟，目前已经到99.7%的准确率，比人眼更准确了。在图像视频的自动描述方面，也越来越精确了，比如说根据视频可以知道这是一个小狗在玩水，这边知道是一个火车沿着森林驰过。

所以说AI真正会带来一些新的变革，可以用到每个方面，可以说医疗、教育、金融、交通，也可以用到无人车上，再举一个简单的例子，比如说医疗方面，医疗方面我们最近有一个百度医生的产品，其实就是用一个像医疗的机器人，可以阅读大量的医疗文献、资料、病人的病例，模拟人和医生自然的交流、问诊的流程，然后可以把这些信息告诉医生，也可以把这个信息告诉病人，这对于现在目前我们中国医患紧张问题有很大帮助，现在有很多好医生，但也有很多病人，医生和病人之间的沟通还是有很多的问题。这个可以帮助基层医生提高诊断率，也可以帮忙专家医生，让他们减少问诊的时间，这个系统已经开始使用了，数据越多会越准确，因为这是一个自我学习、自我提升的一个过程。

举一个例子，目前用百度手机医生马上可以实现，我们叫“智能小e”机器人，医生很多时候需要花很多精力了解病人问诊，用“智能小e”就可以省去很多过程。另外一方面就是出行，今天下午我会多讲一下，在智能驾驶方面取得的进展。刚才我觉得杰瑞·卡普兰讲了一个很有趣的例子，人工智能有些方面比较聪明，有些方面比较笨拙，我们经常开玩笑说机器人可以开车，结果打不开车门，所以在智能驾驶方面，目前确实取得进展比我们想象的要快很多，百度有两个路径，一个路径是L3，是一个比较渐进的，在有限的条件下进行自动驾驶、智能驾驶，根据现在的高精地图、精准定位、计算机视觉然后和厂商进行合作，包括车联网、操作系统这种比较现成的技术。

还有一个L4，完全无人驾驶，这对整个环境、技术要求相对比较严格。L3和L4有很多共同之处，大部分的平台数据，包括机器学习的算法都是可以共享的，但是整个假设的环境是完全不一样的。L3我就不细讲了。L4，大家已经体验了，百度去年差不多这个时候，第一次完成了路测，在北京的五环完成的，这一年取得了很大的进展，我不知道大家有没有机会试一下我们的无人车。在乌镇，现在我们有十八辆车，相对去年取得了很多进展，比如说更复杂的路况、像下雨天有雾霾的天气情况下都可以使用，有更多的传感器，有更强的学习能力。这个方面我们收集了很多数据，把数据放在云端进行学习，最后再传到汽车上，但是大部分决策是在汽车上，这样即使不联线，还是可以自动驾驶。

我也提到了人工智能可以用到各个方面，我们也希望把我们的平台和整个行业共享，所以我们今年九月份开放了两个平台。一个是机器深度学习的平台，叫PaddlePaddle。另外一个是百度大脑，我们把这些能力语音、图像、自然语言、用户画像开放给大家，希望大家一起推动中国人工智能以及全球人工智能行业的发展。蛮有意思的，我记得三十年前比尔·盖茨讲希望有一天机器能像人一样听去看去写，用自然语言交流，今天他提的目标在很大程度上已经达到了，人工智能很有意思，我做计算机研究，最早的时候我们学机器语言，学编程。后来是机器来学人的语言。未来一方面机器要向人学习，人也要向机器学习。

这次AlphaGO击败李世石之后，我说当然AlphaGO有各种大数据，有对抗的算法，有增强的算法，但是向人类学习很多东西，学习人类的棋谱。我们人类你有没有向机器人学习，给你什么启示。其实围棋界很多人看AlphaGO的走法，里面有一些走法确实和专家的常规完全不一样，小川做的解说非常精彩，小川不下棋，他之前预测AlphaGO会赢，我也做计算机研究，我也下棋，之前我认为计算机会赢，但是不是今年。不过今年我觉得还是有特别令激动人心的事，就是人工智能的发展。再次感谢大家！

# AI