假设我们现在手上拿着1万张照片,要对AI系统训练,让他们学习怎么判断照片上的人物的性别。我们先给它看第一张,AI系统根据自己的计算判断出来是男性,如果是正确的我们就告诉它是正确的,否则我们就告诉它错了,然后它就会调整自己神经网络中各个神经元的权重参数,直到计算出来是正确的为止。然后再给它第二张照片去判断,依次类推,直到1万张照片全部都认一遍,就算完成了1万次深度学习。
人工智能系统
现在问题来了。如果我们中间准备的一张照片出错了,本来是男的,我们告诉AI系统是女的,那么它为了判断出这个照片是女的,就会努力将自己的神经网络的参数调成了不正确的方式。如果我们在对AI系统做了很多训练之后,再发现其中有一些训练数据错误了,这时候我们第一反应是什么呢?肯定是想单独将这一些错误的训练结果从AI系统中删除,但是,非常遗憾,这是做不到的。如果中间有训练数据是错误的,要想彻底的纠正,只能将将AI系统清零,从头开始做一遍所有的训练。这样就会非常的浪费时间和资源。
深度学习
为什么会这样呢?因为在做每一张照片的训练的时候,AI系统可能会对自己神经网络系统中的很多参数进行了调整,这种调整会很复杂,最后训练好的参数是很多次独立的训练累积而成的效果,事后很难回溯找出每张照片引起的具体调整和变化在哪里,因此,也就无法将某一次错误训练的影响删除。
这也是AI系统学习知识的时候跟人的一大区别,如果是人的话,只要告诉他某一次的数据是错误的,他就会自动在头脑中将概念纠正过来,而AI系统到现在还没有掌握这个技能。
人工智能系统
如果我们不能准确清除错误训练的影响,就会使得AI系统以后的判断变得不可靠,对于要求很严谨的场合,就必须要从头开始进行所有的训练。因为每次训练都要进行大量的计算,所以重新进行训练会非常耗费资源。特斯拉为什么需要特意开发一台世界上速度最快的超级计算机来进行AI系统的训练,就是因为训练中的计算任务非常繁重。
当然,这个问题已经引起了科学家的注意,他们也在思考解决这个问题的办法,希望这个问题能够早日得到有效解决。让AI的学习也变得跟人一样的灵活高效。