有人问吴恩达,机器学习能解决什么样的问题?吴恩达回答说,只要给定规则,机器学习就能给出比较好或足够好的解。
但对于现实世界的问题,有三点困难:目标不明确,规则在变,资源不足。有些问题很难确定目标,比如:人生的目标是什么?企业的目标是什么?有些问题的规则经常改变,比如期货交易的保证金比例和手续费。更多的时候,没有解决问题所需的资源,尤其是计算资源,比如下围棋时的计算时间。本质上,时间是唯一的资源。
机器学习已经在许多特定问题上超过了人类的表现,唯一让科学家信心不足的是通用人工智能。也有一些科学家信心满满,认为只要模型足够大,就能实现通用人工智能。从前面三点困难出发,我们要考虑:通用人工智能的目标,满足的规则,所需的资源。
图灵给出了通用人工智能的目标,让人们在与之对话时区分不出它是人工智能还是真实的人。通用人工智能要满足的规则是整个人类社会的规则,它要知道一些事情,但又不能知道得太多,以至于不像普通人类。训练和使用通用人工智能所需的资源,也不能超出个人所需资源太多。
目前,实现通用人工智能的目标还有一些遥远。因此,与人工智能相比,人类还有一些优势。也就是说,个人教育仍然是最优选择。科学家穷其一生的努力,做出来的人工智能也达不到四岁小孩的水平。
但人工智能的新进展,为个人教育带来了一些新见解。人类不是在某一方面特别强,而是综合能力特别强。因此,我们不能训练人类去打败AlphaGo,而是要均衡发展人类的各种能力。
首先,是语言沟通能力。图灵靠这一点来区分通用人工智能。
其次,是数理逻辑能力。人类会根据一些原则引导的直觉,通过不那么复杂的计算,进行因果判断。这些判断的好坏程度因人而异,但高水平的人往往能“猜”到正确结果。科学家经常提出猜想,然后由数学家或实验来证实或证伪。
第三,是形体运动能力。不同的运动会锻炼身体的不同部分,混合泳基本上锻炼了全身。
第四,是节奏音准能力。这是对听觉、发声和乐器方面的训练。
第五,是色彩结构能力。画家和设计师在这方面的能力比较突出。
第六,是认识自己的能力。第七,是认识别人的能力。认识你自己。知人者智,自知者明。
训练身体和大脑的不同部分,是人类学习的主要方式。在这个过程中,与环境互动显得尤其重要。山区长大的孩子和平原长大的孩子,运动的方式会不一样。这是强化学习的奥义:智能体与环境互动,这种环境可以是真实的,也可以是模拟的。通过环境给予的反馈,智能体学到知识。
资源是有限的,可能性是无限,针对训练通用人工智能的既定目标,如何分配资源?换言之,如何在无数个解构成的解空间中寻求最优解或足够好的解?吾生也有涯,而知也无涯,如之何?
AlphaGo的做法是使用蒙特卡洛树和神经网络。在无数种可能中寻找那些与目标匹配度较高的解,丢弃那些比较差的解。它在围棋和蛋白质折叠这类问题上,取得了令人瞩目的成果。
人类作为一个整体,学习的过程也类似。每个人会随机探索一些可能性,而那些与整体人类目标匹配度较高的知识被学到并保存下来。人类整体的目标,如果有的话,就是存在下去。
我的中学的校训是“全面发展,出类拔萃”,当时理解为“各方面都不错,某一方面特别厉害”,现在想想不对。因为全面发展,所以出类拔萃。这也是通识教育的要义。
对于个人来说,目标是要度过幸福的一生,该怎么办?