世界似乎在做加速运动,轮子转得越来越快,一日千里扬长而去,我时有追不上的恐慌。很多宏大力量在塑造世界的未来,最显眼的是反全球化浪潮和恐怖主义的兴起,因为理解的门槛相对低,老百姓大街小巷茶余饭后都在讨论。还有些力量不易觉察,比如西方发达国家和中国长期低生育率将导致人口萎缩,在长时间尺度上会对人类历史产生难以逆转的影响。在所有这些左右我们命运的宏大力量中,人工智能技术突飞猛进呼啸而来,未来几十年会深刻改变我们以及孩子们的生活。但是理解它,需要跨越很高的门槛。
王维嘉:《暗知识:机器认知如何颠覆商业和社会》(中信出版社)
王维嘉博士的新书《暗知识:机器认知如何颠覆商业和社会》为非专业读者跨越这个门槛用最简单的语言把人工智能讲得清清楚楚,是近年来我读到的少见的上乘科普作品。这本书其实覆盖了两个不同部分,一部分谈形而下对个人的意义,讲人工智能的科学原理,主流学派,怎样颠覆传统产业,怎样改变我们未来工作和生活。另一部分是谈形而上对人类的意义,关于人工智能对人类认知方式冲击的哲学探讨。
作者阐释了人工智能的基本科学原理和发展史,认为人工智能迅猛发展得益于三个推动因素:计算能力空前提高,数据量爆炸,科学研究突破。本书澄清了人工智能、机器学习、神经网络、深度学习常被滥用的概念,用很多生动的例子解释主要技术流派的理念。贝叶斯学派里最有意思的例子是疾病判定和垃圾邮件判定的居然是相同的方法。类推学派最有意思的比喻是伦敦1894年的霍乱,每8个人死1个,无人知道原因,内科医生把霍乱病例标注在地图上,猛然发现所有病例都靠近公共水泵,推断出病因是水污染,从而找到防治办法。最精彩的是解释AlphaGo的工作原理,人类下围棋找最优解,好比在群山间找最低谷底,两千年一直师傅传徒弟在小山谷里转圈,而AlphaGo相当于同时开着数百万辆越野车在群山中高速搜索,很快找到比人类两千年来更低的山谷。作者同时解释了深度学习卷积神经网络怎样化繁为简大幅减少计算量。
本书对数据价值有非常深入的思考。很多人认为中国在人工智能发展有不可超越的优势,因为拥有超大规模海量数据,这个说法似乎有道理。但AlphaZero单机用4个TPU,36个小时训练,不需要任何人类下棋经验和过往数据,可以完败所有人类顶级棋手。而GAN“生成对抗网络”从少量数据可以自动生成新数据,弥补数据的缺乏。这项技术的发展会在很多领域打破所谓数据量大的优势。作者认为谷歌和百度在AI技术上非常激进的原因之一是,搜索的用户数据比社交和电商的用户数据“浅”,挖掘价值没有社交和电商用户高。作者不担心用户数据目前都控制在互联网巨头手中,这些数据是表面沙土里的浅层金沙。他认为还有对人类用处更大的数据金矿:人类身体和心理数据、自然和社会环境数据、农业工业服务劳动过程的数据。
作者认为人工智能行业金字塔尖是算法、芯片、和计算平台,美国目前领先。人工智能的商业应用上,中国有巨大的成长空间。人工智能对民众心理冲击最大的应用估计是无人驾驶。自动驾驶本质是一个会自己高速运动的机器人,是四个轮子上的一部电脑,将会颠覆10万亿美元的汽车行业。每个自动驾驶的垂直领域比如农尝建筑工地、仓库等封闭场合,都可以培育出市值超过10亿美元的独角兽企业。共享出行的成本中70%是人工成本,自动驾驶会去掉这个成本,每辆自动驾驶共享车可以减少5辆私家车,大部分传统车厂恐怕面临关门的威胁。在医疗领域,美国医生影像误诊每年高达1200万人,而中国每年5千万人被误诊,AI将在医学图像识别准确度远远超过人类医生。美欧都有用深度学习发现新药的公司,进行诊断和慢性病健康管理的企业。在金融领域的AI应用,会导致一大批的高薪金融精英失业,瑞银认为未来会裁员3万人,高盛已经把纽约现金柜台交易员从600人裁减到2人,把IPO的146个步骤全部自动化。如果可以把人工智能用在城市管理,计算每个街区的人流,就可以避免2014年末上海外滩的踩踏悲剧。而且人工智能可以替代记者写作,替代审计师查账,替代律师搜索整理文件……几乎可以替代人类绝大部分脑力工作。
人工智能替代白领工作,引起中产阶级巨大的焦虑。我们以后工作怎么办?作者举了一个有启发的例子,农业人口在1840年占美国总劳动人口的70%,目前只有2%。在170年中每年减少大约0.7%。目前美国每年仍然有24万农业人口离开土地,差不多是美国一个月新增的就业人口。工业革命后机器替代体力劳动,没有出现大规模就业问题,人类顺利从农村出逃,开始城市化生活。因替代时间相对慢,给人类从农业文明演化到工业文明适应新生活方式足够的时间。但人工智能来势汹汹,以迅雷不及掩耳之势出现,今天所有白领工作都可能被替代掉。该怎么办呢?
正如作者已经提到,我觉得不断增加法定假期,是迄今能想到的最靠谱的解决方案之一。人工智能应用每扩张一大步,公众就多放一天假。一周工作时间可以从五天减少到四天然后三天。把效率提高对减员的压力,通过法定假期转化为工作总时间减少,平均分摊到每个头上,大家一起承担效率提高付出的代价并获得效率提高带来的好处,避免技术进步的代价只让一部分人完全承担。通过逐步消减工作时间,缓解人工智能大规模应用带来的冲击。也许二三十年后,每个人每周只需要工作一天。这么一想觉得画面好美,我几乎能看见圣西门和托马斯摩尔从历史遥远的深处回眸的微笑。
在本书的一前一后,作者对人工智能做形而上的哲学探讨。作者把机器能发现的知识叫暗知识,人工智能是一场认知革命,其意义会超过文字和印刷术的发明,甚至只有人类产生语言可与之相比。对我来说,暗知识和默知识的存在是不言而喻的,它可以简洁解释为什么光靠读书学不会游泳和骑自行车。为什么考上名牌大学成绩最好的学生,不一定总是在人生和工作中取得最好的成就。学校学的考的基本都是明知识。而事业成功与否,人生快乐与否,也需要很多的默知识和暗知识。
王维嘉博士对暗知识定义的两个特征,一是不可感知,二是不可表达。这是本书中我唯一没有被说服的地方。我认同暗知识的存在和重要,也理解人类面对浩瀚未知世界的无力感。但是,我认为暗知识可以感知也可以表达,就如同机器识别发现了一个疾病,围棋某一步的下法,股票某一种交易策略后,人类没有理由无法理解。只是象红外和紫外一样,没有辅助工具则难以发现。感知的本质是输入信号,输入如果是无边黑暗中的海量数据,人类的头脑没有足够大的工作内存,也没有足够快的运算速度,必然超载而无法工作。而表达就是输出,一旦人工智能有足够大的工作内存和足够快的运算速度,通过模仿人脑以强大的计算能力就能帮助我们发现各种相关性。按王维嘉博士的思路,他说的似乎是通往暗知识的浩瀚无边的海洋或者找不到路的暗无天日的丛林,或者链接维度过多过杂,超越了目前人类大脑的容量和能力,这个发现过程难以感知或者表达,而不是暗知识本身不可意会难以言传。人类三千年前用脚不断丈量土地,只能量出这是一个很大的平面。假如当时有一个机器人沿着地面疯狂地跑无数圈,把脚下每个点的信息输入,人工智能有足够大的数据拼出一个球体的样子。当时的人类是通过月球上的影子和海上的桅杆,猜出了地球是圆的,然后再找其他数据验证。人类大脑的小容量和低速度注定了,它适合小数据和符号逻辑推理学习。人工智能是通过大数据和挖掘海量的相关性学习。人脑和人工智能可以通过不同的路径,在某些局部区域抵达同样的理解。
关于机器人能否产生意识的辩论,我倾向于认为能。生命记录在DNA里,DNA的本质是可以自我复制和自我表达的信息。从单细胞演化到多细胞到哺乳动物,DNA里记录的信息不仅保留原有早期的内容,还不断加入新的变异信息,并不断被自然选择淘汰。记录在碳基化合物上的能进行自我复制表达的信息序列,后来表达成了高等哺乳动物,发展出了意识,碳基可以,硅基为什么注定不行?考虑到基因编辑技术和人工智能都在一路狂奔,两个加在一起,我觉得,搞得不好我们就是最后几代野生智人了,眼睁睁看着另一个更高级更强大的物种的登常
这些忧虑都顾不过来了,还是争取先实现一个小目标。人工智能都来了,希望不久的将来,人人每周只需要工作一天。也算践行了先天下之乐而乐,后天下之忧而忧的理念。