近日,由中国建银投资有限责任公司倾力打造的2020年度“JIC讲堂科技投资系列”第六场活动在建投书局举行。
本期活动上,上海纽约大学计算机系终身教授(学术休假)、亚马逊云服务上海人工智能研究院院长张峥与《经济学人商论》执行总编辑吴晨二人,以“人工智能产业的未来与挑战”为主题进行了一场信息量巨大的对谈。
谈到目前人工智能已经可以辅助人类进行写作,张峥表示这是数据量大幅增加后“大力出奇迹”的结果。他表示,人工智能的应用需要解决数据的获娶数据的清洗与数据的洞察三方面的问题。自动驾驶是一个人工智能应用非常好的场景,但它需要分场景、分阶段落地。谈到数据安全和隐私的理念,张峥则认为,“原始粗暴的数据积累早日结束早日好”,并介绍了新的数据和隐私安全理念下“联邦学习”的加密分布式学习技术。
人工智能写作是“大力出奇迹”的结果
吴晨介绍,《经济学人》有一个熊彼特专栏,有15年历史约1000篇稿件,三年前编辑部做过一个实验,把这1000篇稿件输入机器,让机器人去写,但写出来的结果是每句话都像英文,连在一起不知道在说什么。但三年以后的现在,机器人已经能够写出像样的稿件了。
对此,张峥表示,这是数据量大幅增加后“大力出奇迹”的结果。
“我们给机器喂了46个T的数据,相当于几百个100G手机的容量,有1750亿个参数要去慢慢调整。”张峥表示,“这几年人工智能在质量方面确实有一定的飞跃,所以变得越来越像‘人话’”。
当前计算机在写作上已经能够给予人类一定的辅助,但机器其实并不能理解人类用词时的情感和意义。
以当前各类应用都会有的词汇联想功能为例,张峥举例称,一个《纽约客》的作者做了一个实验,他在给儿子写一封邮件,写I'm very p..,其实他的原意是I'm very pleased,但机器给他的提示是I'm very proud。
“这比他本意要好多了作为爸爸应该为儿子感到自豪,而不能总是居高临下。”张峥评论道,“但机器其实不知道是怎么回事,是人自己脑补做爸爸的做得不够好。”
人工智能落地关键是业务数字化的可能
张峥表示,人工智能落地的关键是这个业务有没有数字化的可能。
他具体介绍,人工智能的应用需要解决数据的获娶数据的清洗与数据的洞察三方面的问题。人工智能是否能在产业中落地,首先要看产业数字化转型程度,一个产业如果已经数字化并且大量地依靠数据,人工智能才能更好地进入。其次,产业数字化后,还需要注意对数据的清洗,因为获得的数据往往非常粗糙,“噪声”很大。最后是解决对数据的洞察,如何从无结构的数据中获取结构,也是人工智能未来亟待解决的问题。因此,较有发展前景的应用领域应该是实现了良好的数字化转型,并能通过结构化将数据转化成生产力的领域。
谈到自动驾驶行业时,张峥表示,自动驾驶是一个人工智能应用非常好的场景,但它需要分场景、分阶段落地。
吴晨也表示,街上跑的车都变成自动驾驶在3-5年内是不现实的,但是在园区、高速公路、货运卡车这些领域可能会更快地看到变化。他介绍,“硬件领域一定有很多的投资机会,所以会不断有需求,但是真正组合起来到底会是什么样新的商业场景,这中间存在很大的风险。”
谈隐私:原始粗暴的数据积累应尽早结束
数据对于人工智能发展的重要性毋庸置疑,吴晨引用李开复的观点称,中国人工智能和大数据之所以在过去几年这么快地发展,就是因为中国的数据无论从总量还是搜集渠道都比美国要多得多。
对此张峥表达了自己的看法,称“原始粗暴的数据积累早日结束早日好,这是不能乱来的。我觉得保护隐私是大家的责任”。
吴晨提出,用户在使用很多免费服务的时候,实质是拿自己的行为信息在换取某种便利的服务,但这个数据到底应该归于谁,手机上的行为信息到底属于这个App还是属于用户自己,这是中国、欧美都在探讨的问题。
欧洲《通用数据保护条例(GDPR)》专门提出了两个重要的领域,一是数据的“可迁移性”(portability),如当用户不想使用某个社交网络服务时,可以把上面过去形成的所有数据都带走。另一个是数据的“遗忘权”,就是过去在网上分享的内容,不想再保留的话用户可以将其删除。
在这种数据安全的理念指导之下,张峥介绍了新兴的“联邦学习”(Federated Learning)技术。
联邦学习是一种加密的分布式学习技术,各个参与方可以在不披露底层数据和底层数据的加密(混淆)形态的前提下共建模型,适合训练数据涉及隐私敏感,和训练数据太大无法集中收集的情况。
张峥表示,联邦学习的这种“模型与数据互相不信任,但是还可以达到某一种服务。这中间有一定的折衷,质量可能要低一点,但是换取了其他意义上的信任”。
“JIC讲堂”是中国建投集团调动优质智力资源,以建投书局文化空间为前沿阵地,集合多方智慧和力量打造的高品质讲堂品牌。“JIC讲堂”自2016年以来共举办70余场深度对话和思想交流,向社会分享前瞻视野与专业洞察,提供理性分析与价值参考,拥有逾百位专家学者的思想智库,覆盖国内顶级高校和科研机构,受到学界、业界、公众等多方人士的关注。