微软洪小文：人工智能应该叫“人类增强智能”

AI2年前 (2023)发布 aixure

71 0 0

导读：微软二十一世纪的计算大会期间，机器之心对微软全球资深副总裁、微软亚太研发集团主席兼微软亚洲研究院院长洪小文进行了专访，洪小文博士对微软的人工智能产品和服务进行了详细介绍，也对人工智能的定义、发展以及目前的难点做了深度分析。小冰和Cortana在…

微软二十一世纪的计算大会期间，机器之心对微软全球资深副总裁、微软亚太研发集团主席兼微软亚洲研究院院长洪小文进行了专访，洪小文博士对微软的人工智能产品和服务进行了详细介绍，也对人工智能的定义、发展以及目前的难点做了深度分析。

小冰和Cortana在微软的定位是怎样？

洪小文：我自己就是做语音研究的，对基础研究和相关服务做了二三十年。但是最近这五年技术成熟到一定程度，我们真的可以让语音和人工智能实现个性化服务，成为我们工作、生活当中的人工助手。小娜是这样发展起来的，后来过了几年开始做小冰。

小娜和小冰的区别在于，小娜跟人的真正助手一样，知道你的很多需求并提供服务，包括订会议室和机票、提供天气信息和新闻等。所以，可以把小娜视为能够帮你提高生产力的助手。但另外一方面，即使是机器人，人有时也希望它有人性的一面，例如你和它聊天，像和朋友一起聊天一样。聊天是一种社交，大部分都是没有目的性的，这就是小冰的作用。小娜适合于做有目的的事情，小冰则是可以漫无目的聊天的伙伴。

小冰和小娜还有很多交叉点，因为大部分时候的正式谈话和非正式聊天是可以交叉在一起的。比如说，和小娜聊天主要是为了实现一些目标，偶尔加一些非正式聊天。和小冰谈话是从聊天开始，最后可以谈一些正式的事情。在京东平台上就出现了商户从纯粹聊天转向咨询数码相机之类信息的案例。基于对小冰等机器人朋友的信赖，用户更容易在了解了产品的特性之后进行购买。

站在科学的角度，我个人认为小冰能够发展到今天是很让人兴奋的。现在每期会话（交互）次数达到了二十三。如果就图灵设定的测试标准来看，小冰已经达到甚至超过了规定的标准，但是这并非意味着小冰能够完全替代人类的聊天功能。

除了大家很熟悉的小冰和小娜，微软还有哪些和人工智能相关的产品？

洪小文：因为计算机和移动互联网的普及，特别是人工智能的发展，用户所想用的东西会变成一种隐形的、无所不在的东西。隐形的另外一层意思是无缝，今天你用的可能是手机，也可能是云服务，同时有物联网和摄像头等。对于用户而言，他们并不需要知道人工智能是发生在云端还是手机端。事实上，现在的人工智能或自然人机界面只需要用语音和面部表情就能完成，这就是一种隐形的创新。

我知道很多读者对技术感兴趣，而大多数读者需要的是最直接和可用的技术。这里面包括了大家看到的小冰和小娜，而在背后包含的有计算机图像识别、语音识别、自然语言处理、社交网络情感计算等等技术。

微软的产品很多元化，像今年推出的Windows10，在短短两个月时间已经积累超过1.1亿台设备升级到了Windows10。Windows基本要求是操作系统更安全、更稳定、更快。如果大家使用Windows10就可以发现，以前的系统每一个进化版本都需要更多的内存，但是如今Windows10比Windows8所需要的机器内存容量更少。

Windows10中的小冰和小娜代表了新的技术，Windows10已经发展为听你说出指令并且做出反应。譬如我们可以通过说「小冰」发出让机器人运转的指令。同时，我们还在做「Speaker ID」，就是计算机需要对用户的说话声音和内容进行辨认，而这样的功能都是不为用户熟知的（是隐性的）。

还有跟生物信息有关的技术，比如人脸识别、指纹识别、瞳孔识别和虹膜识别等，我们可以在很暗的光线下使用红外线技术进行人脸识别，我们把这些都加入到Windows和其他应用服务当中。在10月披露的微软财报当中，智能云（intelligent cloud）是一大亮点，包括像今年推出的牛津计划（Project Oxford）和前段时间出现的How Old.net等。我们一开始推出How Old只是进行技术展示，但是现在变得很流行，应用范围更广，比如我们可以实现对上百人规模的公司进行人脸识别。我们也把一款名为Windows Hello的生物信息技术搬到了智能云。在将来，大家可以看到更多智能云的应用，而传统Windows应用软件开发商也会利用我们的技术来改进他们的系统。

牛津计划还包括哪些新的人工智能技术？

洪小文：牛津计划是我们的一个系列或品牌，我们在今年推出一部分，到明年年初还会有更新的技术。这些技术主要包括：

语音识别。语音的应用范围很广，包括物联网等。目前不仅微软的平台，像中国也有很多公司做自己的语音技术平台等等。

语言理解智能服务（LUIS）。这里面主要是自然语言处理技术，比如我们的微软学术搜索就实现了从关键词搜索到自然语言搜索的技术飞跃，还没有输入完搜索内容机器就可以猜测出你想要搜索的内容。同时，该服务还可以对知识按照不同领域和范围进行分类。例如，有开发人员想要做一个自然语言搜索的应用，那么他可以通过利用牛津所提供的自然语言API来实施。

图像（计算机视觉和人脸识别）。该技术可以帮助用户在上千个物种当中搜索到既定目标，比如说在必应上面进行图片搜索，可以找到十亿以上或百亿以上数量级的资源。

此外，还有可视化技术（visualization）。也就是做大数据分析，我们通过表格把数据可视化，这些都是智能云里面非常重要的项目。微软最近的产品不仅仅代表了研究院的技术，也预示着更加深入和广阔的发展前景。我们现在推出的产品只是一部分，未来可以做的东西还非常多。

过去一年人工智能的进展有没有让您感觉到很兴奋的？

洪小文：业界、学术界的许多人在谈人工智能、机器学习或大数据，我认为在很大程度上这三样是一件事。因为人工智能有很多不同的领域，但是今天的人工智能百分之八九十是收集数据之后去进行机器学习。

可以说我们人类文明的进展都是大数据。先从科学的角度来看待这个问题。当代的科学之父伽利略通过观察发现运动跟物质的大小无关，发现地球不是宇宙的中心，可能是太阳。这样的结论在当时受到了很多人的挑战。

这就叫大数据，有了移动互联网之后，大数据飞速发展。有了互联网，内容就变成数字化，利用移动互联网，可以很快地让用户帮我们做实验。比如新一代互联网创新就是把一个想法先让用户体验来看用户的反馈，根据反馈确定修改的方向，再来改进。科学家、互联网公司、任何人都可以通过这种方法达到最优的状态。人工智能、机器学习都是这种运作的方式。我们做实验或做产品，会有一个假设，我们会收集资料、数据来验证假设。收集资料之后发现假设需要修改，或发现需要再做一个实验，或要修改实验部分的内容再循环一次。这是一种闭环反馈或者试错。现在很多电视剧，也是每天写剧本，根据观众的反应再进行修改。许多过程都是这样的循环，通过每一个循环可以慢慢进步。农业、工业也是这样。

这就造就了数据为王的时代，反馈回路越快到达，就相当于可以在相同时间里做更多的实验，也就可以取得胜利。以前很多人要一年、十年或一个世纪才能得到反馈，现在可以得到反馈很快地去改善，可以预见未来会更快。现在有一个新的称呼是数据科学家（Data Scientist），每天通过看大量数据，看用户反愧脉动等等，包括市场调查等，利用数据去解决问题。

在这个过程中，如何能够不遗漏数据，让数据为我所用，微软投入了许多心血。不仅是对人工智能、机器学习、大数据，包括里面传统的数据库、系统、网络上都使用了大数据技术。其中，速度很重要。大数据的搜集是一方面，数据处理的速度如果没有，那数据就没有意义。

更深入一点是跟技术有关的。比如一个人博学多闻，意思是这个人知道很多数据、很聪明。但是另外一方面，有时他因为信息不够而难以决定，这并不代表这个人很笨。更何况许多事情牵涉到商业机密、国家机密或个人隐私，正常人是没有办法知道的。回到人工助手的问题，我的人工助手知道我喜欢坐哪班飞机、坐哪个位置，如果突然换一个人工助手可能就不知道我的偏好了，因为它还没收集到我的数据。因此我认为凭借数据量的大小来判断一个机器是否智能是值得商榷的。

讲到人工智能，一般人工智能是做算法，但是信息多了之后的确是会比较聪明。我认为未来一个大的方向，是如何通过机器和人的结合使得人类变成「超人」。因为人善于思考，但是人会忘事，计算有时也可能算错，可能看不清所有的东西，但是机器可以，机器看东西可以通过扫描，但是要用人的算法去提取知识。假设，我是做证券交易的，我希望看到今天所有公司与股票有关的数据。机器可以扫描比人眼看到更多的数据，但是扫描之后还是识别不出涨跌，就需要用到人类的算法。人类如果能够和机器结合，就可以做出最好的证券交易或推荐。这就是未来的兵家必争之地。

但是信息安全是未来一个很重要的问题。在这个过程中什么信息可以让什么样的人、什么样的程序看到，是一个很大的问题。因为牵涉到了国际安全、商业安全和个人隐私方面的问题，这也是将来很重要的研究方向，我们在微软的基础研究、应用研究也在开始尝试。

刚才提到人和机器互相的优势互补。你曾经提到机器是需要从功能到智能、智慧、智力，现在大部分属于智能方面。如果给人类帮助，势必要从智能进化到智力，在这个过程中有哪些难题是需要学术界和产业界去解决的？

洪小文：最困难的问题是我们对人的了解还不够，这其中还会涉及到哲学的东西。人的左脑和右脑，左脑是处理逻辑的事情，科学常常讲大胆假设、小心求证，左脑是小心求证，右脑是大胆假设，右脑就是负责语言和创造力，关键是在创造力。

计算机是最好的左脑。计算机需要人去编写程序，即算法，人通过算法告诉计算机动作的指令。比如开根号，我们通过一个算法，可以让计算机一直开根号。人也可以去开根号，但是有时候会算错。算法有很多重复性的东西，但是机器做重复性的事情不会出错，也不会叫累。算法是人制定的而不是计算机，因为基本没有证据证明，有一个程序可以使程序产生新的算法。

如果人类了解了创造力的产生过程，我想就有可能教会计算机，最难的就在这里。可能我们永远不会了解到，那更不要说人的意识。笛卡儿说「我思故我在」，意思是我是有意识知道做这件事情、为什么做这件事情，也知道你会怎么看我做这件事情。今天计算机都是大数据分析，像数学问题在不断优化自己的结果。小冰在与用户交谈的时候，可以不回答这个问题，做一些类似有情感、明知而不说的反应。但是这样做很有限，不像人类每件事情都是有意识的。甚至许多聪明的动物都还没有自我的意识。但是创造力是另一回事。今天可以让机器做选择题，基于大数据分析后可能选A，这个机器可以做到很好。但是人不是这样，人可以说不是A、B、C、D的任何选项，而提出一个新的选项，这就是创造力。爱因斯坦自己也很难说为什么他会想出相对论。如果这能够讲清楚，岂不是能够产生许多个爱因斯坦，这是无法实现的。很多时候我们的创造讲不清楚原由，可能与以前的经验有关，但也讲不清楚。

有趣的是人睡觉的时候是没有意识的。人之所以成为人，与机器还是有非常大的差别。机器到目前为止证明的是能成为最好的左脑，但是右脑真的不知道怎么去做，人对右脑的理解也是不够的。

我更相信人加机器变成一个超人，所以人工智能（AI）的A本来是Artificial，我觉得A应该变成增强（Augment）。博学广闻也是一种智慧，人不可能读所有的书，但是机器可以，通过扫描很简单的就做到了。但机器读完以后不去理解也没有意义，其中还是需要人的算法。如果人的算法能够想清楚，至少对于特定的行业，可以叫机器去读一些文章，然后反馈一些总结或是图表呈现，从而来帮助我们优化算法，在此基础上再去看文章。通过这样配合，未来人类很有可能用电脑来帮助提升左脑能力，用左脑算法来小心求证，用右脑算法来大胆假设，两者同等重要。

传统理工科主要利用左脑，右脑的创造力在将来是最了不起的。右脑不仅是计算机无法取代的，而且是人类最珍贵的东西，是我们强调的创造力。当然只有大胆假设也不行，计算机的小心求证也是必要的。

你在此前的演讲中提到过人形机器人在短期内没有实用价值。那是不是说，从人工智能的短期发展来看，我们只需要关注用户需求和具体应用，而不用太过注意产品的形式？你觉得像本田Asimov对我们来说有没有影响？

对人的研究和发展认知思考能力是推动人工智能发展的动力。除此之外，人还有很多别的功能，比如说行动能力等等。从这个角度分析，机器人主要可以实现以下几个目标：洪小文：大部分东西一定是跟用户需求有关的。考虑到功能上的实用性，我们没有必要将吸尘器这类的粗浅的人工智能技术做成机器人的形状。我们也要考虑机器的形状特征是不是可以满足不同的情感需求。

第一个是建立感官认知和思考模式。微软在这方面做得非常多，不管是语音识别还是思考。社会也普遍认为这是体现人的智慧的能力。

第二个是实现对人的运动能力的模仿，帮助人类完成繁杂和沉重、同时有目的性的工作，比如用吸尘器完成大量的清洁工作。往往机器能够比人更快和更好地完成这类工作。

第三个是对技术的展示作用。人工智能的确能够给人以震慑，但是我认为技术的实用性还是更为基础和首要的。

机器之心：微软和清华大学有着长时间合作，在此合作过程中有没有什么建议可以给到其他科技公司？

洪小文：清华大学作为全国一流的大学，特别是其理工专业与微软有着深远的联系。微软亚洲研究院当时到中关村建院，与清华也有关。我们1998年创院，第二天就来到清华拜访。一开始的合作是跟计算机相关的信息科学、自动化、电子、软件学院合作，我们也同美术学院、环境、理学院有合作。到后来微软公司也在中国法律、经管与清华合作，所以清华是跟我们合作最广的学校。

特别是在今年我们与清华跟华盛顿大学在西雅图地区，成立了全球创新学院（GIX）。这对微软、华盛顿大学和清华大学来说都非常好，这是一个跨国合作。对于中国，通常国外需要来这边做分校、分院合作比较多，这（全球创新学院）是第一次一个学校到其他国家创办学院。我们除了提供4000万美金资助，希望用我们的力量让更多的公司同像清华大学这样优秀的学校做产学研的合作。

微软在中国的经验中，同学校合作非常重要，所以我们一直强调产学研的结合。学校的重要性主要体现在以下几个方向：

一是研究。今天众多的技术，除了微软在做，学校也在做，科研的交流可以让我们站在巨人的肩膀上看得更远。

二是人才。学校的第一宗旨就是教育学生，年轻人就是未来。整个业界希望更多优秀的学生加入我们的行列，所以在学生的培养上发挥力量。

三是学术交流。像二十一世纪的计算大会，我们还通过自身的影响力邀请国外一些学校、企业大师级人物来分享，同时也把中国介绍出去。

第四是课程。我们最近跟姚期智先生的交叉信息研究院合作，做人工智能、机器学习的大数据课程。这个课程先在清华教授，然后变成慕课在线学习的内容，才放出去一周已经有2万人注册。我很高兴有这些合作。

最后，我们非常幸运生活在21世纪，技术能够扮演这么大的角色，技术给广大的用户带来了很重要的帮助，让大家很自然而然地接受技术。技术最重要的用处是为用户带来好的体验，我觉得未来的潜力是无穷的，尤其是今天的人工智能，而且人工智能从「人工」（Artificial）更多的变成「增强」（Augment）。其实人类的发展一直是这样，例如汽车、飞机的发明，人通过与工具的结合让自己更强大。现在，人通过与最强大的左脑——机器的结合，也能够去做以前做不了的事情，这真的是有着无限可能。

文章来源：微信公众号机器之心

# AI