人工智能研究还需打破学科壁垒的＂生殖隔离＂

AI2年前 (2023)发布 aixure

85 0 0

导读：尽管现实中的人工智能研究遭遇过寒冬，曾被科学家打入冷宫，甚至一度门前冷落车马稀（详见《中国青年报》7月29日报道《人工智能是真热还是虚火》），但在人类的艺术想象中，追寻人工智能的脚步却从未停歇。无论是《星际穿越》中那个能看懂周围世界、听懂人…

尽管现实中的人工智能研究遭遇过“寒冬”，曾被科学家打入冷宫，甚至一度“门前冷落车马稀”（详见《中国青年报》7月29日报道《人工智能是真热还是虚火》），但在人类的艺术想象中，追寻人工智能的脚步却从未停歇。

无论是《星际穿越》中那个能看懂周围世界、听懂人类语言的可爱智能机器人Tars，还是今年风靡全球的“大白”，以及电影《她》塑造的能听懂人说话并与人交流，甚至与人恋爱的人工智能操作系统“萨曼莎”，艺术家们发挥他们的想象力，展望未来的人工智能。

那么，现实中的人工智能研究究竟到了什么地步？中国又当如何应对？近期在北京举办的2015中国人工智能大会给出了一个说法。

新松机器人中央研究院院长徐方的看法是：工业机器人已经走进现实，未来5～10年，智能型工业机器人便会大行其道，先是在汽车等行业应用，然后扩大其使用范围，再将来，机器人可以代替人在不适合人类的场合工作。

人工智能与机器人是另一个科技创新的风口

就在这次大会举办的前一周，第19届RoboCup机器人世界杯在中国开幕。一个智能机器人以准确的中英文翻译，震撼了这个国际上规模最大、水平最高、影响最广的机器人大赛。

科大讯飞的机器翻译技术被用在这个机器人身上。在科大讯飞高级副总裁胡郁看来，5年前，没有人敢真正地在大庭广众之下，演示语音识别，“那时的技术还远不成熟，一演示就出错”。

5年来，人工智能有了快速发展，迎来了学界所说的“春天”。胡郁认为这得益于一些基础性研究的突破。比如，Google第一个利用云计算、大数据以及近几年发展起来的深度神经网络组合方法，使用户迭代的方式有所突破。这个标志性的技术，给整个人工智能发展提供了一个重大思路。

人工智能大会上，一个问题出现在了讨论环节——人工智能与机器人在下一个5年或10年之内，是否会成为另一个科技创新的风口？不少与会专家给出了积极的态度，这其中就包括科大讯飞董事长刘庆峰。

不过，在刘庆峰看来，真正意义上的创新，关键在于掌握创新方向的主导权，如果掌握不了主导权，产业规模越大，将来的风险越大。

在他看来，源头核心技术突破是人工智能浪潮中的“大波浪”，而这样的“大波浪”，目前却鲜有中国企业去做。他以苹果手机为例，该手机上的不少关键应用，并不向中国企业开放。这就意味着：如果中国企业只做“手机上面的应用创新”，未来整个产业的价值和主导权还是由别人控制。

换言之，在今天的移动互联网时代，3G、4G的通信技术、芯片技术以及安卓ios是引领潮流的创新“大波浪”，相应的，在这些平台上做的App就是“跟着走”的“小波浪”。“现在我们谈互联网思维当然很对，谈快速应用创新到风口也对，但那些都是小波浪，一个产业如果都这样相对急功近利，整个中国产业可能失去未来。”刘庆峰说。

他并不是唯一的思考者。在为期两天的大会上，不少人工智能领域的专家有一个共同的感受：如果研究人工智能的浪潮没有把对脉，就很可能是逆流而行。

视觉、听觉和触觉是未来的“大波浪”

在徐方看来，视觉、听觉和触觉将是人工智能研究的重点。正如中国工程院院士、中国人工智能学会理事长李德毅在大会上所说的，脑认知的主要外在表现是语言认知和图像认知。这同时说明，要赋予机器感知，就应当让计算机具有视觉、听觉和说话等能力，进而才能使机器具有适应环境和自主作出决策的能力。换句话说，让计算机学会如何像人一样听说看，才是计算机视觉和听觉研究领域的任务。

然而，这种对于人类而言与生俱来再自然不过的能力，对计算机来说却难上加难。如果说，人工智能发展到当今的成果是：计算机无论在计算能力还是记忆能力上，都能轻而易举秒杀人类中像爱因斯坦这样的高智商个体，但是在眼睛看和耳朵听的能力上，最厉害的计算机可能也比不上小婴儿或者邻居家的二傻子。

胡郁也提到《从0到1》这本书中一句经典的表述，美国近些年投入很多资金研发能飞的汽车，最后却得到了140字符（指的是Twitter）：真实世界需要的是物理、综合的东西，但虚拟化和信息化反而发展更快。他认为这句话同样适用于人工智能与机器人。

在视觉方面，微软全球执行副总裁沈向洋持积极态度：人类的感知有九成之多来自视觉，研发这部分“将大有可为”。

比如，今年微软在社交网络上意外走红的“how-old”——用户可以通过上传自己的照片，来测试自己的年龄——就是利用脸部API，基于云的脸部识别算法来检测和识别图片中的人脸。

他还提到了微软小冰的最新研究成果，智能聊天机器人“小冰”具有辨识猫狗品种的能力，甚至在面对猫的图片时能够发出“小眼神儿太犀利了”的“吐槽”。而在“小冰”的开发过程中，深层神经网络为计算机提供了不少的帮助。

沈向洋也承认，发展计算机视觉是有难度的。比如在人脸识别过程中，由于拍照光线、发型、角度、妆容等因素影响，得出的结果往往大相径庭，照片上的林志颖和郭德纲现实中基本同岁，计算机却给出一个36岁、一个51岁的错误答案。正因为“A picture is worth a thousand words（一图胜千言）”，计算机在图像识别的路上还有很长的距离要走。

这在沈向洋看来，似乎更具有“目标”的含义，“对于在做计算机的人来说，如果把通过图灵测试做目标，目标就不够远大。”对计算机视觉，他预测接下来的研究方向是“两大一精”，即大数据、大计算、精准计算。这些也值得中国人工智能领域的专家所注意。

期待脑科学和人工智能研究的“杂交优势”

在听觉方面，刘庆峰也给出了他的预测：“我认为下一个产业趋势是万物互联,在这个过程中,绝大部分设备将没有屏幕，人在移动状态下不方便去看去操作。那样，语音时代就真正到来了。”

中国在这方面已经取得了不俗的成绩：语音合成、语音识别和自然语言理解领域都曾连续多次斩获国际大奖。刘庆峰说，科大讯飞从2006年起至今参加英文合成国际评测，取得了八连冠。甚至在2014年该比赛更改了比赛方式，改比印度式英语，中国依旧取得了第一。

据他透露，人工智能的语音发展，已经不仅仅意味着地图导航软件中能够合成林志玲的声音，它还可以用在教育领域的口语测评、主观题自动扫描评分，乃至在医疗领域根据语音自主判断病症等，“这些运用的前景不只是一个目标，更是件非常靠谱的事”。

不过，要真正打通“智能”这道关卡，在李德毅看来，还需打破学科壁垒的生殖隔离。

他说，悠久强大的学科，如生命科学和物理学，一定都是很有个性的学科，学科壁垒森严，存在“生殖隔离”现象，长期以来脑科学研究和人工智能研究犹如两条平行线，没有实质性的交集就是一个佐证。

也因此，李德毅将目光放在了认知神经学和认知物理学的融合，企图寻找“场外求助”——也就是一种组合的力量。“一旦碳基生物脑和硅基电子脑形成‘杂交优势’，其势将会猛不可挡。”

他认为，用人工智能技术构建千千万万特定机器认知脑，并通过移动互联网、云计算和大数据，或许就可以“倒逼并逼近一个人造生物脑”。

# AI