7月9日,在世界人工智能大会科技创新全体会议上,由中国团队撰写的《新一代中国人工智能》(简称“AI in China”)的论文正式对外发布。
这是中国科学家首次在国际顶级学术期刊上发表关于中国AI发展的全景综述。论文的发布是中国人工智能产业的发展成果在全球的重要性和影响力的体现,也彰显了上海作为全球人工智能高地的实力。
论文指出,人工智能有潜力增强每一项技术;从这个意义上讲,它类似于内燃机或电力等“使能”技术。
因此,论文从人工智能如何推动社会经济进步的角度,介绍了国家人工智能平台部署的几个重点关注领域:日常消费、自动驾驶、医疗和基于对话式人工智能的物联网。论文称,之所以选择上述领域,是因为2019年中国移动支付用户规模为5.77亿(目前全球最大),自主驾驶和智能健康是中国新一代人工智能发展规划的重要领域,人工智能+物联网帮助中国人活得更智能。
日常消费中的AI
在中国,人工智能技术被广泛应用于日常生活中,如当地企业和金融服务。消费者可在智能手机中安装一系列应用程序,来体验人工智能和机器学习技术所带来的便利。例如,民众耳熟能详的例如美团(Meituan)或大众点评(Dianping)这样的交易性“超级应用”,它们提供的生活方式类服务将数亿客户与当地企业连接起来。这些应用程序改变了中国城市数亿人的生活,加快了包括如食品、酒店住宿和电影票等服务的预订和交付。例如,每天有超过60万名配送人员在平均30分钟内完成食品配送订单。这一效率归功于强大而智能的调度系统,该系统每小时计算30亿条路线计划,以优化骑手的运量和配送时间。
在金融领域,随着微信支付、支付宝等在线消费信贷服务和应用的兴起,我国消费信贷市场规模迅速增长:截至2018年底,消费信贷余额超过8.45万亿元人民币,授权信用卡总量超过14万亿张。与此同时,消费信贷行业面临着信用数据匮乏(中国60%以上的人口缺乏信用记录)、风险管理薄弱、运营服务效率低下等困难。在这些在线信贷服务或应用程序中,人工智能通过处理大规模互联网数据和采用先进算法来提高金融服务决策的质量和运营效率。例如,利用深度学习,利用社交网络关系中的序列行为数据和同质效应,识别群体欺诈攻击;利用深度语义语言模型,从不同角度生成数据,了解客户需求和使用频率,提高客户服务效率和运营安全。在中国人民银行公布的《金融科技发展规划(2019-2021)》中,人工智能在金融领域的深度融合被认为是提高金融风险控制水平和服务效率的关键。
此外,人工智能技术还改变了人们以不同方式与有价值的信息联系的方式,包括文本、图像、音频和视频。截至2018年底,中国移动用户已达11.7亿户,普及率达82%。大多数人使用智能手机和流行的移动应用程序,如豆瓣、爱奇艺、腾讯视频、头条、快手和微博进行学习和推荐。大规模推荐算法是信息访问的重要技术之一。以深度神经网络为支撑的系统每天都会发布数以千万计的新兴新闻文章和视频,根据用户的兴趣和口味量身定制。例如,中国每天有超过1.2亿人使用头条应用程序来消费新闻、视频和其他内容。用户反馈被实时收集并反馈到先进的分布式机器学习算法中,以调整模型以进行下一项推荐。领先的消费应用程序使用人工智能技术来提高信息创建、调节、传播、消费和交互的效率和效率。
自动驾驶中的AI
每年约有130万人死于交通事故,造成的经济损失累计超过6,000亿美元。作为世界上人口最稠密、交通最拥挤的国家之一,中国有潜力成为最大但也是最具挑战性的自主驾驶市常近年来,中国成立了几家自主驾驶初创公司,其使命是开发能够拯救生命和提高效率的自主驾驶解决方案。要在不断变化的各种环境(包括地理、天气、交通、用例等)中部署自主驾驶解决方案,需要灵活、可扩展和可升级的算法。提供足够的感知、高清地图、驾驶行为和脱离接触数据是开发此类解决方案的先决条件。一个有希望的方向是利用汽车和道路之间的智能互动。增加一个数量级的数据可以提高一个数量级的精度。
随着各种自主驾驶产品的数据不断被回收,以及人工智能辅助的数据选择过程,算法改进管道被建立,这将转化为产品改进,最终转化为更高的增长潜力。该行业通常将自动驾驶产品分为批量生产的高级驾驶员辅助解决方案(ADAS)和完全自主/AV解决方案。两个域之间的协同可以通过一致的数据驱动方法实现,其中两个域共享主传感器集和数据原则。ADAS车辆中各种设置产生的数据对于不断发展和改进完全自主解决方案至关重要。通过对完全自主技术的不断改进,这些功能和模块将迁移到ADAS产品中并提供高级功能。通过同时使用人工智能技术解决这两个领域的问题,一些公司将加快部署灵活、可扩展和可升级的自主驾驶解决方案,以满足未来的移动需求。
医疗行业中的AI
作为世界上人口最多的国家,中国有潜力成为最大的人工智能医疗市常在中国,近几年已经成立了100多家人工智能医疗初创公司,涉及医疗图像分析、药物发现、手术机器人和临床决策支持系统等不同领域。其中,以医学影像学为主,尤其是肿瘤影像学,包括但不限于放射学、病理学和放射治疗。他们的任务是自动化诊断,支持治疗决策,并最终保存当前的临床工作流程。癌症是导致中国人死亡的主要原因,已经成为人工智能发展的主要领域。早期诊断并对肿瘤进行定量评估对于提高治疗成功率至关重要,这可能为患者带来更高的生存率。
自2012年以来,深度学习在特定任务应用领域,尤其是在放射成像领域和计算病理领域,已被证明与人类的表现相匹配,甚至超过人类的表现。然而,深度学习的持续发展仍然需要解决医学影像学中存在的诸多挑战。例如,深度学习需要大量的医学数据和专家注释来训练一个抗噪声和/或部分缺失标签的健壮模型。这些高质量的注释必须从具有多年经验的专家获取,而不是众包。这可能导致在生成高质量的地面真实性方面效率低下,而那些大规模的未标记数据集仍然未被探索。在这种情况下,弱监督或半监督学习可以为这一挑战提供替代解决方案。在利用大规模、多中心医疗数据时,还必须考虑到数据仓库和患者保密性。具有协作机制的联合学习显示了在没有集中训练数据的情况下克服这一挑战的潜在希望。目前,国内已有数十种医学人工智能产品成功投入临床试验,如CT扫描肺结节检测、眼底糖尿病视网膜病变分类、宫颈癌Pap涂片筛查等。人工智能将是我国大多数医师日常工作中不可缺少的组成部分,这一点已被国内大多数医师所认识。在上市之前,这些人工智能医疗产品必须获得行政批准,并从临床角度证明其价值。随着我国数字化标准化和大规模医疗数据的出现,医生与人工智能研究人员的密切合作将使人工智能辅助系统进入临床工作流程,成为医生重要的辅助工具,最终提高患者管理水平。
基于对话式AI的IOT
目前在中国,数十亿的智能硬件组成了物联网,它每天都用于信息访问。语音和语言是人类与智能硬件之间信息交换的自然选择。因此,工业界和学术界对话式人工智能产生了极大的兴趣。百度(Baidu)等巨头公司和思必驰等初创人工智能公司都在积极构建全链对话人工智能平台,目标是开发可定制的虚拟对话助手,以增强所有可能的智能物联网设备。这也是一个极具挑战性的研究课题。会话人工智能的研究主要是口语对话系统(SDS)的研究。任务导向的SDS是大多数研究者最感兴趣的话题,而基于QA的会话或闲聊也是热门的研究课题。
未来几年,中国此方面在工业和学术界可能有三种趋势。首先,在复杂的声学环境和非合作的交互场景中工作的感知技术,如多人同时对话的远场语音识别或会议语音识别,将成为研究的重点。第二,认知研究将比认知研究吸引更多的注意力,特别是多回合、高度语境敏感的语言理解和对话决策。在这里,数据驱动和基于知识的方法的结合在许多任务中可能是一种有效的方法;统计对话政策的成功使用将使面向任务的对话助理能够在为人类服务的同时自行发展。第三,对话的概念将从基于语音的对话扩展到多模态对话,能够处理语音和视觉的对话代理将广泛应用于各种形式的智能硬件中。