10月22日,由中国计算机学会(CCF)主办的2020年中国计算机大会(CNCC2020)隆重开幕。以"新形势下的技术创新之道"为主题的CCF 2020 CTO高峰论坛也在CNCC2020上首次亮相,CCF名誉理事长李国杰院士、小米集团创始人雷军、百度CTO王海峰、搜狗CEO王小川分别带来演讲。百度CTO王海峰在题为《远瞻与近思人工智能技术创新及产业实践》的演讲中,介绍了百度如何洞察AI技术发展趋势和和产业需求,提前布局,实现技术创新与企业发展战略的协调一致。
百度是国内最早投入、技术最强、布局最完整的AI领军企业。作为百度CTO,王海峰分享了他对这一角色的思考和洞察。他表示,CTO首先要能洞见科技发展趋势,统筹技术布局,确保技术的先进性;同时,也要洞察产业需求变迁,推动技术应用,支撑企业的发展战略;此外,还需要对企业的技术人才负责,建设高效研发体系,打造顶级技术团队。
在这一思路的引领下,百度在技术创新与应用上取得了丰硕的成果。从 2010 年开始,百度全面布局人工智能,以产研并重的思路,不断探索前沿技术、实现创新突破;同时紧密结合产业发展方向,通过AI开源开放平台和智能云输出AI能力,推动产业变革。目前,百度已经打造了业界领先的软硬一体的AI生产大平台百度大脑,并基于此形成现代的AI新型基础设施。
王海峰以百度机器翻译和语音技术的发展和应用成果为例,阐述了百度如何结合技术趋势和产业需求,推动AI技术发展、支撑百度战略的"远瞻"与"近思"。
十年前的PC时代,在互联网和其他行业中,翻译的需求已经十分旺盛;同时,大量的互联网数据、以及百度搜索引擎每日庞大的搜索请求,为机器翻译的发展提供了有力支撑,而AI技术的进步则让人类离跨越语言鸿沟的梦想更进一步。在此背景下,百度开始了机器翻译方面的探索,并陆续上线了全球首个互联网神经网络翻译系统,以及诸多创新成果。目前,百度翻译的每日翻译量已经达到千亿字符,支持全球203种语言的互译,涵盖4万余个翻译方向,服务30多个行业、40多万企业及个人开发者。
百度在语音方面的布局,也是从十年前开始。虽然当时语音尚不是主流的输入方式,但语音技术持续进步,智能手机的普及也初现端倪。百度敏锐洞察到,语音是人使用手机时天然的交互方式,二者结合将拥有巨大的应用场景。十年来,百度不断推动语音识别、语音合成等技术创新发展,并逐步将语音技术规模化应用于语音搜索、地图、智能音箱、输入法、呼叫中心和车载等众多场景,目前日均使用量已超过155亿次。
语音和翻译技术的进步,以及产业需求发展,机器同声传译应运而生。基于领先的机器翻译和语音技术,百度打造了低时延、准确率与人类水平相当的机器同声传译系统。
在发展语音、图像、NLP等AI技术的同时,百度也意识到深度学习的局限性,以及知识增强和跨模态的趋势。结合知识图谱技术,通过知识增强、跨模态理解等研究,百度在AI技术的创新与突破方面不断取得成果,并持续通过AI技术开源开放,推动AI技术的产业化应用,赋能各行各业。
在深度学习方面,百度拥有国内首个开源开放、技术领先、功能完备的产业级深度学习平台飞桨。飞桨以百度多年的深度学习技术研究和业务应用为基础,具有开发便捷的产业级核心框架、支持超大规模深度学习模型训练、多端多平台部署的高性能推理引擎和覆盖多领域的工业级模型库四大领先技术,也是国内最领先、服务开发者规模最大、功能最完备的开源开放深度学习平台,其应用已经覆盖众多关乎国计民生的行业领域。
以飞桨为基础技术底座的百度大脑,拥有50亿实体、5500亿海量知识的超大规模知识图谱,并研发出"知识增强的持续学习语义理解"技术,使百度大脑具备了"知识增强的跨模态深度语义理解"能力,可以综合语音、语言、视觉等不同信息,实现跨模态语义理解,获得对世界的统一认知。拥有这一能力后,机器能够听懂语音,看懂图像视频,理解语言,进而理解真实世界。
在领先、全面的AI技术布局支撑下,百度大脑已发展成为AI新型基础设施,目前已对外开放270多项AI能力,凝聚230万开发者,日调用量超过1万亿次,是业内最全面、最领先、服务规模最大的 AI 开放平台。同时,百度大脑的AI 技术,正在通过百度智能云持续对外输出,赋能给社会经济各领域,加速我国产业智能化进程。
除了打造领先技术、推动技术赋能产业之外,王海峰在演讲最后也强调了人才的重要性。他表示,百度的技术研发体系培养了1万多名工程师;同时,通过与社会各界合作,百度已经培养了超过100万名 AI人才;未来5年,还将继续培养兼具技术素养和产业洞察的AI人才500万名,为中国智能经济和智能社会的发展提供人才保障。