近日,全球知名科技杂志《麻省理工科技评论》评选出了2016年“全球50大创新公司。”依靠在语音、人工智能技术领域的厚积薄发,百度力压谷歌、微软等科技企业,排名第二。这也是继深度语音识别系统(Deep Speech 2)获得“2016全球十大突破技术“之后,百度又一次得到的业界认可。
在移动互联网时代,人机交互成为了各方关注的焦点。而语音技术因其更加自然的交互体验正在源源不断的吸引着更多用户。根据相关数据统计,目前00后与90后在语音搜索的用户请求比例中占据了50%,这说明了语音搜索真正抓住了年轻人的需求。
百度副总裁王海峰近期接受采访时表示,看一项技术能否掌握未来,就看其是否能够让用户更为简单的实现自己需求,简单到让孩子和老人都可以掌握,而语音技术则具备这样的优势。随着语音、声纹、情感识别率的提高,语音输入将取代传统的文字输入,成为下一代人机交互方式。
正是出于对未来语音技术发展及其商业环境的信心,百度近几年在语音技术研发上投入巨资,基于深度神经网络等建模技术,充分利用机器学习算法、产品训练数据,挖掘海量语音数据所蕴含的信息,取得了卓越的智能语音技术研发成果。
相比传统的语音技术,智能语音包括语音识别技术、语音合成技术、声纹识别技术、声学信号处理技术,是基于人工智能技术和大数据,并采用深度学习算法在24时内对数以百亿级的语料库进行实时分析、高性能计算,令语音及声纹识别准确率达到97%甚至更高。此外, 由于互联网数据的更新速率越来越快,语音识别的技术迭代升级要求也越来越高。百度的智能语音技术通过对文本并行的处理与统计,从而达到以天的时间单位来更新语言模型。目前,百度已公开申请专利已经达到404项智能语音技术专利,远超竞争对手。
国内智能语音发明专利公开数量
除了语音技术,百度在人工智能技术的各个领域都投入了大量研发资源。百度拥有海量的用户行为数据,并构建了世界上最大规模的神经网络。百度通过文本分析、语音识别、图像识别、手势动作识别来理解用户的意图,通过优化搜索结果的智能排序来匹配用户的需求,通过估算和优化点击率和转化率来向用户推送精准的服务。最新数据显示,百度在语音识别、图像识别、自然语言处理、无人驾驶、机器学习、深度学习等人工智能相关领域共公开了1548件发明专利,遥遥领先于微软、 IBM等公司,并获得包括"单通道卷积层及多通道卷积层处理方法和装置”、"一种反向传播神经网络DNN的训练系统"等多项人工智能核心专利授权。
人工智能发明专利公开数量
作为国内人工智能研发的领导者之一,百度在推动自身研发的同时,也在积极反馈相应的研发成果给到整个行业,践行领导者对行业的推动责任。2016年初,百度硅谷人工智能实验室(SVAIL)开源了人工智能关键代码Warp-CTC,旨在帮助广大开发者利用更好的深度学习算法,加快推进其研发的进度,大幅提高人工智能的开发速度,让端到端的深度学习变得简单、快速。除此之外,百度还牵头成立智能语音知识产权联盟,并开放百余项智能语音专利,推动整个行业合作共赢、共同发展。