已购《培训行业这一年2020》的读者可在多知网订阅号回复“新书惊喜”,参与读书话题讨论。
多知网3月20日消息,据新华网报道,近日,在声学、语音和信号处理国际会议(ICASSP)信号处理挑战旗舰任务、全球首个小资源音色克隆挑战赛多说话人多风格音色克隆大赛(M2VoC)上,猿辅导AI研究院的技术团队荣获子赛道冠军。
在线教育的选手们都在技术上开足马力,可见,当前,行业已经进入拼技术的新时期。
据悉,猿辅导技术团队斩获该子赛道冠军时所展示的技术,是早在小猿口算、猿辅导网课等产品内实现应用的语音合成技术。
早在2014年,猿辅导就成立AI研究院,截至目前已经发展形成语音实验室、视觉实验室、自然语言理解实验室、音视频实验室和基础支撑五大实验室。研究院重点投入的研发方向,多是从教学实践中反馈来的现实需求。
例如,一般的语音合成技术,只需保证语音合成的字眼准确性,较少顾及在声调、停顿等方面的细节。但在猿辅导,诸多在线课程针对的是3~12岁的学员。一线教师需要根据孩子的特点,用特殊音调、韵律去帮助孩子“磨耳朵”、练习自然拼读,用带有启发式的停顿方式读题,引导孩子思考并给出准确答案。要在教育领域应用语音合成技术,不仅要语音准确,还需要让AI也能准确发出老师所需要的韵律信息。
这些通常在其他领域不被当做是问题的“小痛点”,就成了猿辅导AI研发必须攻克的关键目标。日常的积累让猿辅导的技术团队对语音合成更为敏锐。在本次大赛中,他们主动加入更多韵律信息,使得语音合成的效果更加流畅、自然、有节奏感,这成为猿辅导AI研究院的技术团队荣获子赛道冠军的原因。
与此同时,猿辅导的技术研发成果正在反哺到教学之中,教师也可以用技术提升教学效率和课堂质量,实现个性化的教学。
例如,斑马AI课的AI技术及专业教研团队,研发出AI互动多感官情境课堂,激发孩子学习兴趣。
课堂上对AI技术的广泛应用,还能有效提升网课效率。以随堂测验为例,网络课堂中每个学生提交答案的先后时间、正确率情况,每个孩子的反应快慢、与老师互动频率等。
研究团队成员杨明祺介绍,智能语音是人工智能技术的重要组成部分, 在经济社会中有着非常多应用场景,此次在语音合成技术方面取得实质进展,未来能够被进一步应用到教育、医疗等行业和领域中,推动我国人工智能技术的发展。