追一科技Claire Wu:更美好 AI 世界

人物报道1年前 (2023)发布 aixure
69 0 0
导读:关于追光者 2020这个看似艰难的开年,事实上成为了数字化生活的加速助推器。5G已经是人们眼前可见的未来,更美好的数字化场景触手可及。 在无论多艰难的环境里,我们希望从身边每一个看似平凡的创新者身上,依然能看见光,依然能勇敢地去做一个追光者。 内容…

关于“追光者” 2020这个看似艰难的开年,事实上成为了数字化生活的加速助推器。5G已经是人们眼前可见的未来,更美好的数字化场景触手可及。 在无论多艰难的环境里,我们希望从身边每一个看似平凡的创新者身上,依然能看见光,依然能勇敢地去做一个追光者。

内容来源

2020年7月28日,腾讯5G生态计划主办「追光者-5G引领数字化」第二季第九期直播。

嘉宾简介

Claire Wu,追一科技商业与战略总监。毕业于美国卡内基梅隆大学,曾任职美国摩根大通银行和某一线创投机构,对AI技术和赋能产业有极大热情。

主要观点

1、5G技术将打造新一代智能交互模式

2、企业数字员工如何在5G技术加持下提升客户体验,提升企业运营效率

3、追一科技的实践经验

特邀嘉宾

Claire Wu

追一科技商业与战略总监

大家晚上好,我是追一科技的战略和商业化总监Claire Wu,代表追一来分享在5G时代下,作为AI行业践行者的思考和探索。

今天晚上我的分享将会分为三个部分,首先我会简单介绍一下追一科技以及我们反复提到的AI数据员工概念;第二部分我将会从两个方面讲一讲5G技术的红利将会如何利好AI的发展,会我们的企业客户带来什么样的新机会追一又是如何利用这些即将到来的技术红利来更好地服务我们的企业客户;最后一个部分是最后的互动环节,也欢迎大家向我提问。

那么首先我用一点时间介绍一下追一科技,我们成立于2016年1月份,当时就获得了晨兴资本的天使轮投资,三月份在深圳正式成立了总部,2016年5月份发布了第一款文本类的产品,接下来也是一直获得了整个行业内头部基金的青睐,并且我们也持续对产品进行迭代。

追一科技:以智能语义为核心,为企业提供AI数字员工解决方案

追一科技是做什么的?我们其实是一家技术驱动的公司,我们围绕的是人工智能里面的一个细分领域,叫做智能语义理解,也就是大家经常听到的NLP。我们是以技术为核心,利用技术来去为企业客户进行赋能,赋能方式是我们把NLP技术作为大脑,做了很多不同类型的数字员工,这些数字员工接下来我们会详细地去阐述。整个公司大概有300多人,我们拥有的是中国最大的一个NLP及研发技术团队之一。

追一的技术实力

追一科技一直围绕着NLP技术来做延展,为了保持AI综合技术的领先也是进行了非常多的投入。

举几个小例子,第一个例子是SuperGLUE,SuperGLUE是NLP技术领域在全球范围里面最为权威的比赛,它对NLP技术的考虑是非常综合的。在2019年的年底,追一科技用平常给企业客户去做的一个模型参加了比赛,获得了第三名,领先于Facebook和IBM。这里的第二名是Google的一个T5型,它是一个比较大的NLP模型,可能不具有一定的商业化能力。

第二个例子是斯坦福大学举办的CoQA比赛,它更多聚焦于NLP技术当中的多轮对话能力,追一科技也获得了第一名和第二名,在大规模预训练模型中融入对抗训练和知识蒸馏,单模型表现首次超越人类

第三部分是CB Insight AI 100,是全球人工智能领域最权威榜单之一,追一科技也是在CRM和销售领域入围的唯一一家中国AI创业公司。

什么是追一AI数字员工?

AI数字员工,其实它具有了非常多的综合能力,在这些综合能力的背后,其实代表的是不同的技术细分领域。

首先,数字员工并不是一个新概念。之前大家可能听过RPA。RPA其实是帮助企业去进行一些流程和任务自动化的技术站,一开始的数字员工形态可能就是利用RPA技术去做一些简单的流程自动化处理,接着随着AI技术的发展,我们让数字员工具有了一定的智能感知能力。

感知又分为两个层面,第一个层面是视觉方面的感知,它可以看得到;第二个方面是语音智能的感知,它会“听”,也会“说”。其实也就是我们常说的ASR和TTS等AI技术能力。

最为核心的技术,也是追一的核心技术:数字员工的大脑。它可以让数字员工去认知,去理解,去表达,就像是人类一样。人类大脑是最晚发育的(相对于其他器官来讲),并且是非常最为复杂的人体器官,所以NLP在整个AI技术里面也是最难的,NLP也是追一科技这四年来一直在努力的技术方向。综合了以上所有的能力后,追一AI数字员工可以独立地完成,或者是协助人类去完成各种各样的工作,推动企业和组织完成数字化转型和升级。

追一AI数字员工的工作流程

它具体的流程可以分为四步:感知理解行动学习。

一、感知

通过获取并处理图像、声音、语言、文字和其他数据,察觉周围的世界。

二、理解

它将上述数据传输到采用了NLP技术的大脑里,它可以理解所收到的信息,解读信息的呈现方式及其背景,推导出其中的含义。

三、行动

AI数字员工基于上述理解,采取行动,执行任务,解决问题。

四、学习

第四步也是AI数字员工最核心的部分,AI数字员工可以从成功或失败的行动中吸取经验教训,不断优化自身性能。

追一科技已为多家行业标杆客户提供数字员工解决方案

追一在这四年当中,利用AI数字员工服务了超过300多家的KA客户,覆盖的行业也比较宽泛:金融行业一直以来都是重中之重,而金融里面又包括银行保险和证券基金;当然还有包括其他的一些头部行业,比如说泛生活服务、新零售,还有一些能源政企客户等等。我们给KA客户提供了各种各样的数字员工类型,比如说刚才提到的文本机器人,它去落地到一些大的银行。

比如说我们和招商银行合作,在2016年就帮招商银行去构建了智能客服的解决方案。大家现在在招商银行的APP上面看到的小招标,可以跟你去自由对话的,背后就是追一数字员工客服的角色。还有包括其他各种各样的岗位,比如说我们帮某一个股份制银行做了催收、外呼这么一个产品,它就类似于催收专员的角色。

追一的底层NLP技术,结合不同的企业客户、不同的场景,形成了一个个虚拟的数字员工,帮助这些企业客户大量降低了人力成本,提升了终端客户的体验。

5G+AI数字员工

其实5G除了平常所说的宽泛意义外,它可以未来作为AI的基础设施,帮助AI在数据、算力等方面去进行提升。

5G有两个核心的技术要素,会非常有助于AI的进一步发展。

第一个就是它的高速率以及低延时的信息传输特点,第二个也是5G未来将会给我们带来的更加丰富,更加多维度,更加海量的样本数据。

追一的产品矩阵分为三层,第一层叫做交互,有在线机器人、语音机器人、多模态数字人三款产品。这三款产品分别是通过不一样的模式跟客户去进行交互,比如说文本的交互,我们叫在线机器人,它是通过文本端可以去理解文本的含义,第二个是语音的交互,发展到了第二阶段之后,我们加了一些ASR、TTS等等技术,我们组成了一个在语音端电话渠道可以跟客户去交互的语音机器人,第三个未来就是一个多模态的交互模式,我们称之为多模态数字人。

第二层是协同层,诚然,现在NLP技术整体的发展还处理不了一些非常复杂的情况,所以AI数字员工在独立完成任务之外,还可以协助员工协同人类去更好地完成任务。包括智能助理员可以在电话端实时地去辅助我们的坐席开展工作,还有一个叫智能培训师,培训坐席、培训营销人员,用人工智能交互式沉浸式的培训模式,让他们更好地去适应自己的工作岗位。

更底层的是数据分析层,数据分析层是基于大量的交互数据去对非结构化数据进行处理的一些产品,包括智能分析师和客户画像师。

未来5G时代它可以带来的是什么?它的高速率,低延时的传输特点,会让我们的交互产品从文本端越来越多地向多模态的交互模式去转变。更加丰富、多维度的数据可以让协同过程变得更加流畅,并且它的数据量会直接让数据分析类的产品有更多数据源,可以产生更多的数据价值。

新一代交互模式

我们首先来讲一下刚才提到的新一代交互模式。数字员工按照交互方式的不同,其形态也不同,例如刚才提到的文本及语音。而5G带来的是多模态的形态。

一开始去做交互理解的时候,基于的是“关键词”;第二阶段是基于数据模板、动作模板;第三代其实是基于一些搜索技术;第四代,也就是追一现在使用的“融入了大量的深度学习、AI算法,让所有东西融合在一起做的智能提炼的技术”。最早的时候对应的交互是文本端的交互,随着语音技术的发展,我们把“能听”和“能说”的技能赋予给了这些文本交互的模式,让它可以从语音层面进行交互。那未来5G的技术让我们可以再丰富一层,我们叫做多模态融合,是把文本,语音,甚至是情绪,肢体动作,面部表情等等所有的感官和表达都融为一体的交互模式

目前比如说需要办理业务的时候,如果遇到了一些问题,可能在APP上面,我们会先去找智能客服。如果沟通不了,或者是比较着急直达的场景,会选择打电话沟通。而未来可能是一键唤醒一个多模态数字人,一个真人的形象就会出现在你的面前。

第一,它不仅仅是可以回复客户的问题,还可以去帮客户完成一些任务,比如有一个客户要求说他要去充值,就弹出了一个数字框,然后可以输入自己的电话号码,可以完成非常连贯和顺畅地完成整个充值的动作。

第二,它不仅仅是一个形象展示,它融入了包括图片、二维码、视频等等,它能以不一样的媒体形式去进行一个沟通。

第三,它可以跟企业业务系统去形成多维度的打通。

第四,它可以做一些其他事情,例如陪客户聊天或者讲笑话,让客户体验更有温度,更专业。

追一多模态数字人

数字人未来展现的终端可以是非常多样的,手机端、PC端,甚至可以在线下的很多数据终端完成展示。

追一数字人从形象上看分为两个类型,第一个类型是2D仿真数字人,用真人的形象去做一个可以跟客户去交互的仿真数字人,核心技术包括了模拟真人的唇形、自然的肢体动作等等。第二个类型我们叫3D数字人,比如说我们跟很多银行客户去沟通的时候,他们希望能把银行的吉祥物变成3D数字人,未来服务的时候,会更亲切可爱。

那从类型来讲,数字人又分为两种类型,一个叫播报型,还有一个叫交互型。播报型其实比较好理解,比如说未来需要快速去播报内容的时候,我们可以让数字人去完成整个播报,播放体验会非常自然,并且非常高效。另外一个也是现在非常旺盛的需求,也就是这种交互型的数字人。未来它可能就是企业的新型的客户形象,它可以去跟终端客户去进行交互,可以一问一答,因为它具有“大脑”的功能,还有整个底层NLP技术,去理解客户非常泛化的一些问法并且做出反溃

交互型数字人是我们这个行业里面现在比较难的技术点,它涉及到了多种技术组合,NLP是里面最核心最难的部分,其次还有语音、视觉、机器学习等等,还有如何去融合,所以说现在业界也都在投入大量的资源和精力去研究多模态的未来交互形式。

多模态数字人对5G通讯的技术要求

5G如何去利好多模态数字人?当然依靠5G实时传输的能力。交互型数字人在现有网络下放在手机终端的时候,会面对传输效率、卡顿等问题。

在5G完全普及的时候,所有实时交互的情况都可以在你的手机上进行展现,包括高辨率图像传输、云端渲染等等,这一切都会让多模态数字人体验更好,并且会帮我们去降低成本,让它变成一个体验又好,对于客户来说又非常经济可行的交互模式的选择。

这样的多模态数字员工,它可以用于的场景就非常多了。比如说远程银行,远程银行核心的点是通过视频让在网点的客户跟银行的远程坐席进行连接。但是这样的资源毕竟是稀缺的,在一些简单的场景当中,我们可不可以去使用数字人来完成这个交互?

除此之外,还比如说把它放在教育培训等行业,教育培训行业的师资其实是非常稀缺的,尤其是助教这么一个角色,可不可以说未来AI数字员工变成了AI教师,可以帮助真人老师去完成基础的工作,比如说布置作业等。

“芝麻属性”

多模态数字员工可运用的想象空间是非常大的,那么可能有人问,衍生出这么一个多模态数字员工的形象到底有什么好处?我们其实也进行了一些总结,我们称之为“芝麻属性(SASAME)”,它有这么几个特点。

Scalable(弹性增减,动态均衡)数字员工毕竟是一个软件产品,它可以根据客户的要求进行弹性的增减,动态的均衡。可以看到很多行业其实是有服务的波峰、波谷,企业不可能按照波峰的数值去储备劳动力,追一就可以用数字员工的形态去帮助企业在高峰时期缓解压力。

Accessible(容易部署,快速实施,全流程陪伴)AI数字员工是非常容易部署的,流程非常快,跟培养员工相比成本是更加低廉的。

Measurable(结果可衡量)数字员工成本可控,节省多少人力、提升多少触达率、转化率等关键业务指标都一目了然,让ROI变得可衡量。

Evolvable(自我进化,越来越聪明)我们觉得这个特点是追一AI数字员工所特有的,也就是它会自我进化,有更多的数据,它就会成长得更快,会越来越聪明,逐渐成为经验最丰富、认知覆盖最广、业务理解最透彻的员工。

Sustainable(稳定可持续)数字员工规模稳定,不会发生意料不到的离职。同时它业务能力稳定,不再受主观因素影响。

Engaging(7*24小时全程投入专注)AI数字员工无视繁琐的工作,每时每刻都在专注投入,是令管理者信赖的员工。

挖掘数据金矿

在5G时代,会有更大量、更多维的数据。我们希望用追一“非结构化数据挖掘”的能力,帮企业去获得更多的行业经验。

让我们数字员工不断进化的一个重要维度是数据的复杂程度,另一个是业务和流程的复杂程度。5G将促使AI数字员工不断进化,根据数据复杂性及流程/业务复杂性,有以下三个层级:

效率模式(提供持续、低成本运营)在数据结构化稳定、数据量比较可控,流程也比较常规和可预测的情况之下,我们可以试用一些传统的自动化方案。

效力模式(支持智能协作,变革流程,自我进化)随着数据量的增加,我们可以用追一的AI数字员工,以及感知、理解、行动、进化等等多种能力去支持工作的开展,还有智能协同。

创新模式(支持创造力和创意)在非常复杂和非常高阶的情况之下,我们可能需要更新的创新模式。

多源的数据采集和连接-结构化和非结构化结合

5G可以让我们拥有更多的数据源,在落地到项目实践当中时,我们也会和一些企业客户去分析。

例如某个企业客户手头有客服信息、企业数据、社交媒体数据、行业网站、主题论坛、行业知识库等数据(未来在5G的加持之下,数据源和数据量可能更丰富),TA想做舆情分析以及客户画像的时候,追一的数据产品能做些什么?

追一的数据产品逻辑

我们简单来说一下,分为三个部分:输入类型、分析引擎(多维算子)、应用场景。

输入类型输入类型是刚才提到的各种各样的数据源,包括语音会话、文本会话、文本段落、图片等等,追一利用ASR、NLP断句技术、OCR等技术,把信息抽取出来,放在我们的分析引擎里面。

分析引擎(多维算子)这里的分析引擎不是一个技术概念,它是一些NLP算法能力的结合。经过引擎的分析,会输出两个东西,一个叫做语义标签,一个叫做实体标签。

应用场景我们把上述两个信息用在各种各样的场景里面,包括用户画像、坐席画像、投诉分析等等。

比较多用到的地方在于投诉分析,也就是我们经常说的舆情分析,接下来我们举个例子。

数据产品举例-用户反馈分析

项目背景

第一个例子是我们汽车领域的企业客户。TA希望能对自己用户的反馈进行非常实时的分析,TA对于客户的体验非常重视,希望能够收集用户在各个渠道的发声,然后进行分析。反馈渠道有很多,包括APP、公众号、后台的工单数据等等,一级类别15个,二级类别45个,分清业务的同时还要清楚客户讲某个业务时的情绪,来判断客户是认可还是批评。同时统计每日高频问题,敏感问题及时响应。

诉求

客户描述时,用的都是自然语言,这些数据不是平常企业可以去处理的,因为这些数据大多都是非结构化的数据,它很难通过关键词或者模板的正则匹配,所以花费了大量的人力成本去做,希望有一个智能化的工具来解放人力。

客户比较关注的一些维度,包括安全、空间感、设计、价格、质量、舒适程度等等,TA还比较关心用户是在什么情感下去描述的。

对于大量非结构化的数据而言,AI对于“泛化的口语表达”的理解至关重要。AI里面的NLP,它如何去更智能地理解人说的话,其非常核心的判断标准就是它可不可以去理解这种高度泛化的口语化的表达。

比如说用户说“过颠簸路段 S弯 上坡下水 稳定性和舒适性强”这句话,如果用关键词去匹配,是比较难匹配出来在讲什么的。但是我们通过NLP泛化的能力,提炼出这个人表达的是:“驾乘与行驶感受”、“处于欣喜情绪下”。

所以针对于这种口语化的非结构化的数据,在提炼出用户到底想表达的是什么、以什么样的形式来表达这句话之后,在后台我们会帮TA去做统计分析,这样就可以让客户非常快地掌握TA的用户对产品的反溃

数据产品举例-用户画像构建

用户画像是经常在销售场景下会用到的。我们经常希望能够把所有客户进行分层,进行精准营销,但是目前的用户画像效果比较差,因为有大量的非结构化数据的信息是没有被提炼的。

项目背景在这里的例子是地产行业的客户。地产这个行业,大部分时间下销售代理去用电话跟客户沟通意向,去推销新的楼盘,在客户描述的时候,也都是一些非常口语化,也是非结构化的数据,同样很难通过关键词或者正则的匹配方式。

如果人工去听、去记录、去分类、去分析,效率会非常低,追一是如何帮助TA改善的?

例如销售代表跟客户打电话留下的通话记录,追一会以对话的形式把通话记录先转成文字,提取其中的非结构化数据:“投资还是自注哪个区域、什么价位”等等。

比如客户主动问了交通、学位,就证明这两个是客户选房子非常核心的考虑标准,我们就会进一步去处理,把这些意向转换成结构化的数据,未来通过对于这些数据的挖掘,可以对每一个客户的意向都了如指掌。

在通话结束后,追一就可以去挖掘出这些信息来,不需要手动填,可以节省大量时间,并且准确度也非常高。并且,对于地产来说,每一通电话所收集累积的信息是非常宝贵的,未来做楼盘营销的时候,就会非常精准,也可以去更快地去满足客户的需求。

数据产品-实时辅助

刚才提到的,不管是舆情监控,还是说用户画像的构建,它都是属于事后分析,其实我们追一的产品,进行实时协作时也可以起到实质性的作用。

智能助手比如说“智能助手”。在客服和客户电话对话的同时,追一会对接CRM系统,快速了解客户信息。在进行实时的文字转译时,可以做两件事情:流程导航以及话术推荐。流程导航是指在特定的场景下,列举出来一些选项供客服选择。而话术推荐是实时的,比如说客户说我今年不办保险、在开会,我们通过后台的数据,调取出最适合应对的话术,说什么样的话可以挽留客户,可以跟客户说更多的产品介绍。

通过智能助手的辅助,这些新员工的业务能力有了更快的提升。这个就是我们通过对非结构化数据的处理和用户意图的挖掘,在实时的情况之下协助人工更好完成任务的一个场景。

畅想:下一代的银行用户体验历程

最后我们整个的分享也是进入尾声了,这里讲一个我们之前跟一些零售银行客户一起探讨的一个想法。

未来在AI的技术加持之下,在5G的实时万物互联的技术下,零售银行用户体验会是什么样子?(以下为想法)

Next-Gen Customer Journey of Banking

1、通过对非结构化数据的挖掘,发现有两位客户最近几周,数次在母婴店消费,也在产前辅导班付学费;

2、结合用户其他的基础信息,例如“王先生、男、34岁、已婚、有车”、“赵女士、女、28岁、工作7年”,那么对于王先生,他可能会需要车贷,对于赵女士,在人生阶段发生改变时,可能需要给她推荐保险理财;

3、触发数字电话外呼员对王先生进行自动触达和邀约,包括贷款产品介绍、对话内容及意图收集;推荐赵女士给理财顾问约会面,数字业务顾问全程提供保险理财产品信息及话术指导。

4、经过沟通,用户最后可能做出了决策,决策之后有一个回访,对产品、购买体验去做售后跟进,最终可能不断地去发现下一个商机。

也就是说,未来在这些数据越来越多,并且多渠道能够做到更实时的整合的情况之下,作为企业可以去更好地、更及时地去服务自己的终端客户,当然,这些还是要依赖很多未来技术的发展,这也是我们对未来的一个畅想。

今天的分享也就到这里结束了。追一科技的SLOGAN是“更美好AI世界”。AI在这里的意思是当作动词在用,我们希望能够用AI的技术,让世界变得更美好。同时也欢迎大家去关注追一科技的微信公众号,里面有非常丰富的内容、解决方案。

QA环节

第一个问题来自观众"Sherry Tse":“Claire刚才提到了AI数字员工会是下一代的入口,您比较看好哪些场景呢?什么场景会更快地去落地?”

如何理解未来?

我们认为AI数字员工在以后,会成为企业面向客户的形象展示担当。就场景而言,目前最成熟的当然是服务场景,包括文本端、语音端的智能客服等;其次是一些大型企业、跨国公司,把内部的知识整合,未来员工可以去跟这样一个“大脑”进行交互。

第二个问题是我们主办方准备的问题。Claire您刚才有提到AI数字员工是不断演化进化的路径,你认为在5G时代或者更遥远的未来,AI数字员工的完整体是怎样的?

就目前而言,AI数字员工我认为仍处于最初级的状态。

未来的话,从几个方面来讲。第一,刚才有提到的,TA的交互模式会发生变化,从文本、语音到在5G的支持下成为多模态交互的模式;第二,每一个数字员工未来会越来越聪明,目前因为技术的限制,TA只能在相对封闭及简单的场景去开展工作,随着NLP技术的进步,TA其实可以去处理更多复杂的含义;第三,我认为未来可能在一些场景里,AI数字员工与人之间会有更多的协作,形成更有效的协同效应。

第三个问题依然来自于观众“Sopvinal":“如果AI数字员工要在形态、情感上更贴近真人,理解人类的情感,这里需要什么样的技术呢?”

目前因为技术的瓶颈,追一的NLP技术能力还是会去处理一些相对标准化、简单化的场景,如何提升这部分的能力?一部分是要依靠NLP技术的提升,第二是需要大量的训练数据。

那么从情感这块来说,这里其实主要是讲“情绪识别”。目前追一已经可以非常准确地去判定一个客户的“正向情绪”、“负向情绪”和“中性情绪”了。在很多场景里比如说舆情分析,对客户的情绪做这三种的基础分类。另外,我们也在研究更多高阶的情绪识别,例如惊讶、失望等等。至于如何细化,要看商业和客户的需求。

最后一个问题,来自于“abaiCraie”观众:“AI员工的普及确实能帮助企业提高效率,但会对人类的就业造成影响吗?包括AI员工与人类员工的关系、跟企业的关系?”

这个问题也是我们追一经常在思考的。其实AI数字员工不是为了取代人类,TA更多的是去应付一些高峰情况以及协助人类。

一方面把人类从单调枯燥的工作中解放,去尝试做更多有意思的事情,例如客户需求分析、营销事件等等;另一方面,随着AI技术的发展,有很多公司有新的AI类的岗位,例如说AI关系,那么这个是创造了新的就业岗位的。

主持人寄语

感谢大家对腾讯5G生态计划的关注。

我们在持续地去寻找腾讯所定义的三大方向,12大场景里,产品和技术比较成熟、希望和腾讯一起合作去打造5G时代不同场景的相关合作方案的伙伴,也欢迎大家通过腾讯5G生态计划的公众号底部“阅读原文”,去获取腾讯5G生态计划报名链接,在产品、技术、品牌资本方面,我们都会给予相关的支持。最重要的是我们希望和足够多的创新伙伴和合作伙伴一起在5G时代早早地去做探索和落地。

非常感谢大家这一个小时的收看,再见。

赞助本站

© 版权声明

相关文章

暂无评论

暂无评论...