万物互联时代,可以想象人均联网设备会越来越多。但设备的增多不等同于方便和高效,设备互联不易,设备“智联”更难,最难的大概是我们如何能在设备增多的情况下享受到便利,而不用被操控多个设备、查找和使用各类应用等繁琐的过程所困扰。
在近日举办的华为开发者大会 2021(Together)上,华为给出了他们对上述问题的思考。简单来说,华为认为,人和设备的交互方式需要被重新定义,其中的核心利器是 AI。这样的答案听起来并不稀奇,甚至可以说是常见的标准答案。但是别忘了,华为正在构建鸿蒙生态,而基于这个生态底座,我们从中看到了更加“扎实”的可行性。
1
关于人机交互的想象
让我们先来看看,被重新定义后的人和设备的交互方式可能会是什么样的。
今天,健康是所有人都关心的命题,其中不少人通过健身、运动来管理身体。以“跑步”这项运动为例,华为设想了一个颇具“未来科技感”的交互场景在智能手表、智能跑步机、手机等多设备的联动下,用户在不知不觉中就拥有了专业的私人健身教练,并且这不是真人教练,而是基于 AI 的虚拟教练。
据华为消费者业务 AI 与智慧全场景业务部总裁王成录介绍,这个“私人教练”可以根据用户的身体状态,制定最恰当的锻炼方案,在锻炼过程中会实时提醒用户其锻炼方式是否正确,会不会对身体某个部分造成伤害,锻炼结束之后该如何放松,根据锻炼状态的结果给出恰当的放松方案等等。
而这个“私人教练”要做到如此智能,就需要获取大量信息。比如该用户在运动前的体脂率、心率区间、饮食和睡眠状况,运动中也需要实时监测呼吸、心率,了解运动的情况如跑步时的配速 / 坡度和跑姿等等。
而要获取更多更精确的信息和数据,就意味着需要更多的设备协同。越多设备协同,就相当于围绕用户的传感器会越来越多,这些传感器不断记录用户的行为,“私人教练”才能更准确地捕获用户的意图。
更重要的是,在这个人机交互的的过程里,用户不需要围绕多个设备去获取服务、查找服务,而是设备主动来理解用户并推荐相应的服务。
当然,运动健康只不过是其中一个智慧场景。“我相信在鸿蒙系统的加持下,我们会有非常多的机会去构建各种各样场景化的超级终端。”王成录表示。
2
HarmonyOS 如何更精准感知消费者意图
实际上,如今每个消费者身边的设备已经有非常多的传感器,它们可以表征地理位置、空间信息,记录生理指标、行为活动等,但大家使用设备的方式是“单设备”和“单维度”,而单设备、单维度无法准确捕获消费者意图,如果能针对场景把多个维度的信息做整合,就能够最大限度地捕获到消费者的意图。
因此,在传感器已经存在的情况下,技术上所面临的问题是如何获取传感信号,如何建立多模态语义,以及如何用多模态语义跟场景匹配进而准确捕获消费者的意图。
这里面主要涉及三个核心技术点,分别是多设备传感器信号的同步、多模态数据的标注和多模态自适应。
多设备协同的第一个挑战是复杂的设备异构性。要把传感信号利用好,非常重要的第一步是保障所有传感器上报信号的时序对齐。而由于设备大小不同、传感器不同、上报信号的特征不同等问题,要把信号之间的时序对齐挑战很大。
鸿蒙生态的软总线技术恰好能够很好地解决这个问题,软总线的目标是无限逼近硬总线的能力,其工作原理中很重要的一点是要有软时钟。软时钟的工作原理是当工作设备组成一个超级终端,就从最强的设备的晶振上去捕获时钟信号,一旦时钟信号捕获,后续所有业务处理的时钟将以软时钟为准。当前,软时钟的精度已经可以做到误差小于 1 毫秒,王成录表示,HarmonyOS 3.0 的 Beta 版本目标是做到 500 微秒,这样的精度已经能完全满足传感器信号同步的需求。
第二个核心技术点是多模态数据的标注。数据标注一直是 AI 样本数据方向很大的挑战,为此,华为提出了一个创新性的互助标注方法,在时钟同步和时间对齐的基础上,有标注模态的数据对无标注模态的数据进行自动标注。通过这样的方式,随着传感设备越多,标注的设备越多,关联的模态会越来越多,自动标注的效率也会大幅度提升。
第三个核心技术点则与小样本实时训练模型有关。相比偏传统的大规模语义训练,传感信号的样本数据很少,其次,传感器不够稳定,无法保障超级终端里面任何一个设备永远在线永远稳定,一旦发生波动就会对模型带来较大的影响。因此,端侧不能用现有的传统 AI 模型来做训练,华为专门为此研发出端侧的小样本实时训练模型,以解决小样本数据波动和不稳定带来的冲击性问题。
该模型的核心算法是稀疏编码,它是一种无监督学习算法,核心在于找到一个完备的基础向量机,向量信号进来以后利用基础向量机的线性组合来表征输入信号。这种算法可以非常有效地避免由数据不稳定、样本空间不稳定带来的模型波动问题。如果要在端侧用小样本做实时训练,这项技术是必不可少的。
另外,样本规模在训练过程中有可能会无限变大,因为它是在端侧做训练,硬件资源自然会被越占越多,这样一来其他应用就无法运行,所以华为也研发了一个自适应的部署技术。简单来讲,自适应部署可以限制训练模型消耗的硬件资源,当模型变大之后自动进行裁剪调整,保证模型在限定的硬件资源内完成训练和部署。
3
万物互联的统一入口
有了上述技术组合,传感器的联邦数据就能实时、准确地捕获消费者的意图,而下一步就是要根据意图去找对应的服务,把匹配的动作都交由机器解决,而不是像今天这样由消费者主动去查找、下载和安装各种应用软件。这里面要做的是不断增强隐式向量化意图,从海量服务和应用里找到数十个候选集,再加上显式结构化的意图,对候选集做进一步筛选和逻辑组装,就可以做到对消费者意图的精准反溃
实际上,HarmonyOS 2 的“小艺建议”背后便是用了上述这些技术。王成录指出,当前“小艺建议”的使用率已经很高,也正是因为小艺能够深入理解用户意图,并根据用户的时间、地点、场景把可能需要的服务都放到小艺建议里。这样一来,用户主动搜索的频率就越来越低。
“像‘小艺建议’这样的服务若继续坚持下去,有希望打造一个将来面向万物互联的人机交互的统一入口,通过小艺就可以屏蔽各种各样的硬件差异。”也就是说,在这个过程里,用户不需要在意自己是在跟哪个设备或服务交互,而只需要与小艺这个入口做交互,与此同时由于小艺的智能化,设备本身也在判断用户的意图。王成录将小艺称作“未来万物互联统一的交互入口”。
与 HarmonyOS 的设计理念一样,小艺也采用了完整的解耦化的架构设计,支持弹性化部署。换句话说,搭载 HarmonyOS 和 OpenHarmony 的设备,不论大小都能安装上适配版本的小艺。
“有了像小艺这样的部署,有了鸿蒙生态的互联和融合,在任何一个场景下,无论你在哪一刻用哪个设备触达,小艺都能感知到。小艺也会根据此刻触达的方式把信息反馈给你,省去了在不同设备之间不断配来配去、查找服务做逻辑组装的过程。”王成录表示,华为希望通过重重赋能,让真正的万物互联、万物智联时代加速到来。
4
开发者如何获取鸿蒙 AI 能力
目前,华为已经将包括小艺在内的所有能力通过软件服务包的方式提供给合作伙伴。
今年,HarmonyOS Connect 软件服务包 3.0 新增支持垂类应用的带屏设备,并升级了基础服务包、增强服务包,以及包含小艺、服务中心、畅连等应用在内的应用服务包,开发者直接调用即可快速开发出具备智慧 AI 能力的设备,预计到 2022 年将全面适配支持丰富应用的带屏设备。
有了软件包之余,也需要考虑是否便于开发者使用。面向硬件开发者,华为提供了一站式设备集成开发环境,支持远程开发、按需定制、一键编译和烧录、一键集成服务包和设备仿真器,降低了开发者的接入门槛和开发周期,提升了开发效率,无屏设备开发周期已由 2 个月减少至 2 周,带屏设备预计 2023 年将缩减到 2 个月以内。
下载地址:https://device.harmonyos.com/cn/develop/ide
面向应用开发者,华为也推出了一站式设备集成开发环境,其中提供了超过 50 个原子化服务和卡片模板,支持多端双向预览、低代码开发、分布式模拟仿真以及分布式调测等。据介绍,目前原子化服务开发效率已由 1 个月缩减至 15 天,明年的目标是一周,预计到 2023 年,只需要 5 天就可以完成开发。
下载地址:https://developer.harmonyos.com/cn/develop/deveco-studio/index.html
王成录表示,未来将不断增强能力、增强工具,给开发者留出更多的时间和便利去做业务的创新,“把复杂交给我们,把简便留给开发者。”
5
写在最后
2020 年 9 月 10 日,鸿蒙操作系统正式发布,迈出了鸿蒙生态的最关键一步。今年 6 月 2 日,HarmonyOS 2 手机版本的发布将鸿蒙生态构建按下了快进键。如今,搭载 HarmonyOS 设备数量已经超过 1.5 亿。这个成绩对于鸿蒙生态来说可以算是个不错的开局。
真正的万物互联时代的到来离不开 AI,AI 将重新定义人和设备、人和服务的交互方式。现在,鸿蒙已经在 AI 开发能力和服务上做了一些工作,但光靠华为一家公司还不够。会上,王成录也表示,欢迎更多合作伙伴和开发者加入鸿蒙生态,持续添砖加瓦,开启万物智联的新时代,这也是鸿蒙生态从诞生起就肩负的使命。