*人工智能是什么?
文/Yang
2015年的博鳌论坛上,当时还在GGV投资的卓福民,给我推荐了名片全能王,一款可以在手机上管理名片的应用。我还记得他当时说:这就可以节省纸质名片了。
它确实带来了便利,大量名片可以随身带着走、也能搜索要找的人。不过我从来没有想过,名片全能王的出品方,会是家人工智能公司。
2020年度世界人工智能大会上,这家公司的创始人陈青山这么介绍自己:合合信息是一家一直从事AI大数据的公司。名片全能王是合合推出的面向个人的应用之一。
做名片管理,和AI能有什么关系?对任何自称是风口里的企业,最好留几分心眼,至少不能全信。AI的风还在吹,有关没关的都想借着风力上天,只要能跟数据、计算搭上点边的,就说自己是AI公司的大有人在。
合合旗下除了名片全能王,还有扫描全能王和启信宝,前面两个是工具类产品,后边一个则是做企业征信的,可一般人理解的AI公司,不应该是商汤、旷世那样的吗?
世界从来都是这样。虽然火出天际,但没有几个人明白怎样才算个AI公司。牛津大学的人工智能教授迈克尔伍尔德里奇(Michael Wooldridge)特意提醒了下,AI并不只是一种技术、而是一系列的技术。
*伍尔德里奇是AI的忠粉
比如被提到次数最多的“机器学习、深度学习”;还有搜索技术,即系统找到复杂问题解决方案的能力;如果正好有留意到潘石屹在学习Python语言,应该多少也听说过自然语言理解,这也是人工智能的核心技术之一;另外还有一项技术,是战略推理。
对于这些专业名词,大部分人只有“不明觉厉”的感觉。可单看字面意思,很难理解,名片管理用得着这么高深的技术?实际上,也真用不着。但说它是人工智能的一部分,也没错。
让我们从头说起。伍尔德里奇提到的一系列技术就像武侠小说里的神功秘籍,用起来很可能威力巨大。平安首席科学家肖京博士认为,它们能重构、改造现有的生产流程。
一个广为流传的案例,就是猪脸识别技术。养猪的要为猪买保险,保险公司在这其中就面临着欺诈风险,怎么分辨死掉的猪就是投保的猪呢?
从前的做法是给猪带上个传感器、打上标签,可这么做不仅成本高,也解决不了造假问题。不然市场上怎么会有那么多假茅台?人们指望人工智能能解决这个问题,猪脸识别,就能说它能分辨出猪和猪的不同,认出死掉的猪是不是就是投保的猪。
可这些技术纵然有万般好,却只能在数字的世界里发挥作用。所以,人们先得要搭建一个数字的世界、一个与现实世界对应的虚拟世界。数据化,就像是往AI世界搬运土石砖瓦,它们是建造美丽新世界的原材料,人工智能技术的成熟也需要它们的喂养。
*我们需要再建一个虚拟世界。
合合信息的逻辑,就是先扮演数据转化和搬运的工作。为再造一个新世界而服务其实是挺好一生意,需求量巨大。
肖京举了一个例子,平安每年要处理1300多万件的车险案例、每个都有50到100张的照片。而中国有超过100家保险公司,除了车险,保险公司还有寿险、财产险等其他品类。除了照片要数字化,保险公司还有各种保单、票据、证件等等,还要处理大量的声音资料,保险公司的客服部门每天可能打进打出的电话,就是百万量级的。
而保险公司只是一个小切口,从中能看到现实世界被传输到数字世界,会是怎样开始的、需要做些什么。只要是有人、有具体的行为、有关系,就会不断地产生各种票据、图片、声音资料。
这时候,就需要有专业的“搬用工”。仅仅每年几亿张的照片,如果由人来把它们扫描、录入电脑,需要多久?听起来就是个不可能的任务。
机器不会疲劳、效率也可能比人高,比如输入一张照片,人可能需要花上几分钟,机器可能只要花上一秒钟。人工输入可能会出各种状况,比如图像太黑或者没有扫描全等等,机器出现纰漏有可能越缩越校
陈青山说,AI在这里面的应用,是框出有效信息、提高图像的表现能力。不过机器的这些能力,也需要在学习中逐渐建立和增强。每个用过名片管理软件的人,可能都有过这样的经历,最初软件对名片的边框识别不是很灵敏,名片上的字有时候会识别错误,不同的信息的归类可能也会出现错误。这些情况也在改善。
用于数字化的AI平台的发展阶段,在行业里被划分为4个阶段,图像处理是最初级的能力,而文本识别则已经进了一步。再进阶就进入了文本、文档的理解阶段,就是对识别的数据进行分类甚至进行感情标注,那些如同蜘蛛网一般纵横交错的商业图谱,就是技术进化到这个阶段的产物。然后这些信息才能用来改造生产流程。
“超级搬运工”就是这么养成的,不仅快速、随时随地准备好工作,慢慢地还知道什么东西放在什么位置最好、哪些东西可以放在一起,还能修复瑕疵、保证物品的完整性,甚至还能感觉到人的喜怒哀愁。
这么一说,是不是就高级多了?
可合合信息只想做个搬运工吗?可能并不是。陈青山自己也说,在模式识别、文本识别、场景识别之外,合合也在高阶层的人工智能技术上发力,无论是认知智能,还是自然语言处理、知识图谱等,“我们深耕了十几年了”。
10多年前,他们几个人开始创业时,市场的主流梦想是直接卖技术模块。直接为平安这样的大公司服务多好,不仅生意场景多、数据量也大,而且可服务的时间也很长。一个起头难,开始了就能做长久的生意。
可是,这条路当时还走不通。大公司还没动起来,它们对技术本身、对技术的效果以及技术怎么落地,都还有疑问。另一头AI技术公司们,也并没有准备好。大客户需要一揽子的解决方案,不仅只是提供技术,还会要求有具体产品,“有现成的锤子能直接拿来钉钉子”。
于是先做C端。这是围魏救赵。如果不能直接攻打主阵地,那就先占领周边。还无法撬动大公司本身,那就先去撬动和它有关的人和场景。陈青山也说,2C市场和2B存在联动的逻辑。通过名片全能王等产品积累的用户口碑,能为打开B端市场创造条件。
*网
大公司也是由人组成的,他们有大量的商务往来,很可能用过合合旗下的产品。名片全能王、扫描全能王和启信宝,据说已经都有2~3亿用户人群。2014年,合合信息成为三星手机全线识别模块的技术提供商,走的就是这么个路径。别人家用投放解决品牌影响力的问题,这家公司用产品。
对技术公司来说,迅速转向C端也是个理性选择。人工智能就像个小娃娃,没有数据的喂养就长不大。C端市场就是个奶妈。等到B端需求起来时,合合的企业级产品也推出来了。
尽管名片全能王等一开始是面向C端的,但围绕的都是“商业行为”,一个没有商业目的人不会用名片、也犯不着去查人家公司的情况。聚合了一大批人后,却意外地营造了一片商业生态。人在哪里、需求在哪里,商业机会就在哪里。合合因此能撮合各种关系和资源,在自己的地盘上嫁接各种产品。
陈青山可能很多次被问到过,合合最后想2B还是2C?既做2C又做2B,是不是太贪心了?公司的产品线那么多,看起来乱乱的。人家是这么回答的,“合合的主线和基因就两个词,一个是AI、一个是大数据。”
题图:什么是人工智能?
文中图片,除伍尔德里奇的来自网络,其他都来自Pexel