本文从一则搞笑的大数据应用案例入手:某超市通过分析一位女顾客的购物数据(包括购物清单,浏览物品,咨询信息,视频监控信息<超市内徘徊区域>等),根据分析结果给该女顾客寄来了孕婴童试用品,这一举动让该女顾客的父亲非常生气,立马致电该超市投诉,因为她女儿还未成年!超市经理立马登门拜访道歉,不过事实是,不久后这位小女孩因遮盖不住隆起的腹部而不得不向父亲告知真相:她真的怀孕了。对于企业而言,大数据有时候就像是一个侦探家,能够拨开重重迷雾,找到问题的本质以及解决方案,而关键在于,你是否真的懂得如何去驾驭它,让它为你服务。
在经历了喊口号、布局深耕之后,大数据应用开始显现出巨大的商业价值,触角已延伸到零售、金融、教育、医疗、体育、制造、影视、政府等各行各业。随着中国企业数据中心数据存储量的快速增长,非结构化数据呈指数级增长,有效地处理和分析结构化数据和非结构化数据中所富含的对企业和政府有价值的信息将带动新的盈利模式、管理模式、创新模式以及思维模式。
在维克托·迈尔·舍恩伯格的《大数据时代》一书中解释,大数据是指不用随机分析法(抽样调查)这样的捷径,而采用所有数据的方法。随着云时代的来临,大数据也吸引了越来越多的关注。大数据是继云计算、物联网之后IT产业又一次颠覆性的技术变革,消费者的网络足迹是互联网基因 ,网络中的足迹、点击、浏览、留言直接反映消费者的性格、偏好、意愿等,互联网交互大数据就是研究每个用户碎片行为的过程。大数据对于经济发展、企业决策、组织和业务流程,对个人生活方式等都将产生巨大的影响。
大数据作为当下非常火爆的一个词,其价值不言而喻,今天,我们不谈价值,通过聚拢一些实实在在的应用,如电商,传统金融,互联网金融,医疗,制造五大领域的案例,进而衍射出大数据内在的应用逻辑。
“用户画像”直击零售商需求
在如此激烈而又庞大的市场中,电商们迫切想知道的想必就是用户需求。当这个用户登陆网站的瞬间,就能猜出来这个用户今天为何而来,然后从电商的商品库里面把合适的商品找出来并推荐给他,进而展现出符合客户需求的产品都有哪几款。这种服务是消费者想要的,但是谁能帮助电商们做到呢?
随着互联网和电子商务的快速发展,“用户画像”这个概念悄然而生,它抽象地描述了一个用户的信息全貌,是进行个性化推荐、精准营销、广告投放等应用的基矗
如某电子商务平台通过客户的网络浏览记录(点击、链接等)和购买记录等掌握客户的消费模式,从而分析并分类客户的消费相关特性如收入、家庭特征、购买习惯等,最终掌握客户特征,并基于这些特征判断其可能关注的产品与服务,从消费者进入网站开始,在列表页、单品页、购物车页等四个页面,部署了5种应用不同算法的推荐栏为其推荐感兴趣的商品,从提高商品曝光,促进交叉/向上销售连个角度对网站进行全面的优化,应用后商城提升下定订单转化率增长66.7%、下定商品转化率增长18%、推荐栏上线前后动销量增长46%。将消除个人信息后的数据魔方卖给商家,方便商家调整产品投放策略,提升服务,精准挽留客户,进而提高客户粘性。
还有,在互联网冲击下,大部分传统零售商必须要做改变,大数据下的用户思维便成为符合其需求的一种互联网思维方式和实际体验。那何为大数据体系下的用户思维呢?其实就是以“用户画像”最为核心和基础,通过线上、线下,交易、交互等各种结构化和非结构化的数据,让用户更加完整的展现在企业面前,该用户是谁?他在哪里?怎么联系到她?她需要什么产品?她通过哪些渠道购买?她得购买习惯是怎样的?……,在完整的用户画像面前,零售企业相对于面对“裸泳”的用户,用户需要什么,怎么获取,怎么营销一目了然,大数据时代的来临,让用户画像有了基础,用户画像的完善更让零售商有了连接线上和线下,用互联网方式进行商业运营的可能,传统零售商互联网运营管理的时代算也已悄然来临。
再比如沃尔玛和宝洁,一个是非常了解消费者在线下店里购买行为的传统连锁零售巨头,一个是掌握消费者偏好的品牌,他们从不同的角度去搜集消费者的数据。但这还远远不够,如果将这些数据和汽车生产制造商,乃至上下游企业共享一些数据,就会让这个链条中不同的企业对于数据、消费者有更深刻的洞察,从而通过多维数据来提高运营效率。
然而,随着大数据应用的发展,隐私保护的问题和概念也在不断地发展,网络用户在互联网的评论、图片、视频、个人信息、兴趣爱好、交易信息、访问的网站等等均被企业记录在案。企业掌握了大量消费者的行为数据,对大数据进行整合和分析,从而可以发现新的商机,创造新的价值。然而这些数据经常包含消费者的真实信息,如在淘宝网上交易时的真实姓名、家庭住址以及银行账号等重要的真实信息,逐渐引起了我们对个人隐私的担忧。正如美国著名的计算机专家迪博德所言,在信息时代,计算机内的每一个数据、每一个字节,都是构成一个隐私的血肉。信息加总和数据整合,对隐私的穿透力不仅仅是“1+1=2”的,很多时候,是大于 2 的。因此,针对隐私保护方面的问题,电子商务企业应该恪守行业道德,不能将消费者的个人信息进行交易和泄露,我们国家也应该尽快制定并完善与之相应的隐私保护的法律和法规,确实保护公民的隐私权。
客户价值最大化 破冰传统金融业
在大数据时代,越来越多的企业管理者已意识到了业务分析的重要性。业务分析洞察已经成为了企业转型的有利抓手。当然,银行也不例外,从以产品为中心,也就是销售产品和服务转向现在以客户为中心,更像零售业和制造商。对于以客户为中心的企业,最重要的一点是了解到客户到底是谁,以及客户到底有怎样的需求。
当下,银行业都在大力投入资金做着以下三件事:一是建立客户的单一视窗,将以前不同银行部门所了解的客户情况集成在一起;二是按照用户行为对用户进行分类,将之前按照地理区域、年龄、收入分类改为按照用户行为来对用户进行分类;三是为客户提供质量一致的客户体验,不管用户通过银行网点、移动设备还是社交媒体等渠道来使用银行服务,都要为客户提供质量一致的体验。
随着互联网,特别是移动互联网的不断发展,互联网金融也在给传统金融业带来不小的冲击,不过,互联网金融是否会对银行等传统机构构成威胁仍无法得出定论。但是,这并不表示银行业可以忽视这股冲击的浪潮,在这个大数据不断壮大的时代,传统金融业如何利用大数据来不断创新与变革,如何借助大数据降低金融风险,提升客户体验,进而挖掘客户价值最大化是每个企业都应该深入思考的问题。
如某金融全牌照集团公司希望学习美国花旗集团对已有客户价值挖掘最大化的经验,对现有保险客户进行深度分析,通过对已有客户的大数据分析及问卷调查来细分人群、刻画人群需求特征,从而制定针对不同客户群体的集保险、银行、投资、证券、资产管理、信托等一揽子综合金融产品策略,为客户提供一站式财务金融解决方案,以期得到每个客户最大价值。
在选用大数据解决方案后,通过分析已有保险客户数据及外部调研问卷,将人群细分为统计学上显著区别的人群;根据群体规模、年龄、性别、教育水平、家庭特征、现阶段的收入、消费、理财等行为模式以及他们所处的生命与财富阶段,精准分析群体的需求动因后制定有针对性的产品策略及营销策略。
但是,面对来势汹汹的互联网企业,传统金融业们也在加快步伐,但还是没有互联网企业动作快。目前,互联网金融业正从单纯的支付业务向转账汇款、跨境结算、小额信贷、现金管理、资产管理、供应链金融、基金和保险代销、信用卡还款等传统银行业务领域渗透。除了存款,银行的主要业务几乎已遇到全面挑战。互联网金融正在叫板传统金融,传统金融业又该何去何从?值得思考。
精准营销 加速互联网金融冲刺
在国外,大数据金融领域的应用相对成熟,我们先来回顾一下在美国做得非常典型的大数据金融的三大案例。
人们习惯性地认为,只有银行才能建立信用体系,然而在大数据时代,互联网公司运用大数据控制信贷风险已初露端倪。
在进行数据处理之前,对业务的理解、对数据的理解非常重要,这决定了要选取哪些数据源进行数据挖掘,而且越来越多的互联网在线动态大数据被添加进来。例如一个虚假的借款申请人信息就可以通过分析网络行为痕迹被识别出来,一个真实的互联网用户总会在网络上留下蛛丝马迹。对征信有用的数据的时效性也非常关键,通常被征信行业公认的有效的动态数据通常是从现在开始倒推24个月的数据。
通过多渠道获得的数据来源,利用数学运算和统计学的模型进行分析,从而评估出借款者的信用风险,典型的企业是美国的ZestFinance。这家企业的大部分员工是数据科学家,他们并不特别地依赖于信用担保行业,用大数据分析进行风险控制是ZestFinance的核心技术。他们的原始数据来源非常广泛。 他们的数据工厂的核心技术和机密是他们开发的10个基于学习机器的分析模型,对每位信贷申请人的超过1万条原始信息数据进行分析,并得出超过7万个可对其行为做出测量的指标,而这一过程在5秒钟内就能全部完成。事实上,在美国,征信公司或者大数据挖掘公司的产品不仅用于提供给相关企业用于降低金融信贷行业的风险,同时也用于帮助做决策判断和市场营销。
还有,利用社交网站的大数据进行网络借贷的典型是美国的Lending Club。Lending club于2007年5月24日在facebook上开张,通过在上面镶嵌的一款应用搭建借贷双方平台。利用社交网络关系数据和朋友之间的相互信任聚合人气。借款人被分为若干信用等级,但是却不必公布自己的信用历史。
还有 一家在美国为网上商家提供金融信贷服务的公司Kabbage,于2010年4月上线,主要目标客户是ebay、Amazon、PayPal等电商。它的奇特之处在于,其通过获取ebay等公司的网店店主的销售、信用记录、顾客流量、评论、商品价格和存货等信息,以及他们在Facebook和Twitter上与客户的互动信息,借助数据挖掘技术,把这些店主分成不同的风险等级,以此来确定提供贷款金额数量与贷款利率水平,风险过高则拒绝,风险高低与利率成正比,与贷款金额成反比。
显然,若以银行体系来评价这类网上商家大多数都不符合银行的贷款资格,不过在互联网时代,Kabbage的案例说明了运用大量数据足以支撑这些小微企业信用评价体系。当然,Kabbage的这种模式也在国内被成功运用,其中,宜信的互联网金融产品就是以互联网为获客主要渠道,除了借贷信用记录,还结合大数据分析技术,捕捉来自大众点评、豆瓣等社交网络上的有用信息,帮助信用审核人员多维度分析借款客户的信用状况。
大数据对于互联网金融的助推作用首要体现在寻找合适的目标用户,实现精准营销。互联网金融领域的新创企业或做贷款,或卖产品,凭借高额收益率,手续费优惠,吸引用户选择自己。然而,在越来越多同类企业吹响混战号角的同时,互联网金融企业也不得不面对来自同行业的竞争。欲在竞争激烈的市场中占有一席之地,互联网金融企业需要更精准地定位产品,并推送给自己的目标人群。谁是潜在的购买者?如何找到他们?并让他们产生兴趣?精准营销的实现程度是互联网金融企业存活与崛起的关键所在,这个领域虽然未达到成熟的发展状态,但确实已经有了一些有参考价值的营销案例。如:
大数据通过动态定向技术查看互联网用户近期浏览过的理财网站,搜索过的关键词,通过浏览数据建立用户模型,进行产品实时推荐的优化投放,直击用户所需。
其次就是风控。通过分析大量的网络交易及行为数据,可对用户进行信用评估,这些信用评估可以帮助互联网金融企业对用户的还款意愿及还款能力做出结论,继而为用户提供快速授信及现金分期服务。
事实上一个人或一个群体的信用好坏取决于诸多变量,如收入,资产,个性,习惯等,且呈动态变化状态。可以说数据在个人信用体系中体现为芝麻信用,它便于解决陌生人之间以及商业交易场景中最基本的身份可信性问题,以及帮助互联网金融产品和服务的提供者识别风险与危机。这些数据广泛来源于网上银行,电商网站,社交网络,招聘网,婚介网,公积金社保网站,交通运输网站,搜索引擎,最终聚合形成个人身份认证,工作及教育背景认证,软信息(包括消费习惯,兴趣爱好,影响力,社交网络)等维度的信息。
对于P2P网贷行业而言,能否利用互联网技术有效地搜集用户信息,并对用户的信用信息进行判定和管理,成为考量一家P2P网贷平台风控水平的重要标准。严密的风控手段是保证平台出借人的资金安全的重要环节,在风控技术手段创新探索方面,宜信宜人贷作为行业技术创新的代表,显然走得更快人一步。其已通过精确的风险建模,实现了对用户资质的高效审批,为用户提供更便捷的体验。它是基于对自身平台数万名借款用户的了解,同时借鉴宜信八年累积的对于用户的了解,从地域、年龄段、职业、等多维度对借款用户进行了划分,通过精确的风险模型建立,宜信宜人贷建立了一套独有的,行之有效的信用评估系统,通过对用户信息的多维度考察,能够快速对用户的信用资质进行评定,从而极大地提升服务效率。
如某P2P小额信贷机构如何使用个人及机构的外部数据建立自己的征信系统,在极其有限的客户实质接触基础上仅凭问卷数据、自有数据库等对不同客户进行信用评估,并结合内部业务数据建立风险定价系统、风险预警系统、风险管控方案、应对欺诈规则、惩罚方案等一系列影响核心业务盈利能力的系统方案。
通过采用大数据解决方案后,通过自建、购买、客户授权后合作分享等多种方式整合包括互联网社交网络数据在内的多种数据、建立个人及机构消费、借贷、财务交易、资金往来等多源信用数据库,在此基础上建立符合自身业务范围的客制化信用评估模型,根据此模型评估借、贷款双方的信用等级。通过建模确立如何匹配借贷双方,与具体业务相应的风险评级、授权等级、额度发放等级以及与此相应的风险价格等,并通过已有拖欠、欺诈案例反馈回模型进行机器识别,进一步完善模型。
未来,依托于互联网大数据技术的发展,相信将会出现更优质,更便捷的P2P网贷服务,来帮助更多有信用的借款人释放信用的价值,让信用生金。
但是,互联网金融在如此大好的机遇面前,自身也隐匿着一些绕不开的难题。一方面,其以新生事物野蛮式生长,带来便捷的同时,如何解决风控的问题,是当前互联网金融必须解决的一个问题;但是另一方面,也面临自身因监管缺失带来的风险。可见,互联网金融还有待于时间的磨练。
个性化数据 为医疗插上智慧的翅膀
凯文·凯利(KK)在《失控》的第22章,“预言机”里曾提到:信息就是数据,数据一旦流动,就创造出透明。社会一旦联网,就可以了解自己。所以,很多热衷于大数据概念的人,他知道哪里有数据,却没有办法去促成数据的流动。
所以,第一要义,数据如何才能形成流动?它的驱动力在哪里?以现在很热的医疗健康大数据为例,来探究数据是如何流动的?
维克托•迈尔-舍恩伯格的《大数据时代》一书中有两个关于大数据与公共卫生结合的案例令人印象深刻:
乔布斯自罹癌至离世长达8年之久,这几乎创造了胰腺癌历史上的奇迹。据悉,乔布斯曾在此期间支付大量费用获得了自己包括整个基因密码在内的数据文档。借此,医生们能基于乔的特定基因组成以及大数据按所需效果用药,并调整医疗方案。
如果上述案例是个体的,那么带来群体价值的案例,便是Google成功预测流感爆发期。2009年甲型H1N1流感爆发几周前,Google通过对人们网上搜索记录的观察、分析、建模,结果显示,他们的预测与官方数据的相关性高达97%,且判断比疾控中心更及时。
从个人健康管理到公共健康管理,大数据在对个人医疗的改变以及极富价值的预警能力吸引着IT巨头们迫不及待与医疗联姻。例如在中国,某慢性病管理远程医疗解决方案供应商计划外包商保的糖尿病远程管理业务,需要提供:人群的糖尿病管理方案包括接触、回应、问卷、回愧互动、宣教、指导、测试结果报告、产品销售等各个环节的方案设计以及人群配合度、依从性、短期及长期医疗效果、经济效果评估方案。远程医疗提供方方案中的的成本、经济效益回报会作为与商保、社保合作方案中的重要组成部分。
通过采用大数据解决方案后,利用既往研究、文献及历史数据中的结果为外包业务人群设计糖尿病病管理全流程数据分析方案,包括数据生成、采集、分析方案等,依据一定假设利用糖尿病决策树模型来逐层确定慢病管理各个环节中的成本及产出。应接触人群、反馈人群、互动人群、依从人群、效果人群、对比人群生成及最终的医疗效果、经济效果评估方案是本项目的关键。利用远程终端的客户反馈数据分析提高客户反愧依从、购买产品的策略,平衡成本与样本规模,提高供应商的投产比;使用统计学方法清楚论证及展示慢性病管理远程医疗解决方案的经济学价值,投入产出比。便利供应商开展与社保、商保的合作;提高供应商自身的投产比。
虽然我们谈了许多关于医疗行业大数据的价值和作用,但今天的大数据在医疗行业应用仍然处于初级应用的阶段,部分医疗机构仅使用了初级功能如BI等,要想让医疗行业把大数据发挥出最大的价值,需要解决以下几方面问题:
从技术角度来看,数据采集及标准问题。收集数据是大数据基础,但目前医疗机构采集数据的能力有限,阻碍了大数据的应用;从医疗经营角度来看,管理层缺乏数据价值认知问题。虽然目前医疗机构领导们对于数据的重视程度很高,但是范围仅仅局限于对于内部的数据认知,从总体来看,并没有意识到外部数据如互联网数据与内部数据的结合所产生的价值;从投入成本角度来看,现在大数据的投入产出比不明确。现在IT投资都需要讲ROI(投资回报率),由于医疗行业缺乏大数据的成熟案例,考虑到成本因素,企业决策者大都不都不敢随便在大数据领域砸钱;从产品角度来看,大数据产品单一,行业成熟度不够。
从以上问题我们可以看出,医疗行业开展大数据仍然有一段路要走,不过面对所存在的问题,未来随着技术的推进、意识的提高、成本的下降以及相关政策的成熟,相信用不了几年时间就可以逐步解决问题,未来,大数据必然能够为医疗行业提供更好的服务。
数据分析模型 让制造业焕然一新
工业4.0时代正扑面而来。这是继以蒸汽机、大规模流水线生产和电气自动化为标志的前三次工业革命之后的第四次工业革命。其特点是通过充分利用嵌入式控制系统,即物理信息融合系统(其中大数据扮演主角),实现制造业向智能化转型。
20年沧桑巨变,今天中国已是全球制造业大国。来自中国工业与信息化部的统计数据显示,2013年中国工业占GDP的37%,提供全国25%的就业岗位。在500余种工业产品中,有220多种产量居世界第一。中国制造业在全球的占比约为20%。然而,中国制造业面对云蒸霞蔚的移动互联网和大数据景观却有些不知所措,若不赶紧扭转局面,有可能逐渐丧失制造业大国的地位。大而不强是我们的软肋,大多数中国工厂依然龟缩在产业链低端,缺少制造的核心材料、设备、工艺,停留在近乎原始的OEM(贴牌代工)阶段,缺乏原创技术和创新产品。不过,凭借庞大的内需市场支撑,中国制造的优势尚存,13亿人口积累的消费数据十分可观。因此,如果能在大数据挖掘和分析上下点功夫,中国制造业还能保持较强的竞争力。
在中国制造业依托大数据打翻身仗的阵营中,小米可谓特立独行的领头羊。2010年成立的小米公司是中国制造业企业的成功典范,其主打产品小米手机已蜚声海外,被业内视作苹果、三星的潜在威胁。小米超越同行的业绩,缘于其用包括软件、硬件和应用生态的整体方法,小米在创造全新用户体验的同时,高擎大数据的旗帜,颠覆了中国制造业公司的传统做法。有了这样的底气,小米董事长雷军才敢与传统制造业的空调玫瑰—格力掌门人董明珠立下10亿元的对赌承诺。
那么,大数据是如何帮助研发人员提高新药研发效率的呢?相关专业人士认为:首先,由于药物的生物过程和药物模型越来越复杂,大数据可以通过利用分子和临床数据,预测建模来帮助识别那些具有很高可能性被成功开发为药物的安全有效的潜力备选新分子。其次,利用大数据可以帮助提升临床试验的效率。例如筛选临床试验受试者的筛选标准通过大数据,可以瞄准特定人群,这样临床试验就可以规模更孝时间更短、成本更低,更加有效。同时可以通过大数据分析来实时监控临床试验,及早发现可能出现的问题,避免试验过程中成本增加或出现不必要的延误。第三,相对于原来僵化的数据孤岛,使用大数据可以帮助数据在不同功能单元之间顺畅流动。通过打破内部各功能之间的信息壁垒并提升跟外部合作伙伴的协作,制药公司可以大幅扩展他们的知识和数据网络,如与外部合作伙伴——医生和CRO共享关键数据。数据的这种顺畅流动,对能创造商业价值的实时预测性数据进行分析非常关键。
此外,为确保合理分配稀缺的研发资金,项目组合与产品线相关的快速决策至关重要。但制药企业经常发现,他们很难做出适当的决定。比如哪个项目该继续,或者有时更重要的是,哪个项目该砍掉。基于信息技术的项目组合管理能快速无缝地实现数据驱动的决策。通过数据分析当前项目的商业开发机会,预测其市场竞争力,帮助企业客观地做出决定,以确保研发投入的合理性。
虽然大数据可以有效地帮助研发人员提升新药研发效率,但目前大数据技术还有一些方面需要改进。牛津大学统计学教授彼得·多纳利指出,目前大数据技术面临的问题有三:首先,信息采集不足。大数据要发挥作用,首先要有足够的病人、药物等相关信息,这是数据分析的基础,然而许多病人可能出于隐私考虑不愿提供这些信息,制药企业也有可能因为商业利益不愿共享药物成分等敏感信息,这就直接导致信息采集不足。
其次,要从海量信息中得出有用的结论,专业的数据分析必不可少,采集到足够信息后,需要由相关领域的专业人士与信息技术专家一起对数据进行有针对性的归纳和分析,而这种跨学科、跨领域合作能否顺利实现,是大数据技术实际应用中的重要问题,而且正考验着制药企业的大数据整合能力。
第三,在技术层面还存在网络容量有限的问题。很多新药研发机构现有的基础设施无法满足海量信息分析和处理的需求,因此如何降低存储成本,以及提升应用价值就成为大数据所面临的关键技术难题。
虽然尚待完善,但毫无疑问的是,大数据在新药研发中必将发挥越来越大的作用。
结语
从目前来看,大数据的应用范围正在持续扩大,大数据的触角正逐渐深入到各个领域,同时也是明天我们治理交通拥堵、雾霾天气、看病难、食品安全等“城市病”的利器,也会为政府打开了解社情民意的更大窗口。
我们现在看这个世界,比如分析家中食品腐烂,主要就是依赖于我们的眼睛再加上我们的经验,但如果我们有一台显微镜,我们一下就看到坏细菌,那么分析起来完全就不一样了。大数据就是我们的显微镜,它可以让我们从全新视角来发现新的商业机会,并可能重构商业模型。我们的产品设计可能不一样了,很多事情不用猜了,客户的习惯和偏好一目了然,我们的设计就能轻易命中客户的心窝;我们的营销也完全不同了,我们知道客户喜欢什么、讨厌什么,更有针对性。特别是显微镜再加上广角镜,我们就有更多全新的视野了。这个广角镜就是跨行业的数据流动,使我们过去看不到的东西都能看到了。所以,最终大数据一定是跨行业流动的。
然而,我们也应该清楚的知道大数据在应用过程中尚存在很多问题:各政府、各行业间不公开和分享数据,造成数据之间的割裂,无法产生数据的深度价值和综合价值;很多应用系统涉及公民财产及隐私甚至国家安全,信息安全问题成为大数据应用重要难题;大数据市场尚未形成有效的评价、资格认证和准入机制等。当然,最重要的还是有赖于行业对于大数据时代到来的认识,警惕和应对。