互联网与现代通信已经把一种新资源推到人类面前,这种资源就是大数据。大数据来自无所不在的IT设施,IT普及使得人人都成为数据制造者,短信、微博、照片、录像都是其数据产品;数据来自无数自动化传感器、自动记录设施,生产监测、环境监测、交通监测、安防监测等等;来自自动流程记录,刷卡机、收款机、ETC、互联网点击、电话拨号等设施以及各种办事流程登记等。大量自动或人工产生的数据通过互联网聚集到特定地点,如电信运营商、互联网运营商、政府、银行、商尝企业、交通枢纽等机构,形成了大数据之海。大数据时代已经来临。
大数据能够成为可用的资源得益于大数据处理技术的出现。计算机历史前五十年主要是利用人们专门收集的数据,这些资料被视为资源,而现在计算机开始关注工作流程中顺带积累的超大规模数据,无处不在的信息设施不停地记录了人们行为的信息痕迹,利用大数据技术能够分析这些信息痕迹,从中提取重要信息以减少对环境认识的不确定性,提高工作与生产效率。大数据已成为新时期人类可开发利用的重要资源,以美国为代表的发达国家已经开始把大数据的利用与大数据技术的开发视为国家一项战略性任务。
如何看待大数据热?
学术界、IT厂商、IT媒体对新名词反应极快,大数据迅速成为继物联网、云计算、智慧城市之后的新热点,人们呼吁要建立大数据技术开发中心、大数据产业发展中心,强调要尽快抢占大数据这一战略制高点,一些地方政府已开始制定捷足先登计划。一些专家对此持不同意见,认为大数据并非新概念,海量数据处理早已有之,大数据只是IT厂商的推销策略,没有必要盲目跟进,不必听风就是雨。
本文认为技术的突破与应用市场的成熟是两个阶段,大数据概念拓展了我们的视野,大数据的确是一种重要的新资源。技术眼光超前是有益的,对大数据资源可用性的探讨有助于发现新机会、提升业务创新能力。对大数据应用市场的估计不能激进,有规模的应用不仅需要成熟的技术还需要成熟的配套环境,大数据不是人人可用的大众品,对大多数机构而言它仍是一种奢侈品。
应用要先行,投资需慎重
从产业发展的角度看,大规模投资需慎重,不可掀起大数据投资热,应用与产业不同,应用是不竞争的,谁都可以去用,互不干扰,但产业是竞争的,技术制高点的竞争更为激烈,甲地区能想到战略,乙地区也同样想得到,凭什么就你能占据制高点呢?信息技术的制高点不是“不差钱、早下手”就能搞定的。技术制高点有自己的成长规律,它是特定生态环境的产物,在这里机制比钱更重要。技术的发展依赖于密集的应用环境,密集的应用需求推动着技术前进。谷歌、亚马逊、IBM成为云计算的带头人是因为自身就存在着巨大的应用需求,需求推动技术,技术拉动需求,技术与需求的紧密结合共同发展。
信息产业发展经验表明,技术的引进很容易,只要投钱就行了,但要创建能够引领技术的产业集群却极不容易,即使政府投入大笔资金开发也很难做到,因为应用的中心不在这里,没有足够肥沃的土壤无法生长出参天大树。对于IT产业的关键技术政府曾投入大量资金去攻关,但效果并不大,因为无法创造出大规模的应用环境。现实合理的做法是:寻找国内应用密集的领域,集中开发该领域的专用技术,提升局部性的竞争力,再逐步扩大发展。技术与产业的发展更需要应用导向,从应用中发现机会,顺势发展应用技术,提升竞争力。