我们应该停止大肆宣传大数据技术人才的缺口,是时候开始讨论培训和招聘方案了。
专家是培训出来的,不是天生的。你需要回答的一个问题是,你是否需要专业技术知识或数据专业知识。专业技术知识能让SQL数据库或Hadoop集群投入使用。数据的专业知识可以使我们利用数据挖掘、文本挖掘、预测和机器学习技术。无论哪种方式,我们首先应该假设的是从现有的员工培育人才,是最首要也是最好的选择。
2012年的大数据和分析人事调查显示,大多数企业计划采取一个再培训、招聘和外包的组合方案,以填补人才缺口。但是,得到薪金上涨的批准、与新招聘的人一起工作、面试候选人,这些都是一个耗时的过程。更重要的是,专业人士大概有良好的能力,来处理你的业务、你的数据源以及你目前所做的分析,最有可能的是,分析得出你所希望从大数据和先进的分析得到的东西。
如果你缺乏的是技术专业知识,那么相信你现有的数据库管理员、数据库开发人员和数据仓库的技术人员,他们可以学习新的技巧。比如,从传统的数据库转移到大规模并行处理(MPP)数据库平台,对数据库管理人员(DBA)来说并不是一个巨大的飞跃,优秀的人才将很快适应这个挑战。
供应商总是有提供低成本的培训和资格认证这样的选择。例如,惠普刚刚宣布了围绕它的MPP-based HP Vertica Analytics Platform的课程模块和认证考试。其入门课程,将在世界各地的HP ExpertOne教室被教授,为期将超过三天。还有一个选择是虚拟的在线培训,将在四天内培训完。惠普公司的市场营销副总裁Chris Selland说:“它是有关如何设置软件并最有效地利用它的技术产品培训,它的受众很广,从数据库管理员(DBA)到数据科学家都可以。”
大数据主要是以其数据的种类多样以及巨大的容量见长,它主要在如Apache Hadoop和NoSQL数据库这样的新平台运行。Hadoop软件、支持和培训服务提供商MapR的首席执行官约翰·施罗德指出,在短短的五个月内,很多公司并没有把Hadoop集群投入生产的经验。他说:“现在我们将面临一个人才争夺战,因为手头的项目比工作人员还多,但同时我们也将看到,与2010年和2011年相比,Hadoop培训的人数也在大幅增长。”
MAPR和它的竞争对手Cloudera公司和Hortonworks,提供了大量的培训课程。在MAPR的这里,他们通常提供两到三日的MAPR学习视频,其在线和课堂课程主题包括群集管理的基储Hive和Pig动手操作、MapReduce培训以及HBase编程。Cloudera大学在全球范围内提供在线和课堂课程,而Hortonworks大学在各大中城市提供课堂课程,招募6个或者更多的参与者,地点选在公司的内部。
这些培训方案的前提假设是,培训人员属于能干的系统管理员和开发人员,可以迅速学习新技术,这些新技术与SQL和关系型数据库完全不同。在更先进的以数据分析为导向的课程中,如“数据科学的入门——构建推荐系统”(由Cloudera大学提供),其目标受众是“拥有基本的Hadoop的知识和水平的软件工程师、数据分析师和统计人员。
如果你的数据管理团队涉及的不是先进的数据挖掘,文本挖掘和预测分析等主题,你可以考虑他们参加这些顶级的分析硕士的学位课程之一。最短的培训课程可以在10个月内完成,但它是全日制的,对现有的雇员可能不合适,除非他们可以请假。另外还有非全日制和网校的课程,最短大约需要两年的培训时间。
开发硕士学位主要是为那些想参加培训的人提供资源,如果你急于填补人才空缺,你可以把这些课程看做招募的资源。参加硕士课程的优势是,大部分学生将有三年或三年以上的业务经验。大部分学校会很高兴地欢迎新的雇主来参与他们的招募计划,尤其是那些对新员工有稳定需求的大公司。
有些学校甚至与赞助公司合作,教授和研究生团队一起应对现实世界的商业挑战。北卡罗莱纳州立大学的高级分析研究所和麻省理工数字研究中心就是这样的情形。所以你也可以寻找开设有分析或大数据的学位课程的研究中心或研究所来一起合作。
底线是,我们除了怨天尤人或者聘用高价位的猎头帮忙以外,还有很多其他选择。如果你正在寻找的是高端人才,这个任务无疑是很困难的。不过在你发出“我找不到人才”这样的歇斯底里之前,确定好你的需求和培训的规模,然后和当地一所大学建立联系,或许你的问题就解决了。