从大数据到物联网,再到人工智能,一个个科技热词彰显着前沿技术与新兴技术产业发展的新姿态。
在如今每个人的家里面都能找到那么一两件AI产品,AI无处不在,充斥着我们生活的方方面面,AI技术的发展影响着各行各业的发展,也许你会疑问:AI取代了一部分繁琐、重复的工作,那么是不是也有许多人要面临着失业的风险?要知道未来的工作,一定会和AI结合起来,有些工作会被淘汰,有些工作不可取代,也有许多新工作会应用而生。比如在2020年2月,被纳入国家职业分类目录里面的“人工智能训练师”
他们的主要任务之一,就是进行数据的采集和标注,数据标注师的工作就是教会AI认识数据,像人一样去感知、去思考、进行决策和服务。
近年来,我们注意到数据标注行业发展非常迅速,创业公司层出不穷。作为人工智能基础底层的数据标注工作未来发展怎么样?
百度大数据百鸟河基地以大数据的清洗、加工、标注为主业务,直接带动1000人以上就业。
2020年7月26日,央视《新闻联播》“培育新业态 打开就业新空间”报道,百度(山西)人工智能基础数据产业基地(简称“百度山西数据标注基地”)宣布将培养5万名AI数据标注师,提供更多的相关就业岗位。
数据标注是一个成本敏感行业。市面上大部分数据标注需求较简单,诸如普通图像的拉框、声音的转录、文本的简单标注等,这些是人工智能起步的基础数据。同时,数据标注工作量很大。根据研究公司Cognilytica的报告,在大多数人工智能和机器学习项目中,数据准备和工程任务占据了80%以上的时间。
但作为初入数据标注行业的创业者来讲,你可能需要面临一下问题:
【1】需求不连贯而导致的断档
因为初创型公司/个人很多没有稳定的甲方,同时公司在同一时期对接的甲方数量并不是一定的,有可能在某个月中会有很多,同样也可能一个没有。这就导致了在数据的需求连贯性上并不是很强,出现青黄不接的现象。
【2】结款慢
数据标注行业对于标注有着高质量的要求,且不同的数据,标注的需求不一样。一个项目从启动到结算,要经过严格的质检审核,这些都会延长数据标注公司/个人的借款周期。
【3】上量难
数据标注不同于其他行业项目,是一个上手容易,上量难的工作,很多创业者会陷入只注重数量,不注重质量的误区,而导致总体效率低下,达不到甲方的要求,无法在指定的时间内完成指定的标注数量。
在这里,小编也给各位初入数据标注的小白们,一些标注建议和思考:
【1】平台
在自己没有稳定的甲方时,一定要选择和有保证的标注平台合,他们一方面有着成熟稳定的产品和合作对象,在产品需要进行迭代时有大量的数据标注需求;另一方面,大公司通常需要考虑保密、质量、工期等因素,在建立信任的前提下会确认正式的合作关系,因此数据标注单间也会高于其他外包平台。
【2】难度系数和人员能力
标注市场的共识:2D拉框<多边形拉框<点云拉框<语义分割<VR打标。一个成熟的标注公司每个项目都会有自己制定的负责人与参与者,在项目规则上给为清晰,且有自己成熟的质检团队,进行质量把关,能够快速进入,节省时间成本。
数据标注行业需要“专业”的市场逻辑,更需要有担当的甲方公司和标注团队共同维持行业的运行,标注公司生存没有你想象中的那么简单,小编也提醒想要进军数据标注行业的创业者们要慎重抉择,最好找一个好的平台,让自己有“大树”可依,无论是从项目争取,还是团队成长都需要一个老团队带领进入。