机器之心发布
机器之心编辑部
初创公司格物钛希望通过在公开数据集社区和数据管理工具领域的创新,从而推动数据定义软时代这一新时代背景下的全球创新,破局数据孤岛,赋能AI基础设施建设。
数据定义软件时代到来
回顾互联网发展历史,过去 30 年是开源软件生产数据的时代,这个时代诞生了 Google、Facebook、阿里、腾讯和字节跳动这样的互联网巨头,他们都在用软件生产海量的数据。但是不难发现这一趋势从近几年开始悄然发生了变化,实际上前 30 年的数字化变革已经产生了大量用于算法训练的非结构化数据,如何存储、管理以及利用现有的数据来完成更加高效的算法迭代和应用开发才是 AI 开发者在未来 30 年需要面对和解决的课题。伴随着 Snowflake 这样的数据处理软件公司进入了人们的视野,我们看到数据定义软件的时代已经到来。而初创公司格物钛希望通过在公开数据集社区和数据管理工具领域的创新来推动这一新时代背景下的全球创新。
破局「数据孤岛」成为关键
高质量的数据是支持 AI 算法的基矗以往数据大多以孤岛的形式存在,数据之间却并没有产生连接。不同企业、机构之间的数据标准规范并不统一,数据质量也参差不齐,就算进行共享也依然困难重重。伴随着各类 AI 应用场景落地的技术难点逐渐浮出水面,以无人驾驶领域为例,许多驾驶场景具有稀缺性,仅凭一家之力构建包含所有的交通场景的数据集将消耗巨额的数据采集成本,并且很难在短时间内一步到位,AI 企业认识到打破数据孤岛走向合作开放将是未来谋求发展的必然选择。
近年来行业中不少企业和高校研究机构已经陆续发布公开数据集,将自身积累的优质、庞大数据公开出来,为认知层、感知层的 AI 技术提供学习驱动,把更多的数据、算力、技术汇集在一起,帮助各领域的数据释放出其应有价值,为人工智能的产业化落地提供关键基矗
格物钛公开数据集平台
以开源数据集平台赋能 AI 基础设施建设
随着行业参与者们对数据的态度越来越开放,很多公开数据集应运而生。但是由于缺乏统一的行业规范与标准,用户搜索下载和使用这些公开数据集存在诸多困难。格物钛看到这一行业痛点后随即发起了 “寻集令” 项目的号召,希望发挥自己在数据管理上的技术优势,建立 AI 公开数据集平台。招募自动驾驶、互联网泛娱乐、新零售、智慧城市和在线教育等多领域的合作伙伴加入,打造最受开发者欢迎的公开数据集社区,为企业、机构和个人提供高质量的真值数据、推动人工智能行业场景落地。
格物钛公开数据集平台自去年九月份上线以来,用户数实现了 13 倍的爆发式增长。目前已有涵盖 8 个领域的 16 家企业与我们达成了战略合作,他们将会在格物钛公开数据集平台上开源自有的数据,赋能 AI,加速人工智能行业的快速落地和科研创新。
格物钛 CEO 崔运凯表示:“寻集令是一个永远不会终止的倡议。如果你是一个企业的决策者,如果你有大量的数据,还不知道如何发掘它的价值,或者还想探寻如何更好使用它们的创意,也许是时候开放它们其中的一小部分,给这个社区中的创新者们,让他们运用他们的智慧,来发现这其中无限的价值。这个价值被发现的过程,往往带来的是双赢。社区的力量是强大的,Graviti 希望今天的分享和倡议,可以激励你参与到我们的行动中来,因为只有我们携起手来,才能一起定义未来。” Graviti 公开数据集平台下一阶段还将持续投入研发,为人工智能企业和各类学术研究机构提供专业的一站式公开数据集发布及运营支持,同时完善社区功能为用户提供问题与需求的反馈渠道,有效解决用户提出的各类数据集需求。未来格物钛也希望可以携手更多 AI 生态的各类伙伴,一起用心去开源,建设人工智能数据领域的高地。
寻集令全球合作伙伴一览
THE END
转载请联系本公众号获得授权