海天瑞声品牌再升级,助力中国AI开向水深处

企业新闻1年前 (2023)发布 aixure
72 0 0
导读:从目前来看,数据服务市场主要由一些中小型的品牌服务商和一些客户自建团队构成。未来,在大模型时代下,整个数据服务市场将迎来一次重新洗牌,集中度也将进一步提升。市场上各类主体将会通过技术研发和资源建设等方面进行竞争。与此同时,国家对于数据安全…

“从目前来看,数据服务市场主要由一些中小型的品牌服务商和一些客户自建团队构成。未来,在大模型时代下,整个数据服务市场将迎来一次重新洗牌,集中度也将进一步提升。市场上各类主体将会通过技术研发和资源建设等方面进行竞争。与此同时,国家对于数据安全与合规的要求也在不断提高。因此,那些研发能力弱、资源实力差,以及不具备数据安全与合规能力的数据服务商,将会被市场逐步淘汰。”谈及数据服务市场在大模型时代下的发展趋势,海天瑞声CEO王晓东如是说。

作为一家AI训练数据专业提供商,海天瑞声于2005年正式成立,并始终致力于为AI产业链上的各类机构提供AI算法模型开发训练所需的专业数据集。起初,该公司主要提供海量优质的智能语音数据,随着人工智能技术的不断发展,业务范围也在逐渐扩大,目前已经实现了语音、自然语言处理、多模态的数据解决方案等数据集的全覆盖,未来还将涉足“AI+”领域,支持以数据驱动的生成式AI业务发展。

目前,该公司的产品和服务已经广泛应用于人机交互、智能驾驶、机器翻译等多种应用场景,并获得了阿里巴巴、腾讯、亚马逊、三星等国内外客户的一致认可。2021年8月,海天瑞声在科创板上市。

宣布品牌焕新与升级,发力以自动驾驶为代表的全新战略布局

“此次品牌升级不仅是一个简单的改名,它还代表着海天瑞声将在数据科技和人工智能领域的进一步发展和探索。”在5月26日上午举办的2023中关村论坛的平行论坛之一人工智能开放生态建设分论坛上,王晓东出席并隆重宣布了海天瑞声企业品牌焕新战略。

据悉,该公司将英文名称从“SpeechOcean”改为“DataOcean AI”,中文名称“海天瑞声”保持不变,并启用全新Logo。

图丨海天瑞声新Logo(来源:资料图)

从新品牌名中的“Data”即可看出,海天瑞声的业务范围已经不再局限于语音,而是向更为广阔的数据海洋扩展;与此同时,品牌中的“AI”也表明了该公司作为一家人工智能企业的定位。

“我们坚信,通过‘Data Ocean AI’这个全新品牌,我们将能够更好地服务客户、应对挑战,并迎接未来的机遇。”王晓东表示。

品牌的焕新与升级,也象征着海天瑞声的具体战略布局。目前,其已经在自动驾驶赛道上持续发力,试图通过建设平台、算法研发和数据安全能力,来进一步提高公司的核心竞争力。

今年4月,其推出了专为自动驾驶场景设计的全栈式数据平台“DOTS-AD自动驾驶平台”。该平台能够支持多维度、全方位的自动驾驶标注任务,数据标注效率提升高达8倍,不仅能够保证万人同时作业,还能够解决标注员的使用痛点,提升标注效能。

据介绍,该平台的客户主要有四类,分别是车企、为车企提供整体解决方案的车厂一级供应商、造车新势力和自动驾驶算法公司。

事实上,聚焦自动驾驶行业只是海天瑞声的一个发展方向。基于专研基础数据的多年积累和品牌升级,该公司也提出了“AI+”的发展理念,并认为人工智能的未来,终将一定为人类服务。因此,其希望能够通过AI与行业的结合,向更多的领域深入,比如,发展AI+能源、AI+医疗等,让AI能够真正地改变人们的生活,并给人们带来美好的未来。

开源开放多模态数据集,将数据安全与合规作为立身之本

在本届人工智能开放生态建设论坛上,王晓东还发表了题为《共享开放数据助力数字中国建设》的演讲,并宣布开源开放涵盖图像、语音、文本等多个维度的多模态数据集「DOTS-MM-0526」,助力AI开放生态构建。

对于AI来说,包括算法优化、模型训练等在内的工作,都离不开高质量专业数据集的支撑。开源数据集能够为各领域的开发者和研究者提供更多高质量数据样本,帮助他们更好地进行算法开发和模型训练,进而提高算法和模型的准确性和稳健性。海天瑞声希望通过开源更多的专业数据,为中国人工智能行业的发展贡献自己的一份绵薄之力。

作为一家提供数据服务的企业,数据安全与合规自然是其发展底线和立身之本。为了充分保障数据使用过程的合法合规,海天瑞声组建了专门的团队,对全球范围内数据方面的法规法规进行了深刻的研究,并制定了高于国家法律的数据合规要求。公司所有成员在进行包括数据采集、标注等在内的一系列工作之前,都必须严格遵守当地的法律法规。

ChatGPT、GPT-4等大模型的发布,加速了大模型时代的到来。那么,如今在对大模型进行训练的过程中,与数据相关的工作又是否存在变化呢?

对此,海天瑞声CEO黄宇凯认为,从整体上看并没有什么不同,只是不同企业关注的侧重点不一样。比如,在大模型预训练和强化学习阶段,对数据各方面的要求变得很高,从业人员应该掌握数据清洗、提示词撰写等基础能力。此外,开发相应的数据平台,使其能够完成生成数据、质检数据等工作同样非常关键。

另据悉,作为中国面向全球科技创新交流合作的国家级平台,本届中关村论坛以“开放合作共享未来”为主题,设置了六大板块,共举办150余场活动。其中,主要围绕人工智能、生命科学、量子信息等前沿领域开设55场平行论坛。论坛上,王晓东还表示,将坚持以“做智能世界的数据基石”为使命,积极与各方共同推动人工智能技术的发展和应用,促进企业数字化、智能化进程的加速推进,为建设数字经济和智能社会做出贡献。

赞助本站

© 版权声明

相关文章

暂无评论

暂无评论...