不懂AI的我，是如何搞开发的？

AI2年前 (2023)发布 aixure

80 0 0

导读：金磊发自凹非寺量子位报道 | 公众号 QbitAI 高达86%，这就是目前市场对「定制开发AI模型」需求的占比。但在这个过程中，企业用户和开发者往往存在着以下诸多问题：缺少模型训练经验数据采集和标注成本较高模型适配与部署流程非常繁琐模型优化迭代周…

金磊发自凹非寺

量子位报道 | 公众号 QbitAI

高达86%，这就是目前市场对「定制开发AI模型」需求的占比。

但在这个过程中，企业用户和开发者往往存在着以下诸多问题：

缺少模型训练经验

数据采集和标注成本较高

模型适配与部署流程非常繁琐

模型优化迭代周期长

那么，是否存在一种工具，能够「一站式解决」上述问题呢？

百度EasyDL了解一下。

简单来说，EasyDL极大降低了深度学习的应用门槛：

把AI开发这件事情，搞得像使用「家用电器」一样简单。而且训练产出的AI模型质量，如同高级工程师产出的一样专业。

但其实，百度早在2017年底便推出了EasyDL，2018年初正式开放，与此同时提出了一个愿景Everyone can AI。

那么时隔近三年，这一愿景走到了哪一步呢？

像用家电一样的AI，能有多靠谱？

先来整体看下EasyDL所具有的三大特点：

极简的交互和使用流程，最快15分钟即可完成模型训练；

高精度的训练效果，比如图像分类模型的线上平均准确率在99%以上；

部署方式丰富，全面支持云、端、边部署。

首先是EasyDL的易用性、低门槛。

使用流程只有简单的四步，分别是「创建模型」、「准备数据」、「训练模型」和「部署应用」。

并且，在整个过程当中，都是可视化图形操作，这就大大降低了企业、开发人员的使用门槛。

用百度AI平台研发部技术总监忻舟的话来说就是：

不用一行代码也可以基于需求和数据，定制自己的AI解决方案。

在工业制造的生产质检领域，以「爱包花饰」为例，在监测箱包生产过程中的残留异物（针、金属零部件等）时，使用EasyDL训练箱包质检模型，在完全无需了解AI算法细节前提下，也训练出了准确率90%的模型。

再以「瀚才猎头」为例，几名人力资源专家在不了解AI算法的情况下，使用EasyDL，完成了简历数据的结构化处理和自动分类模型，大大提升了工作人员在简历检索方面的效率。

但简单，并不意味着会忽略掉专业性。相反，二者是「兼容且并行」。

依旧是「瀚才猎头」的案例，作为一家高级管理人员代理招募机构，其储备了200万条不同行业的企业和人才信息。

但一个非常「致命」的问题就是：200万条数据因简历检索的低下，使人才库的利用率不足10%。

而在使用EasyDL之后训练多个模型推进简历数据的结构化处理，仅在「候选人职能」和「候选人职级」两个模型上的识别率便达到了95%以上。

而以关键词搜索的任务中，瀚才猎头以往每天只能找到60-70份合适的简历。但现如今，20分钟就可能达到600-1000份，而且精准度达到了95%。

一言蔽之，百度EasyDL不仅让企业在「定制AI模型」上，使用起来像家用电器一般简单，并且还能像高级AI工程师一样专业。

除此之外，EasyDL还支持公有云API、私有服务器部署、设备端SDK、软硬一体方案等丰富的模型部署方式。

例如在软硬一体方案部署上，EasyDL提供了6款软硬一体方案，支持专项适配与加速，覆盖高中低全矩阵，模型识别速度可提升10倍。

不仅丰富，还非常快最快仅5分钟即可集成。

而EasyDL这一切的优异特性，离不开其背后的技术硬实力。

EasyDL的能力是如何实现的？

表面上看起来、用起来越是简单的工具、平台，那它背后的设计可能越是复杂。

百度EasyDL也是如此。

平台内部采用了诸多复杂的深度学习算法和工程技术，而这一切，都是为了保证其简单、易用、低门槛的使用效果。

EasyDL之所以能够在模型方面达到高精度，一个重要原因是其基于百度自主研发的深度学习平台飞桨。一站式模型训练和服务体验，则融入了更多百度长期积累的独有技术和工程化能力。

首先，EasyDL预置了百度超大规模数据训练的预训练模型。

在视觉任务中，图像分类训练任务内置百度基于海量互联网数据，包括10万+分类、6500万图片等训练的超大规模视觉预训练模型，平均精度可提升3.24%-7.73%。

在物体检测训练任务方面，内置百度基于800+标签、170万图片，1000万+检测框训练的超大规模物体检测预训练模型，平均精度可提升1.78%-4.53%。

在自然语言处理方面，EasyDL预置了由百度自研、业界效果最好的预训练模型文心（ERNIE），将机器语义理解水平提升到一个新的高度。

EasyDL还提供了自动数据增强、自动超参搜索等AutoML/DL自动化建模机制，对零算法基础的用户降低AI使用门槛。

而且基于飞桨DGC加速机制，通过只传送重要梯度（稀疏更新）的方式来减少通信带宽使用，从而让EasyDL提升了分布式训练效率，相比传统分布式训练方式，有70%以上的训练速度增益。

其次，在数据处理方面，EasyDL建设了EasyData智能数据服务平台。

在数据标注和数据清洗，EasyData提供了11种数据标注模板，5种标准、高级的清洗方案。

EasyData还提供了软硬一体、端云协同的自动数据采集方案，可以在数据采集时，免除繁琐耗时的设备选型、调试和集成开发工作。

最后，在部署部署方面，EasyDL提供了公有云API、设备端SDK、本地服务器部署、软硬一体部署四种方案。

其中，公有云API可以支持弹性扩缩容；设备端SDK目前EasyDL提供了端模型适配服务，支持了15+芯片类型，4大常用操作系统。

而这些，正是EasyDL强大能力的背后硬实力。

Why EasyDL？

因为有需求，这就是问题的答案。

人工智能引领的第四次工业革命正不断地渗透到各行各业，大企业往往具备了一定的人才储备、技术积累。

但相比之下，中小企业在智能转型的过程中，往往处于碰壁的状态，智能化门槛过高，包括高级开发人员成本、技术能力等等。

而中小企业在整个国民经济的发展过程中，却起着举足轻重的作用。

因此，解决这样的问题，便成为了一种「刚需」。

也正是因为这样，EasyDL一经开放，便得到了中小企业的广泛认可和支持。

而在2年多的时间里，EasyDL也一直在持续升级和打磨，使整体的产品体验和功能更加完善。

这也是让EasyDL与其它AutoDL平台相比，具有较为突出的优势，能够获得更好的效果。

不仅如此，EasyDL的更新迭代还在继续。

例如，今年升级的最大亮点，就是五月份全新发布了EasyData智能数据服务平台。

专注在AI开发场景在业内开放了提供一站式的数据采集、数据清洗、数据标注、数据回流的完整解决方案。

内置的超大规模预训练模型也是今年核心的技术亮点升级之一，为提供更高精度的训练效果。

而就在刚刚过去的9月，我们看到EasyDL又进行了一轮大幅升级。

在EasyDL经典版NLP方向新增了定制情感倾向分析、文本分类多标签、文本实体抽取；全新推出表格数据预测分析的ML方向，进一步丰富了模型类型。

数据服务上在已有的智能标注基础上重磅推出多人标注，让数据标注的效率进一步大幅提升。

全新上线模型市场，支持个人或企业将EasyDL经典版训练好的模型发布至市场进行售卖，并在业内首个创新性支持从市场已购买的模型结合数据进行再训练，实现更佳的模型效果。

未来，EasyDL还将继续发力：

除了扩展已有的 CV、NLP、ML、语音识别方向算法类型，还将推出OCR、视频追踪等定制化能力。

持续提升模型效果，提高训练速度，加速模型推理。

在数据、模型、服务等各个方面，持续降低使用门槛。

至此，可以说百度EasyDL离最初的「Everyone can AI」的愿景更加近了一步。

# AI

文章版权归作者所有，未经允许请勿转载。

纽约市开始对招聘工具中使用的AI技术进行监管

aixure

谷歌发布自家专为人工智能打造的Tensor处理器

aixure

腾讯同传圆满服务CSS安全峰会展现高效准确的AI同传服务

aixure

AI来袭：这一次，我们还能保住自己的饭碗吗

aixure

2021年人工智能数据采集标注行业四大趋势预测

aixure

人工智能进厨房：小度方太联合打造智能生活

aixure

暂无评论

暂无评论...

不懂AI的我，是如何搞开发的？

科大讯飞：人工智能与大数据的结合面临着前所未有的机遇

当人工智能和宠物狗发生碰撞，会出现什么？

相关文章

暂无评论

相关文章