在人工智能这件事儿上,百度缺的可不只是专利而已

AI1年前 (2023)发布 aixure
64 0 0
导读:今年7月1日,在戛纳国际创意节上,百度公司展出的一款名为百度筷搜的电子产品获得了技术创新金奖。这款筷子可以检测地沟油、饮用水酸碱度等信息,还可以把这些信息现实到智能手机上。这则获奖的喜讯让百度公司在一定程度上摆脱了不久前作弊风波的负面影响,…

今年7月1日,在戛纳国际创意节上,百度公司展出的一款名为“百度筷搜”的电子产品获得了技术创新金奖。这款筷子可以检测地沟油、饮用水酸碱度等信息,还可以把这些信息现实到智能手机上。这则获奖的喜讯让百度公司在一定程度上摆脱了不久前“作弊风波”的负面影响,但同时也突显了百度在某些核心领域的技术不足。

图片分析:百度筷搜的关键缺失

专利是高科技产品的先声。最早,百度筷搜是作为2014年的愚人节玩笑被提出来的,但这个概念随后却堂而皇之地出现在正式的专利文献中。根据PatSnap提供的数据,仅2014年9月3日当天,百度公司就提交了7件“智能筷子”的相关专利。在专利中,百度筷搜通过不同类型的传感器分别检测食物的盐度、糖度、PH值、油质、温度等信号,为用户提供食品安全方面的信息。

无独有偶。美国的Medibotics公司早在2012年就在美国提交了类似餐具的专利申请。在它的专利中,餐具通过摄像头获取食品的图像,然后借助图像分析技术获得食物的种类、质量和热量,从而实现控制热量摄入的作用。产品方案中的摄像头最初是佩带在手腕上,但在2013年底,摄像头(下图元件502)被集成到餐具上。

与百度的筷搜相比,Medibotics方案中的图像识别功能不但是个更好的技术补充,而且更符合产品设计的发展方向。既然如此,百度公司为什么没有在筷搜中加入图像识别功能呢?是百度公司还没有意识到类似功能的重要性吗?

图像识别:百度布局的明日之星

专利信息显示,百度公司并没有那么麻木。百度在图像识别技术的研发和应用上做了非常大的努力,这可以从近年来成倍增长的专利申请量中找到证据:在2012年,百度在相关领域的专利申请还不足10件,但2014年的申请量已经接近100件。这些技术涉及软件、硬件、服务等诸多方面的广泛应用。

在搜索领域,图像技术可以让百度用户获得更具个性化的使用体验。这个构想在2014年公开的一件美国专利申请中做了说明。在这件专利中,百度支持用户拍照获取当前场景的照片,并基于对照片的理解提供有针对性的信息。如当用户在某一火车站时,百度可以分析该火车站场景的照片,然后在其用户设备的屏幕上相应地显示他希望了解的关于该火车站的相关信息,如车次信息、或者其他用户分享的该火车站的注意事项信息。

可穿戴设备是百度关注的另一个市场,在这个市场,百度的老对手谷歌公司已经推出了智能眼镜。近两年来,百度公司也已经有30件头戴式设备的专利获得公开。这些专利产品的架构大致相同,都是利用摄像头(下图元件4)采集目标物的图像,然后通过云端服务器对图像进行识别,再从互联网上获取目标物的价格、介绍、评价等详细信息。这些信息可以通过语音提示或红外投影的方式告诉佩带者。

除了以上这些例子之外,百度的最新专利还批露了图像识别技术在诸如智能家居、护理机器人等领域的应用。随着更多新专利的公开,百度公司以图像识别为基础的产业布局也将会逐渐完整清晰地浮出水面来。

技术是百度在人工智能上的最大软肋

图像识别技术是人工智能中最重要的部分,其重要程度甚至超过语音识别。因为语言仅仅是智能体之间进行交互所使用的工具,而一旦具有了图像分析的能力,智能体就可以自动识别物体并就物体的类型达成共识,这样就可以脱离语言的限制而实现彼此之间的自由对话。在如此重要的领域,百度的技术实力如何呢?我们可以实测一下百度和谷歌的产品效果。

百度和谷歌都提供“图片检索”功能。在这个功能中,用户首先上传一张本地图片,之后搜索引擎通过图片分析而得出一个描述图像内容的标签词,并基于图片和标签词来提供最相关的网页和图片。我们的测试用例是欧洲专利局的宣传册照片,下面的图中是百度和Google的检索结果页面的截屏显示。

在这次测试中,谷歌准确地识别出图片内容跟“欧洲专利局”有关,并在检索结果中给出了EPO的官方链接。百度则没有那么成功,它不但没有识别出欧洲专利局的标志,也没能识别出图片中的显著的文字内容。它似乎是被图片中对比鲜明的颜色所欺骗,认为这张图片中拍到的是一条“变色龙”或者一块“装帧布”。

很显然,这样的技术实力还不足以支撑百度在产业上的雄心。

百度的愿望:树立声望和技术突破

实力与雄心之间的差距造就了危机感,而危机感的驱使或许可以解释百度在ImageNet图像识别测试中的作弊行为。

2015年5月中旬,百度称在ImageNet的图像识别测试挑战赛中击败了谷歌和微软;6月2日,ImageNet发表声明指出百度在竞赛中存在舞弊行为;6月11日,百度承认了错误,并宣布开除该项目的负责人吴韧。这段时间成了百度公司在技术研发上最灰暗的一个月。

作弊事件体现了百度公司的高级研发人员在行业内树立威望的迫切心情,高薪引援则表明了百度公司取得技术突破的强烈愿望。引援方面的最大动作当属首席科学院吴恩达的加盟了。

根据公开资料,吴恩达是人工智能和机器学习领域最权威的学者之一,2010年加入谷歌公司,与那里的工程师合作建立了被成为“谷歌大脑”的神经网络系统。他最著名的成果是通过观看视频而训练谷歌大脑自动识别猫。

吴恩达为谷歌申请了4件美国专利,其中2件名为“图像相似性评价”专利的最早申请日是2011年11月21日。吴恩达加盟百度的时间是2014年5月16日,按照相同的时间跨度计算,他应该开始为百度公司提交第一件专利申请了。百度在人工智能领域可以取得怎么样的成绩,我们拭目以待了。

赞助本站

© 版权声明

相关文章

暂无评论

暂无评论...