导读:日前谷歌方面宣布,谷歌翻译网页版已支持直接翻译图片上的文字内容,并且翻译后的文字可直接复制,或是保存翻译后的图片。据悉,这一功能的实现得益于其使用了AR Translate(AR翻译)技术,目前已支持113种源语言与133种目标语言,同时Google Lens同样也是借…
日前谷歌方面宣布,谷歌翻译网页版已支持直接翻译图片上的文字内容,并且翻译后的文字可直接复制,或是保存翻译后的图片。据悉,这一功能的实现得益于其使用了AR Translate(AR翻译)技术,目前已支持113种源语言与133种目标语言,同时Google Lens同样也是借助这项技术服务用户。
经验证发现,更新后的谷歌翻译网页中新增了图片翻译选项,用户选择图片翻译后、可上传图片按需选择语言进行翻译。但翻译后的图片,则有可能会出现版面及字体大小的调整。
据了解,2017年5月发布的Google Lens目前同样也使用了AR Translate技术,这是一款基于图像识别与OCR的人工智能应用,能够借助摄像头识别物体后提供搜索服务,功能也已从最初的物体识别更迭到可货币化搜索。此前在今年2月,谷歌方面在一场人工智能主题的活动中透露,Google Lens每月的搜索量已达100亿次。
此外,近日谷歌相关团队在还联合柏林工业大学推出了一款视觉语言模型PaLM-E,该模型通过PaLM-540B语言模型与Vit-22B视觉Transformer模型结合后的最终参数高达5620亿,不仅能进行简单的问答对话,还能指导机器人完成相对复杂的指令。同时谷歌方面还表示,其公布的通用语音模型USM也已实现升级,目前能检测和翻译包含英语、汉语在内的多种语言。在谷歌官方博客中还透露,与OpenAI的语音模型Whisper相比,USM的数据训练时长更短、错误率更低。
【本文图片来自网络】
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...