借助AR Translate，谷歌翻译已支持图片中的文字

AR增强现实1年前 (2023)发布 aixure

61 0 0

导读：日前谷歌方面宣布，谷歌翻译网页版已支持直接翻译图片上的文字内容，并且翻译后的文字可直接复制，或是保存翻译后的图片。据悉，这一功能的实现得益于其使用了AR Translate（AR翻译）技术，目前已支持113种源语言与133种目标语言，同时Google Lens同样也是借…

日前谷歌方面宣布，谷歌翻译网页版已支持直接翻译图片上的文字内容，并且翻译后的文字可直接复制，或是保存翻译后的图片。据悉，这一功能的实现得益于其使用了AR Translate（AR翻译）技术，目前已支持113种源语言与133种目标语言，同时Google Lens同样也是借助这项技术服务用户。

经验证发现，更新后的谷歌翻译网页中新增了图片翻译选项，用户选择图片翻译后、可上传图片按需选择语言进行翻译。但翻译后的图片，则有可能会出现版面及字体大小的调整。

据了解，2017年5月发布的Google Lens目前同样也使用了AR Translate技术，这是一款基于图像识别与OCR的人工智能应用，能够借助摄像头识别物体后提供搜索服务，功能也已从最初的物体识别更迭到可货币化搜索。此前在今年2月，谷歌方面在一场人工智能主题的活动中透露，Google Lens每月的搜索量已达100亿次。

此外，近日谷歌相关团队在还联合柏林工业大学推出了一款视觉语言模型PaLM-E，该模型通过PaLM-540B语言模型与Vit-22B视觉Transformer模型结合后的最终参数高达5620亿，不仅能进行简单的问答对话，还能指导机器人完成相对复杂的指令。同时谷歌方面还表示，其公布的通用语音模型USM也已实现升级，目前能检测和翻译包含英语、汉语在内的多种语言。在谷歌官方博客中还透露，与OpenAI的语音模型Whisper相比，USM的数据训练时长更短、错误率更低。

【本文图片来自网络】

# AR增强现实