7月22日,由澎湃新闻网主办的“新潮澎湃”2021外滩新媒体峰会在上海拉开帷幕。数美科技CTO兼联合创始人梁受邀参加了《新技术助力网络内容生态治理》圆桌论坛,针对AI识别违规内容所面临的挑战及机器识别涉政违规信息等内容做了分享。
网络安全,是国家数字化战略的“底盘”。内容安全,是国家数字化战略的“方向盘”。对于文字、图片、音频、视频等多种形态的网络信息,我们在审核时面临哪些挑战?
数美科技CTO梁表示,通过AI识别违规内容面临三个挑战:
第一个挑战是内容量大,如何提高机审效率是头一个挑战。比如,每天数美科技AI实时审核的音频累计时长超过100年。这就对平台的处理效率、稳定性提出了挑战;
第二个挑战是内容安全定义比较“泛”,需要识别的维度非常多。比如,数美科技视频/图片产品以标签的形式定义了上千个不同的违规类型,背后有27个不同的视觉AI模型在识别这些标签;
第三,做违规内容识别时,发布人可能存在“对抗性”。对于“对抗性”,梁解释道,“比如姓名的变体、影射,或者是在漫画和视频中涂抹、修改,或通过影子和镜子来传达信息”。
梁表示,这就需要在识别算法上不断改进。目前,数美科技不仅有用于识别风险内容的人工智能技术,还有用于对抗黑产的基于行为画像的全栈式实时智能风控引擎“天网”,通过内容+画像的组合拳,才能够达到更好的识别效果。
针对当前涉政违规信息机器识别率相对不高的问题,梁表示,“涉政”的概念是比较宽泛的,模型对一个文本、图片是不是涉及到政治可以识别的很好。对于涉政内容的各种变体,数美科技研发了专门的变体引擎,也基本上解决了这类问题。目前,模型面临的挑战“导向是否正确”,针对这个挑战我们研发了正负向标签,有望解决这些问题。目前最好的解决方案是机器先审核,再通过人工判断导向是否正确。
如今网络空间每天新增的信息数以亿计,网络内容生态治理不容忽视。2021外滩新媒体峰会上,数美科技CTO梁与数位业界专家围绕《新技术助力网络内容生态治理》展开精彩研讨,为广大行业从业者提供了更多落地的参考方向和思路。未来,数美科技将以AI力量持续赋能网络内容生态治理,清朗网络空间,践行时代担当。