Phenaki 是一种人工智能模型,可以直接从文本中生成长达数分钟的视频。您还可以从静止图像和提示生成视频。所提出的视频编码器-解码器在时空质量和每个视频的令牌数量方面优于文献中当前使用的所有每帧基线。为了从文本生成视频标记,他们使用以预先计算的文本标记为条件的双向掩码转换器。生成的视频令牌随后被去令牌化以创建实际视频。
数据统计
数据评估
关于Phenaki特别声明
本站AI未来之窗提供的Phenaki都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由AI未来之窗实际控制,在2023年6月15日 下午5:36收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,AI未来之窗不承担任何责任。
相关导航
暂无评论...