字节跳动公开深度学习新技术:随意变脸/照片会动,算量大幅减少

IT之家 9 月 19 日消息 今日字节跳动技术团队在其官方公众号发表文章 , 介绍了字节跳动的一项深度学习新技术 。深度学习模型中的生成式对抗网络(GAN) , 可以用于图片风格迁移、图像编辑、图片生成等场景 , 为画面以及视频改变风格 。
举例来看 , 该技术可以将一匹棕色的马变成斑马 , 或者将莫奈的风景画变成真实的照片 。依据一个 鞋子的轮廓 , 可以自动生成真实的鞋子图形 。
字节跳动公开深度学习新技术:随意变脸/照片会动,算量大幅减少
文章图片

文章图片
字节跳动公开深度学习新技术:随意变脸/照片会动,算量大幅减少
文章图片

文章图片
字节跳动表示 , 图片风格迁移、图像编辑、图片生成等场景 。2020 年 , 麻省理工学院、Adobe 和上海交通大学技术人员提出一种 GAN 压缩算法 , 将算力消耗成功减少到 1/21 。
最近 , 字节跳动技术团队推出了一项自研 GAN 压缩算法 , 名为“在线多粒度蒸馏技术” , 简称 OMGD 。这项算法能够极大降低 CycleGAN 和 Pix2Pix 模型的算力消耗 , 分别降至原来的 1/40 和 1/46 。不仅参数和计算量更少 , 图像生成效果也更好 。
字节跳动公开深度学习新技术:随意变脸/照片会动,算量大幅减少
文章图片

文章图片
上图的结果显示 , OMGD 消耗的计算量仅为 1.219G , 相比于原始状态的 56.8G , 计算量大幅减少 , 生成效果也更优 。
IT之家了解到 , 目前 OMGD 技术已经应用在多款抖音智能特效中 。比如“三屏人生” , 可以将过去、现在、未来的自己实时展现在屏幕上 。
字节跳动公开深度学习新技术:随意变脸/照片会动,算量大幅减少
文章图片

文章图片
使用动态照片功能 , 可以让静态画面动起来 , 表情丰富逼真 。
字节跳动公开深度学习新技术:随意变脸/照片会动,算量大幅减少
文章图片

文章图片
【字节跳动公开深度学习新技术:随意变脸/照片会动,算量大幅减少】来源:IT之家