字节跳动公开深度学习新技术:随意变脸/照片会动,算量大幅减少
IT之家 9 月 19 日消息 今日字节跳动技术团队在其官方公众号发表文章 , 介绍了字节跳动的一项深度学习新技术 。深度学习模型中的生成式对抗网络(GAN) , 可以用于图片风格迁移、图像编辑、图片生成等场景 , 为画面以及视频改变风格 。
举例来看 , 该技术可以将一匹棕色的马变成斑马 , 或者将莫奈的风景画变成真实的照片 。依据一个 鞋子的轮廓 , 可以自动生成真实的鞋子图形 。
文章图片
文章图片
文章图片
文章图片
字节跳动表示 , 图片风格迁移、图像编辑、图片生成等场景 。2020 年 , 麻省理工学院、Adobe 和上海交通大学技术人员提出一种 GAN 压缩算法 , 将算力消耗成功减少到 1/21 。
最近 , 字节跳动技术团队推出了一项自研 GAN 压缩算法 , 名为“在线多粒度蒸馏技术” , 简称 OMGD 。这项算法能够极大降低 CycleGAN 和 Pix2Pix 模型的算力消耗 , 分别降至原来的 1/40 和 1/46 。不仅参数和计算量更少 , 图像生成效果也更好 。
文章图片
文章图片
上图的结果显示 , OMGD 消耗的计算量仅为 1.219G , 相比于原始状态的 56.8G , 计算量大幅减少 , 生成效果也更优 。
IT之家了解到 , 目前 OMGD 技术已经应用在多款抖音智能特效中 。比如“三屏人生” , 可以将过去、现在、未来的自己实时展现在屏幕上 。
文章图片
文章图片
使用动态照片功能 , 可以让静态画面动起来 , 表情丰富逼真 。
文章图片
文章图片
【字节跳动公开深度学习新技术:随意变脸/照片会动,算量大幅减少】来源:IT之家
- 无针疫苗注射机器人正式公开原型机
- 张小龙2021年微信公开课被互联网“封神”,十年后微信会是现
- 微信公开课上视频号为何没有存在感?
- 荷兰阿姆斯特丹国立博物馆将《夜巡》超高清数字照片对外公开
- 美团关联公开“车辆解锁方法、装置、共享车辆及存储介质”专利
- 国家邮政局公开征求意见:快递业务量已达1000亿件
- 荣耀magicv外观首次公开:双屏设计
- 2022微信公开课PRO开讲: “微信的老少皆宜”圆桌论坛聚焦互联网时代的“一老一小”
- 拿到字节跳动数千万元投资,这家公司想打造“AI虚拟人+AR智能眼镜”潮牌
- 数字人民币APP公开上架,和支付宝们有什么不一样?