论文总结(2020年人工智能论文总结)( 二 )


这种新技术可以改变任何图片的纹理 , 同时使用完全无监督的训练保持现实!结果看起来甚至比GANs能实现的还要好 , 而且速度更快!它甚至可以用来制作深度赝品!


GPT-3: Language Models are Few-Shot Learners [9]
当前最先进的NLP系统很难推广到不同的任务上 。他们需要在成千上万个示例的数据集上进行微调 , 而人类只需要查看几个示例即可执行新的语言任务 。这是GPT-3的目标 , 目的是改善语言模型的任务不可知特性 。


Learning Joint Spatial-Temporal Transformations for Video Inpainting [10]
与当前的最新技术相比 , 该AI可以填充移动的物体后面的缺失像素 , 并以更高的准确性和更少的模糊度重建整个视频!


Image GPT — Generative Pretraining from Pixels [11]
一个好的人工智能 , 比如Gmail中使用的那个 , 可以生成连贯的文本并完成你的短语 。这是使用相同的原理来完成图像处理! 全部在无监督的训练中完成 , 根本不需要标签!


Learning to Cartoonize Using White-box Cartoon Representations [12]
该AI可以将您想要的任何图片或视频进行卡通化!


Neural Re-Rendering of Humans from a Single Image [14]
该算法将身体的姿势和形状表示为参数网格 , 可以从单个图像进行重构并轻松放置 。给定一个人的图像 , 他们便能够以不同的姿势或从另一个输入图像获得的不同衣服来创建该人的合成图像 。


I2L-MeshNet: Image-to-Lixel Prediction Network for Accurate 3D Human Pose and Mesh Estimation from a Single RGB Image [15]
目标是提出一种从单个RGB图像进行3D人体姿势和网格估计的新技术 。他们称其为I2L-MeshNet 。I2L代表"图像到像素" 。就像体素 , 体积+像素 , 是三维空间中的量化单元格一样 , 他们将lixel , 线和像素定义为一维空间中的量化单元格 。他们的方法优于以前的方法 , 并且代码是公开可用的!


Beyond the Nav-Graph: Vision-and-Language Navigation in Continuous Environments [16]
语言导航是一个被广泛研究的领域 , 也是一个非常复杂的领域 。对于一个人来说 , 走过一所房子来拿掉您放在床头柜上的咖啡就很简单了 。但这对于AI代理来说是另外一回事了 , 它是一个使用深度学习执行任务的自主AI驱动的系统 。


RAFT: Recurrent All-Pairs Field Transforms for Optical Flow [17]
ECCV 2020最佳论文奖授予普林斯顿大学团队 。他们为光流开发了一种新的端到端可训练模型 。他们的方法超越了跨多个数据集的最新架构的准确性 , 并且效率更高 。


Crowdsampling the Plenoptic Function [18]
利用从互联网上获得的公开照片 , 他们能够重构旅游场景的多个视点 , 从而保留逼真的阴影和照明! 这是用于真实感场景渲染的最先进技术的巨大进步 , 其结果简直令人赞叹 。


Old Photo Restoration via Deep Latent Space Translation [19]
想象一下 , 当您祖母18岁时 , 她的老照片 , 折叠甚至撕裂的照片都清晰无瑕 , 清晰度很高 。这就是所谓的旧照片恢复 , 本文只是使用深度学习方法开辟了一条全新的途径来解决这一问题 。


Neural circuit policies enabling auditable autonomy [20]
来自IST Austria和MIT的研究人员已经成功地使用一种新的人工智能系统训练了自动驾驶汽车 , 该系统基于细小动物(如线虫)的大脑 。他们实现了这一点 , 与流行的深度神经网络(如Inceptions , Resnets或VGG)所需的数百万个神经元相比 , 只有少数神经元能够控制自动驾驶汽车 。他们的网络仅使用75,000个参数(由19个控制神经元而不是数百万个参数)就可以完全控制汽车!