BIGCHINA:认识元宇宙技术的一个框架( 二 )


如果说 , 以VR、AR为代表的交互技术是人们进入元宇宙的门户 , 那么人工智能技术就是让整个虚拟世界能够和人互动起来的发动机 。
我们将“人工智能”理解为让智能体(agent)在复杂条件下达成目标的能力 。从历史上看 , 人们尝试过很多方法来实现人工智能 。例如 , 早期人们曾经尝试从神经科学入手 , 模拟人脑的运作来达成人工智能 。而在最近 , 机器学习(machinelearning)已经成为人工智能的主流方法 。
所谓机器学习 , 就是通过对大量数据的分析 , 让计算机在没有预先进行明确编程的前提下拥有学习的能力 , 找到处理问题的方法 。比如 , 如果我们想训练计算机具有识别出图片中的猫的能力 , 就可以找来一堆动物图片“喂”给机器 , 让它“学习” 。
当然 , “学习”的方法可以有很多种 。传统上 , 我们会更多采用一种被称为监督式学习的方法:把那些有猫的图片找出来 , 然后对猫的特征进行标识 , 比如 , 有大眼睛、圆脸、胖爪子等……等计算机学习了大量的图片后 , 就会知道具有这些特征的动物就叫做猫 。
不过 , 这种训练的方式显然十分费时费力 , 仅仅对数据标识就要花费大量的人力物力 。因此 , 现在一种被称为“深度学习”(deeplearning)的无监督学习方法就变得更为流行了 。
所谓深度学习 , 是一种模仿人脑思维过程的方法 , 它利用多层神经网络进行学习 , 通过组合低层特征形成更加抽象的高层表示属性类别或特征 , 最后作出综合判断 。回想一下我们学会认识猫的过程 , 并没有人找很多猫来进行标注 , 让我们学习 , 我们只是看多了 , 就自然而然地知道什么是猫了 。把这个“自然而然”的过程进行解剖 , 我们其实是通过对猫的大量观测 , 在大脑中总结出了很多关于猫的特征 , 然后把这些特征结合起来 , 就能判断看到的动物是不是猫 。类似地 , 深度学习也是通过对大量样本的学习 , 逐步总结出一些判断动物是不是猫的总要特征 , 然后根据这些特征来进行判断 。
BIGCHINA:认识元宇宙技术的一个框架
文章图片

文章图片

用深度学习教计算机识别一只猫
在大数据条件下 , 相比于传统的机器学习 , 这种学习方法的效率优势十分明显 , 在识别物体方面 , 它基本上可以达到和人工识别一样的精确度 。不过 , 有利必有弊 。在可解释性上 , 深度学习却具有明显的短板——我们虽然知道计算机能从图中识别出一只猫 , 但却很难知道它是凭借什么标准来实现这一点的 。
在现阶段 , 人工智能在元宇宙的应用主要有三个方面:实时场景和数字孪生体制造、虚拟人的智能化 , 以及数字化身的个性化 。
在元宇宙中 , 用户的位置会是随时变换的 。与之对应的 , 虚拟场景也就要随之变换 , 以保证其与用户的互动 。在这个过程中 , 大量的图形、阴影变化 , 都需要人工智能来实时作出判断 。
所谓数字孪生 , 是对物理实体或系统具有高度完整性 , 并可以与物理世界保持交互作用的数字克隆体 , 它们可以在元宇宙里用来对物理实体进行实时处理 。
在元宇宙中 , 除了人的数字化身之外 , 还会有很多作为“气氛组”存在的虚拟人NPC 。就像在电影《失控玩家》里一样 , 这些NPC需要有一定和人进行交互的能力 , 以满足人们与之进行互动的需要 。而要实现这些NPC的智能化 , 就需要应用人工智能技术 。
为了大幅提升虚拟人NPC的训练效果 , 经常会用到强化学习 。这种学习方法让智能体在复杂的环境中不断试错 , 并根据返回结果的正误来给予“奖励”或“处罚” , 借助这种思路 , 就可以在很短时间内让它们的AI水平有很大的提升 。现在 , 强化学习已经被广泛运用于电脑游戏 , 相信在未来的元宇宙当中 , 这种学习方法也会得到比较多的应用 。