剑桥大学等研究发现:理论上稳定准确深度神经网络实际不存在

本文转自:澎湃新闻
当下 , 深度神经网络应用越来越广泛 , 帮助设计微芯片 , 预测蛋白质折叠 , 并在复杂游戏中胜过人类 , 性能越来越强大 。但也有大量证据证明 , 它们通常是不稳定的 。一个非常明显的表现是 , 深度神经网络接收到的数据的微小变化 , 就可能会导致结果的巨大变化 。
例如《One pixel attack for fooling deep neural networks》研究中所揭示的 , 改变图像上的一个像素 , AI就把马识别成青蛙 。哈佛医学院计算机科学家和生物医学信息学家Samuel Finlayson也曾发现 , 医学影像可以以人眼无法察觉的方式进行修改 , 然后导致人工智能100%地误诊癌症 。
在以前的研究中 , 有数学证据表明 , 存在用于解决各种问题的稳定、准确的神经网络 。然而最近剑桥大学和奥斯陆大学的研究人员发现 , 这些人工智能系统可能仅在有限的情况下是稳定和准确的 。理论上存在的兼具稳定性和准确性的神经网络 , 可能无法准确描述现实中可能发生的事情 。
“从理论上讲 , 神经网络的限制很少 。”英国剑桥大学的数学家Matthew Colbrook 说 。然而当试图计算这些神经网络时 , 问题就出现了 。
“数字计算机只能计算某些特定的神经网络 , ”挪威奥斯陆大学的数学家Vegard Antun认为 , “有时计算一个理想的神经网络是不可能的 。”
【剑桥大学等研究发现:理论上稳定准确深度神经网络实际不存在】这样的表述可能听起来令人困惑 , 《IEEE Spectrum》在谈论这项研究时以蛋糕做比喻 , “好像有人说可能存在一种蛋糕 , 但不存在制作它的配方 。”
“我们会说问题不在于配方 。相反 , 问题在于制作蛋糕所必须的工具 。”剑桥大学的数学家Anders Hansen说 , “我们说可能有蛋糕的配方 , 但无论你有什么搅拌机 , 你都可能无法制作出想要的蛋糕 。此外 , 当你尝试在厨房用搅拌机制作蛋糕时 , 你会得到一个完全不同的蛋糕 。”
依此 , 继续进行类比 , “甚至在你尝试之前无法判断蛋糕是否不正确 , 然后为时已晚 。”Colbrook 说 , “然而 , 在某些情况下 , 你的搅拌机足以制作你想要的蛋糕 , 或者至少可以很好地近似于该蛋糕 。”
这些关于神经网络局限性的新发现与数学家Kurt G?del和计算机科学家Alan Turing关于计算局限性的先前研究相呼应 。粗略地说 , 他们揭示了“有些数学陈述永远无法被证明或反驳 , 还有一些基本的计算问题是计算机无法解决的 。”Antun表示 。
剑桥大学等研究发现:理论上稳定准确深度神经网络实际不存在
文章图片

文章图片

此项研究以《计算稳定准确的神经网络的难点:关于深度学习的障碍和Smale的第18个问题》(The difficulty of computing stable and accurate neural networks: On the barriers of deep learning and Smale’s 18th problem)为题 , 于3月16日发布在《美国国家科学院院刊》上 。
在人工神经网络中 , 被称为“神经元”的组件被输入数据并协作解决问题 , 例如识别图像 。神经网络反复调整各个神经元之间的联系 , 并查看由此产生的行为模式是否能更好地找到解决方案 。随着时间推移 , 网络会发现哪些模式最适合计算结果 。然后它采用这些作为默认值 , 模仿人脑中的学习过程 。如果一个神经网络拥有多层神经元 , 它就被称为“深度” 。
在以前的研究中 , 有数学证据表明 , 存在用于解决各种问题的稳定、准确的神经网络 。然而 , 在这项新的研究中 , 研究人员现在发现 , 尽管理论上可能存在稳定、准确的神经网络来解决许多问题 , 但矛盾的是 , 实际上可能没有算法能够成功地计算它们 。