“跑马圈数据”时代,12位产学研专家眼中数据要素与数字金融的“真相”( 二 )


还有一个重要研究方向 , 是激励机制的建立 。例如利用区块链来记录审计 , 每一个数据拥有方对整个联合模型的贡献 。这就需要一个公平的利益分配原则 , 需要经历机制设计的过程 。
应用方面 , 首先在金融的交叉营销、反洗钱 , 可以通过联邦学习把他们的数据联合建筑 , 把模型的特征空间加以扩充 , 完成联合建模;以及医疗诊断、物联网、无人车网络等 。
总体来说 , 联邦学习是多学科的交叉 , 包括安全合规 , 如何防御攻击和提升教育 , 如何广泛的来进行技术应用 , 还有如何建立这种联邦机制联盟的机制 , 以鼓励大家持续的为经济体为生态贡献 。
而隐私计算的商业模式也逐渐形成 , 例如平台建设方靠硬件产品部署和提供利用项目建设的方式收费;咨询服务商帮助大平台进行数据价值解读 , 利用数据运营等 。
香港科技大学智能网络系统实验室主任、星云Clustar创始人陈凯 , 与清华大学金融科技研究院副院长、华控清交创始人徐葳也就隐私计算和数据要素两大主题 , 带来了一场深度对话 。
数据保护现状是否也促成了更多潜在的商业机会?对此 , 陈凯表示机遇与挑战并存 , 面临的挑战首先是产品;徐葳则指出 , 长远来看 , 挑战仍然在于数据能否带来价值 。
而对于技术应用角度如何积极适应规则 , 陈凯表示 , 很难有一个技术/算法能够最小地完成最小影响 , 最小范围、最短时间;法规是在技术研究上给予约束条件 , 帮助推动研发和落地的进程 。
当被问到隐私计算未来发展的特征 , 陈凯表示建立安全的数据网络意义重大 , 如何处理大量不同机构间的异构数据、性能和规模上处理海量数据、如何让利益共享的性能有指数级的提升 , 当中有许多值得努力研究的难题 。
徐葳则笑称“只有烂大街的技术才是好技术” , 认为一项新技术未来的表现 , 要看技术本身能否成功、使用门槛能否降低 。数据源也在逐步有机生长 , 很多不同行业、不同地区的小平台被建立起来交换数据 , 如何让这些异构平台也增长成功、小的计算方法和技术整合起来 , 实现规模经济 , 也值得关注 。
百度安全产品总经理韩祖利也认为 , 数据要素呈现几大趋势特性:规模上升 , 类型增加 , 数据价值密度降低 , 应用场景也在泛化 。
在他看来 , 当代数据安全的核心要义:应对强对抗的安全问题 , 非对抗安全和内部使用的权限、审计 , 隐私保护 。因此一个方案如果诞生 , 应具备三个特点:覆盖数据全生命周期 , 一体化的集中治理平台 , 和合规的数据使用、流通形式 。
成都大数据集团总经理顾勤就表示 , 关于科学要素流通的创新实践主要有三个阶段:公共数据运营;整体数据流通 , 政府的公共数据和社会企业的数据间产生碰撞;产业数据的协同 。
以第三阶段为例 , 即产业数字化 , 有两种方式:传统产业的体能升级;创新产业的协同效应 , 通过系统的互联、数据的交互 , 产生新的价值和场景 。
第四范式副总裁、主任科学家涂威威 , 则在演讲中提出这样一个问题:传统的数据安全设计 , 能够覆盖AI应用的范围吗?
在训练到预测的许多环节里 , 都出现了他们预想不到的攻击方式 。多种看似正常合法、实为攻击的手段 , 已经发展颇为成熟 。
例如AI公司对外提供信用卡授信模型 , 攻击者可以通过不断申请、使用授信服务 , 将反馈回来的数据用于“猜测”那个授信模型 。如果这样的新模型被训练出来 , 攻击者有可能就会猜到训练集的内容 , 相当于数据泄露 , 但该过程中的行为均是合法的 。