世界人工智能大会 | 隐私计算干货总结

在2021世界人工智能大会上,隐私计算无疑成为最火热的话题之一,不仅有专场隐私计算学术交流会,更在数据要素和区块链等其他相关主题论坛上被广泛讨论。从学界和业界专家的深入交流中不难看出隐私计算“蹿红”的几大原因:

在宏观层面,数字经济时代数据成为新的生产要素,数据价值源于数据共享和计算,隐私计算是打破数据孤岛,实现数据有序流动的技术利器。

在法律和监管层面,随着各国监管与合规要求日益严格,隐私计算是许多行业和企业数据合规共享的技术保障。

在实操层面,全球数据安全和隐私泄露事件频发,隐私计算是保护数据安全和隐私的技术解。

从数据谈起,由场景决定

中国工程院院士柴洪峰表示,数据是数字经济时代的核心要素,数据开放共享已成为国家大数据战略和央行金融科技战略布局中的重要组成部分,各机构间数据逐渐形成数据孤岛,数据的共享使用需求强烈,而个人隐私数据保护法律法规趋严,数据共享面临使用需求与隐私保护的巨大矛盾。与此同时,随着数据要素市场的完善与发展,国家政策正呈现出数据应用与数据保护并重的倾向,产业政策也在积极鼓励大数据在开放共享中大力发展。

上海交通大学计算机科学与工程系教授郁昱表达了类似观点。他认为,数字经济时代数据是核心生产要素,决定了人工智能模型的优劣,通过跨业、跨界、跨域数据的融合,实现数据价值的深度挖掘与再发现。然而随着数据规模日益剧增,隐私泄露成为核心痛点。

蚂蚁集团资深副总裁、IEEE Fellow周靖人认为数据的开放流通包含三个层次。第一是个人数据的生产融合,如电商平台收集和利用个体的行为数据,趋势是端云协同——使用而不采集。第二是机构数据的开放流通,如不同金融机构利用数据交流提升风控能力,跨机构数据协同应做到“可用不可见”、“可信可证可度量”。第三是数据价值流通市场,形成数据流通生态保证数据隐私和安全,同时提供数据服务。

他总结道,数据开放流通场景繁杂,包括各类数据主体,他们的诉求又各不相同,个人希望保护个人隐私信息,企业希望保护企业数据价值,政府和社会又希望达到社会效益最大化。

数据开放流通的必要性和复杂性催生了隐私计算技术的发展。柴洪峰院士表示,数据流通存在数据生产、存储、处理、传输、交换、销毁的全生命周期,在隐私保护大背景下,数据的共享在传输、交换等关键环节,存在着不同的解决思路,包括数据不出库下的解决思路——联邦学习、端云一体的解决思路——TEE可信计算、集中式解决思路——多方安全计算(MPC)等。

柴洪峰院士所提到的解决思路其实也是隐私计算技术包含的几大典型技术路径。当然,隐私计算的技术路径远不止这些,比如与MPC一样源于密码学的同态加密和差分隐私。

郁昱就表示,为了解决人工智能中的隐私保护问题,密码学技术在其中扮演了至关重要的角色。以同态加密为例,数据可以在密文状态下执行计算,计算结果解密后与明文的计算结果一致。2020年,IBM利用银行实时数据对全同态加密技术和机器学习模型的结合进行了实地实验。

据浙江大学网络空间安全学院院长、计算机科学与技术学院副院长任奎介绍,差分隐私的部署和使用大多存在于政府机构与互联网巨头,近年来主要应用场景包括了2019年IBM的开源库Diffprivlib和TensorFlow的隐私保护机器学习开源库,2020年美国人口普查的微观普查数据和领英的广告客户查询,2021年阿里巴巴的DataTrust平台等。

过去在理论层面,这些技术路径孰优孰劣还相对主观,但伴随越来越多的落地应用,各界对各项技术的长处和短板有了更清晰的认识,普遍认同应根据具体场景所需来决定如何搭配和使用这些技术。

郁昱认为,理论上密码学相关技术都可以解决问题,但实际上却大都受限于性能效率,因此还有很长的路要走。锘崴科技创始人、董事长、CTO王爽表示,安全性和隐私计算是多维度的,大部分情况下要结合具体场景选择不同技术。富数科技副总裁兼安全计算首席专家卞阳表示,数据需要逐步运营,需要多种技术融合来解决不同场景中的问题,通过迭代来不断发展技术,才能让隐私计算更有前景。蚂蚁集团共享智能总经理王磊则认为,短期从应用场景和用户体验方面来看,联邦学习、多方安全计算的应用面会更广一些。

柴洪峰院士还特别谈到了数据开放共享与区块链技术。区块链是基于密码学算法实现的去中心化的点对点分布式共享账本技术,是多个现有技术的集成创新,实现可共享、可追溯、不可篡改的数据信息传递,为不同参与主体间可信数据交互提供了有效技术手段,并能够优化数据共享业务流程,加速结算效率、降低业务成本。

隐私计算的机遇与挑战

隐私计算毕竟仍处发展早期,尽管机遇很多,但挑战也不少,在技术本身和落地应用方面都有显现。

郁昱在总结各技术路径优劣时表示,可信执行环境是硬件安全“飞地”,优势在于性能高效、容易切换,劣势是需要信任硬件厂商,且目前计算、存储能力有限。联邦学习以“数据不动模型动”为特点,优势是相对高效,是分布式机器学习的延伸,劣势在于其安全性没有得到充分研究。密码学可证明安全,优势是相对高效且适配各类场景以及安全需求,劣势则是具有一定性能瓶颈,使用和理解门槛较高。

任奎谈到差分隐私面临的挑战时表示,差分隐私的理论难点如数据可用性较差、数据类型有限,应用难点包括适用范围有限、测试算法缺乏等。

而在应用端,隐私计算面对的挑战更为复杂。柴洪峰院士表示,目前主流隐私计算方法仍缺乏大规模通用的场景应用示范实例,在完备的安全认证、商业模式探索基础上,需进一步研究场景的结合与示范应用验证。

锘崴科技联合创始人郑灏从“隐私计算+医疗”的视角看到,精准医学的发展离不开各医疗机构间的数据协作,医疗数据的流动对隐私计算是一个非常好的发展机遇,但挑战并存,如法律层面需要有更明确的条文来指导科技企业实现医疗数据的有序流动。

富数科技联合创始人兼总裁杭海巡表示,数据成为数字经济的关键核心生产要素,数据要解决权利权属问题、隐私和安全可控问题,就为隐私计算的应用创造了广阔前景。但隐私计算同时也面对三大挑战:第一要加强技术攻关,确保工程化和性能可用,在安全和性能之间达到平衡,确保数据融合应用可落地;第二是互联互通问题,因为数据要素流动必须要多方融合协作,那么各个隐私计算系统就要兼容互通;第三是数据治理机制,数据相关的法规还需进一步完善,规范机制的推进能为隐私计算提供更多数据燃料,才能促进隐私计算在商业场景中的实质落地。

翼方健数CEO罗震提到,隐私计算为数据所有权和使用权的分离提供了合规和法律层面的抓手,可以在数据所有权不明确的情况更多关注使用权,这对隐私计算是一个非常好的机遇。另外,许多情况下数据很难做到完全脱敏,而隐私计算就可以确保隐私,这可以看作是隐私计算与合数据相关政策法规的结合点。

华控清交副总裁赵肖琳表示,数字化进程中数据合规流动的需求会直接推动隐私计算的发展,但也会碰到很多挑战。首先数据的安全合规使用远不止于科技,还需要法律法规、业务流程、信息化建设等协同配合,这样一项系统工程也需要隐私计算产业的整个生态一起努力。其次,隐私计算人才短缺,需要加快培养。最后,科技发展还离不开资本输血,同时科技企业也要尽快实现商业落地。

需要强调的是,隐私计算单纯作为技术解决方案实现数据安全共享是不够的,还应探索更加完备的数据交易机制。隐私计算是这一大生态中的重要部分,并在生态运行和进化的推动下持续迭代演进。

柴洪峰院士表示,数字经济时代,在个人隐私保护趋严、数据孤岛日益严重的大背景下,数据开放共享面临的阻力和诉求也发生着不断的变革。隐私计算技术为新时代数据开放共享提供了思路与道路,不同分支技术的发展、标准、规范制度的建立,也正有力推动技术的应用落地。未来数据开放共享在激励机制制定、隐私计算技术安全性论证等方面仍需进一步布局和努力。

任奎在谈到数据市场时表示,数据成为生产要素,数据市场的重要性就不可忽视。数据市场是未来隐私计算打破数据孤岛的架构和平台,包括如基于区块链技术的数据确权与溯源,基于安全多方计算和差分隐私的数据定价等。总的来说,要构建更加完善的要素市场化配置,数据安全与隐私保护任重道远。

周靖人提出了“开放智能”的设想,可以在如此复杂的数据开放流通场景中确保数据安全和隐私保护。总括来看,“开放智能”=数据鉴权+隐私计算+可信赖AI+市场机制,具体包含五大类技术。

翼方健数首席科学家张霖涛介绍了数据和计算互联网(IoDC)的概念,即建立一个由安全数据和人工智能应用程序;数据所有者、数据用户和服务提供商所组成的活跃生态系统。利用隐私安全计算技术,实现合理的、授权下的数据价值共享,创造数据流通性,降低数据科学的门槛,推动人工智能的进步。

  • 以上内容仅代表作者个人观点,不代表氢云资讯观点及立场
  • 以上内容及观点不构成任何投资建议,据此投资后果自负

上一篇:
下一篇:
评论已经关闭