本文转载自微信公众号 :矩阵元
原创:矩阵元
本篇文章为知乎作者LibGen参与上海DevFest谷歌开发者节后对隐私计算与Rosetta的认知与感想,矩阵元已获得作者授权,在此对作者表示由衷的感谢。
作者 | LibGen
来源 | 知乎
11月,我有幸前往闵行区参加了上海DevFest 2020谷歌开发者节,一天下来收获满满。在这里首先要向上海GDG的工作人员和志愿者表示由衷的感谢,尽管疫情突现和秋雨骤至,但TA们的热情付出让与会者获得了绝佳的体验,为TA们的工作点赞。
下面进入正题,本次我参加的是主会场,现场大佬云集,干货满满,从互联网发展局势到AI落地各大应用场景,从Flutter开发日常到Android高级技术,无论是想看技术大牛具体细致地剖析代码,还是想听行业领袖深入浅出地解说新鲜概念,统统都能满足!而我在此次活动中最感兴趣的是矩阵元算法科学家谢翔老师关于密码学在AI隐私计算中应用的分享,以及对Rosetta这个开源隐私计算框架的介绍。
数据保护隐私计算
谢翔老师首先向大家介绍了AI蓬勃发展背后鲜有人知的隐忧,即数据隐私问题。AI必须获得大量多样化的数据来提高模型的精度,但层出不穷的隐私泄漏事件却让企业和个人对AI滥用数据充满担忧,这是每个AI开发者和用户都不得不正视的一对内生矛盾。打个比方,数据就像发动AI这辆跑车的「汽油」,但使用时稍有不慎便可能造成车毁人亡的后果。
那么问题来了,如何能够在保护数据隐私的前提下,把各不同源、不同企业之间的数据融合运用呢?传统的技术方法很难解决这个问题,所以谢翔老师自然地引出了隐私计算这一概念。
隐私计算,简单来说就是保证数据在使用和融合过程中隐私的综合性技术,而不是简单的一项技术。隐私计算分为以下三种方向:可信执行环境、联邦学习和密码学,谢翔老师用一张表格简明扼要地说明了他们的特点和优劣。
由于可信执行环境和联邦学习各自都存在一些致命的缺陷,而密码学作为新兴学科,有着相当广泛的应用场景,其劣势主要在于使用门槛较高,所以本次分享更倾向于密码学的介绍。
密码学在隐私计算中的应用
密码学中的隐私计算技术,大概分为三大类。分别是:安全多方计算、同态加密和零知识证明。安全多方计算(Secure Multi-Party Computation,简称MPC),在1982年由姚期智先生提出,缘起于「百万富翁问题」。对该问题的具体描述这里就不赘述了。一句话概括:MPC的本质就是多个参与方在不泄露隐私数据的前提下,对等地进行协同计算。
贯穿于MPC中的一个技术就是秘密分享(secret sharing),其基本思想是:计算过程中所有中间值都是分享在参与方之间的。但这种公开性又不影响原始数据的秘密性,真是一个悖论似的问题,但这又是能用密码学去证明的。对于大家的困惑,谢翔老师总结得很好:密码学主要解决常规逻辑下看似不可能的事。
此外,谢翔老师还介绍了同态加密和零知识证明,并分别举了「爱丽丝的珠宝」和「阿里巴巴洞穴」这两个问题予以形象说明。
隐私计算的落地-Rosetta
谢翔老师讲了许多烧脑的密码学理论,像我这样缺乏数学才能的人听着就头大,这隐私计算的门槛果真就如此之高?难道每个AI开发者都要去学密码学或者找到密码学专家合作吗?若是如此,密码学在AI隐私计算中的应用必然大大受限。幸好,Rosetta正是为了解决此类痛点问题而生,它致力于弥合AI工程师与密码学专家之间的专业壁垒,打造一个开箱即用的隐私计算框架。得益于TensorFlow的高度可扩展性和对自定义算子的支持,Rosetta在其基础上对前端Python和后端C++的代码都进行了改造,使用者仅需在原有代码的基础上修改几行即可完成切换,而完全不用了解密码学等技术,这体现了Rosetta极高的易用性。
同时,Roestta也具有高效性和可扩展性。它完全兼容原生TensorFlow对数据流图自动执行的各种运行时优化,用C++来实现保持了底层算法的高效性。如果有了新的算法被引入,Rosetta也能迅速将其集成到整个框架。
讲完了Rosetta的技术原理和结构特点,谢翔老师又分享了它在实际场景落地中的应用案例:金融场景下的应用。银行A与B,他们各有各的数据,然后互联网公司C也有数据,大家希望能够通过Rosetta把模型建起来,比如训练逻辑回归后,把风控模型训练出来,训练出一个更加高效的模型,同时保证ABC各方数据都不会被对方拿到,这种场景下,用Rosetta解决问题就非常简单,而且得到的结果和使用明文TensorFlow计算模型几乎一致。
最后,谢翔老师简单介绍了Rosetta的开源历程和发展现状,邀请与会者参与到Rosetta框架的建设中来。在Q&A环节,回答了观众对于密码学可靠性的疑问,在大家的掌声中结束了分享。
总之还是再次感谢GDG举办这样一场技术盛宴,我也要多多学习,积累技术栈,才能真正成为一名学生开发者。
矩阵元
矩阵元技术定位于隐私计算和区块链技术服务商,面向智慧城市数字化治理的需求,提供基于隐私计算的分布式信用体系和分布式身份认证体系,利用隐私计算和区块链技术,打造密文传输、风险可控、多方计算的数据资产价值交换网络平台,通过开放的技术架构,与产业各方共享共建新一代信息基础设施体系。矩阵元在深圳、上海、杭州、北京分别设有办公区。
本文转载自https://mp.weixin.qq.com/s/PsjxUbpjnCbyzoBYo4gPmw