摘要:
时至今日,人工智能对于大家已经不再是陌生的技术,它走进了人们生活的无数细节中,小到网上购物,大到工厂生产,都能看到人工智能技术带来的便捷与进步。
十年前,移动互联网的兴起让人工智能站上了爆发式发展的「奇点」。移动互联网较之传统的桌面互联网,打破了既有的时空边界,使得人机交互更加方便的同时,以自然语言处理、机器学习、视觉算法等技术为首的人工智能技术取到了突破性发展。
人工智能随之迎来了「黄金十年」,而悬在人工智能头上的达摩克利斯之剑也随之隐现。
首先出现的是数据监管与隐私的压力;其次,模型训练成本高昂;再者数据流通不畅。面对数据隐私、成本高昂、技术集中化等问题,人工智能如何突破掣肘,迈上新的台阶?本文给出了一些可参考的思路。
关键词 | 人工智能 数据 区块链 隐私计算
来源 | 深潮
70年前,当计算机普及刚刚燃起星星之火,我们绝不会想到,在全数字化社会迎面扑来之际,个体在数字世界拥有了「第二生命」,数字化的我们在辽阔的网络「平行宇宙」中不断拓宽自我边界,不断尝试新鲜事物,不断改善物质生活,同时我们也拓下了流动的印记——数据。
什么是数据?这个信息科学中一个基本但复杂的问题,没有显而易见的答案。简单地说,数据是观察的产物。观察对象包括物体、个人、机构、事件以及它们所处环境等。观察是基于一系列视角、方法和工具进行的,并伴随着相应的符号表达系统,比如度量衡单位。数据就是用这些符号表达系统记录观察对象特征和行为的产物。数据可以采取文字、数字、图表、声音和视频等形式。在存在形态上,数据有数字化的(Digital),也有非数字化的(比如记录在纸上)。但随着信息和通讯技术(ICT)的发展,越来越多数据被数字化。
据Statista分析,预计到2025年,全球联网设备的数量预计将达到309亿台。联网设备和服务创建了庞大的数据量,IDC预测到2025 年,全球数据将扩展至163ZB (1ZB 等于1万亿GB),相当于2016年所产生16.1ZB 数据的十倍。
这滚滚的数据洪流,如何挖掘其内在价值,人工智能给出了答案。
01 人工智能六十年
1956年夏天,在达特茅斯学院长达六个月的一场研讨会中,「人工智能」一词在明斯基等一众年轻科学家的研讨中被提出。
直到2006年,Hinton教授提出“深度学习”(Deep Learning)神经网络使得人工智能性能获得突破性进展,这一次的人工智能浪潮与前两次的浪潮有着明显的不同。基于大数据和强大计算能力的机器学习算法已经在计算机视觉、语音识别、自然语言处理等一系列领域中取得了突破性的进展,基于人工智能技术的应用也已经开始成熟。让人工智能开始真正迈向“智能”和落地应用。
时至今日,人工智能对于大家已经不再是陌生的技术,它走进了人们生活的无数细节中,小到网上购物,大到工厂生产,都能看到人工智能技术带来的便捷与进步。
理论与技术的日益成熟,促成了应用领域攻城拔寨,并带动商业化的不断跃迁。全球范围内越来越多的政府和企业组织逐渐认识到人工智能在经济和战略上的重要性,并从国家战略和商业活动上涉足人工智能。
十年前,移动互联网的兴起让人工智能站上了爆发式发展的「奇点」。以Apple、Samsung为代表的移动终端设备提供商和以Alibaba、Tencent、Facebook、Google为代表的移动互联网服务提供商,它们的加速迭代,使得移动互联网较之传统的桌面互联网,打破了既有的时空边界,使得人机交互更加方便的同时,以自然语言处理、机器学习、视觉算法等技术为首的人工智能技术取到了突破性发展。
德勤在其2019全球人工智能发展白皮书中推算,预测未来2025年世界人工智能市场将超过6万亿美元,2017-2025年复合增长率达30%。普华永道在人工智能对世界经济的经济影响的研究报告称,到2030年人工智能的出现将为全球GDP带来额外14%的提升,相当于15.7万亿美元的增长,超过中国和印度目前的国内生产总值总和。全球人工智能市场将在未来几年经历现象级的增长。
六十年,人工智能之火已成燎原之势,面对第四次工业革命——科技革命,其天花板也逐渐显现。
02 掣肘隐现
人工智能可以成为新一轮科技产业改革的变量与核心技术,缺少不了三大关键要素——数据、算法、算力。
自互联网兴起,尤其是移动互联网走进千家万户,迎来了全球数据的海量增长。这些真实而富有价值的数据为人工智能投喂了「生产材料」。
同时,芯片处理能力的提升,云计算的大规模运用以及计算硬件价格的大幅下降使得全球算力迎来计算热潮,算力为人工智能带来了真金白银的「生产发动机」。
得力于深度学习、机器学习、神经网络、计算机视觉的跃迁式突破,广阔的产业及解决方案市场使得人工智能算法得以快速发展,从行业来看,人工智能已经在医疗、健康、金融、教育、安防等多个垂直领域得到应用。算法为人工智能提供了得力的「生产工具」。
三大要素的加持,人工智能随之迎来了「黄金十年」,而悬在人工智能头上的达摩克利斯之剑也随之隐现。
首先出现的是数据监管与隐私的压力。早在2018年,欧盟便出台了《通用数据保护条例》(GDPR),2021年我国《中华人民共和国数据安全法》与《中华人民共和国个人信息保护法》相继实行。尤其是《个人信息保护法》,侧重于个人权益,是为了维护公民个人的隐私、人格、人身、财产等利益,其关于“个人信息”的定义,是指以电子或者其他方式记录的与已识别或者可识别的自然人有关的各种信息,个人隐私数据监管的加强无疑是给数据滥用的行为加上了强有力的枷锁。
不仅如此,数据隐私的压力也来源于彼此,对于拥有数据的企业来说,面临着很大的矛盾:通过数据分享和交互显然可以提升AI算法的效果,但同时又必须要保障自己的数据不泄露出去。无论是内部不同部门之间对于数据的使用,还是和第三方合作者的数据合作,都必须要严格保障合规,上线各种涉及数据合作的项目时,往往首要的考虑就是数据流动中安全问题。
其次,模型训练成本高昂。虽然硬件和软件的进步一直在推动人工智能培训成本每年下降37%,但由于人工智能模型的规模增长更快(每年10倍),导致人工智能的总培训成本继续攀升。有机构认为,最先进的人工智能训练模型成本可能会增加100倍,从目前大约100万美元飙升至2025年超过1亿美元。
面对数据隐私、成本高昂、技术集中化等问题,人工智能如何突破掣肘,迈上新的台阶?
一些前沿技术的研究与应用为其铺设了前进的道路。
03 人人都能用的人工智能
区块链与隐私计算技术的出现为人工智能提供了新思路。
数据的巧妙穿插,令区块链、隐私计算和AI三者以不同的方式产生了化学反应,这几项技术的结合可以将数据的利用提高到新的水平,同时可以增强区块链的基础架构并增强AI的潜力。
区块链的共识算法可以帮助人工智能系统中的主体完成协作任务,其技术特性也可使数据资产化,激励更广泛的数据、算法和算力加入,创造更高效的人工智能模型。
在有隐私数据应用的需求时,隐私计算可在保证数据提供方不泄露原始数据的前提下,对数据进行分析计算,保障数据在流通与融合过程中的“可用不可见”, 从而实现合规所需的隐私和安全控制,促进数据共享和价值交换。
目前市场上,我们已经可以看到形形色色基于隐私计算与区块链的的平台产品,例如蚂蚁链摩斯多方安全计算平台、百度安全的MesaTEE平台等,而平台产品绝大多数都是面向B端服务,道理很简单,企业与企业之间的数据业务是最基本的商业需求,它解决了企业之间对于数据分享、交互、提升AI算法的基本矛盾,但并未在人工智能民主化及建立安全的通用人工智能上有所涉猎。
企业服务仅仅是人工智能目前所能达到的落地伊始,在可见的未来,数据所有权终将归还给个人所有,技术、生产材料、生产工具也将让渡及归还给个人,以此才是围绕数据这个「新一代生产要素」以AI、区块链、隐私计算为技术设施,促进高级人工智能的涌现和进化,探索通往通用人工智能的道路之法。
近期,一家专注于前沿科技研究的企业发布的产品让用户与市场在普世化通用人工智能的应用上看到了新的方向。
PlatON隐私计算网络(暂用名)是一个去中心化的数据共享和隐私计算基础网络,其从产品设计之初便另辟蹊径,创新性的将人工智能的三要素——算力、算法、数据融入了产品中面向用户,即只要你是用户,就可以以数据所有者、数据使用者、算法开发者和算力提供者等多种身份登录平台,并完成多种任务需求,以去中心化方式聚集计算所需的数据、算法和算力,创造安全、通用的人工智能新范式。
作为商用级产品,PlatON隐私计算网络不再定位为To B的企业级产品,而是广义范围的面向机构及个人开放,例如:
作为数据拥有者,个人及机构可以作为数据节点添加数据,并参与平台上发布的计算任务,这实现了令人惊讶的创新——将数据有效确权、定价、保护,让数据在隐私保护的前提下完成了真正的资产化。
作为算力提供者,在平台中个人与机构皆可提供算力,为其他人提供执行某个计算任务时需消耗的机器资源,将闲置的服务器(算力)对外提供,来支持网络中的计算任务并获得对应的任务奖励。
而作为算法提供者,个人AI开发者可发挥最大的潜能,提供相应的AI算法,助力计算任务完成并获得相应收益。
这形成了一个自由、开放、可持续发展的「AI市场」,基于平台发布数据和算力,利用数据和算力可对算法进行计算。基于区块链上的密码经济学,可将数据、算力、算法货币化,形成有效的激励机制,激励更多的数据、算法和算力加入网络。逐渐形成数据、算法和算力的去中心化的共享和交易市场。
此外,PlatON在数据隐私方面,也设置了重重保护,通过融合安全多方计算、零知识证明、同态加密、可验证计算、联邦学习等多种密码学技术进行协同计算,将本地数据保护起来,真正做到了「数据可用不可见」,不仅数据保护,计算结果如训练完成的AI模型隐私也可得到保护。并且产品可高效地执行智能合约,也可流畅运行流行的深度学习框架,保障了其通用性、兼容性及高可用性。
从全景来看,隐私计算网络是以平台化的方式,以AI、区块链、隐私计算技术为核心能力,建立对数据全生命周期的管理能力,并按照应用需要,实现与下层、经济模型、数据算法算力资源等的无缝协同,从个体数据出发,破解数据孤岛难题,数据不仅可以被保护、可以被运用,更能成为个人或机构资产。
目前产品正在内测阶段,不难想象,如此庞大及复杂的平台产品,势必会面临极大的挑战。例如:数据如何多方定价?数据在多方流通中如何实现精确抓取及应用?核心的算法又何以吸引AI开发者提供?
即便如此,仍可以看到这是一个前所未有的超级数据商业体,新技术的融合应用需要时间,产品打磨更需要时间,PlatON隐私计算网络产品在探索数据商业化的道路上已经迈出了一步。
面向未来,数据经济跃迁的「奇点」,有可能就此向上绽放。
诚邀您参与产品内测,链接地址:
https://forum.latticex.foundation/t/topic/6057
本文转载自https://mp.weixin.qq.com/s/LM5LAX_nbjoPecmmb_TjRg