在数字化浪潮推动下,数据领域的技术创新、场景应用与管理服务日益成为各个行业领域数字化转型发展的重要驱动力。同时,“数据流通”与“数据安全”间的矛盾也日益升级,成为影响数字化发展的制约因素。
安全VS发展
“安全”与“发展”,一直是数据管理领域的两大重要主题。二者既矛盾对立,相互制约;又在不断的技术创新下追寻均衡,最大限度实现数据的价值。
矛盾制约
“数据”作为一种特殊的市场资源与生产要素,其自身特点决定只有在更大范围的社会共享中才能发挥其真正的资源价值。在人工智能、大数据、云计算等技术快速应用推广的当下,不断提高的算力+不断优化的算法,将通过不同维度、不同领域的大数据发现事物间蕴藏的规律,并运用规律解释过去、预测未来。
智能算法持续优化、提升的重要前提即是通过海量、多元的大数据资源进行数据训练,客观上有着较强的数据共享使用需求,这与具有“信息数据共享和透明”特点的区块链技术不谋而合,相辅相成,因此近年来区块链技术发展应用迅速。但需要注意的是,数据的共享交换虽然提升了数据自身价值,但也不可避免的出现侵犯数据所有者“数据隐私”的安全问题,数据共享挖掘面临合规监管,数据技术发展应用陷入瓶颈。
均衡发展
“在矛盾中寻找平衡”,是目前数据领域技术创新应用的重要课题。客观市场环境的快速变化也为“数据流通”与“数据安全”的均衡发展形成强大驱动力。
2019年末,一场突如其来的新型冠状病毒疫情在世界范围内蔓延肆虐,大量民众不幸罹难,各国经济发展更是遭受沉重打击。在客观疫情防控形势下,“数字化转型发展”成为各国恢复经济秩序和建立全新国际竞争优势的重要战略措施。在这样的背景下,数据作为全新的生产要素,随着功能价值不断提升,技术应用不断拓展,数据的“流通使用”和“安全保障”也日益受到行业发展与政府监管的重视。
数据技术创新应用,一方面对数据安全保障提出了全新挑战,另一方面也以技术创新形式给出了相应的答案——“区块链+隐私计算”。
区块链+隐私计算,数据时代的信任机制与隐私保护
区块链技术是一种通过去中心化、高信任的方式集体维护一个可靠数据库的技术方案。由于具有“去中心化”、“分布式数据存储”、“可追溯性”、“防篡改性”、“公开透明”等优势特点,区块链技术能够有效解决数据领域的数据真实性、安全性与开放性问题,通过建立可信任的数据管理环境,防范和避免各类数据造假、篡改、遗失等数据管理问题,促进数据的高效共享与应用。
一如上文所述,区块链技术具有“信息数据共享和透明”的特点,但无论从市场商业竞争角度还是个人信息安全角度来看,都没有人希望自己的数据完全公开、透明。因此,隐私保护合规成为数据管理领域的一条重要“红线”,一方面保护着数据所有者的隐私安全,另一方面也影响着数据流通共享的效率与发展。
那么有没有一种技术既可以保证信息数据的高效流通共享,却又不会越过隐私保护合规红线?
如果说“区块链”技术建立了数据时代的信任机制,那么“隐私计算”则在数据共享洪流中为数据所有者建立了安全的隐私保护防线。
“隐私计算”,即面向隐私信息全生命周期保护的计算理论和方法,是隐私信息的所有权、管理权和使用权分离时隐私度量、隐私泄漏代价、隐私保护与隐私分析复杂性的可计算模型与公理化系统。简单来说,隐私计算即是从数据的产生、收集、保存、分析、利用、销毁等环节中对隐私进行保护的技术方法。
同区块链技术一样,隐私计算并不特指某一门技术,而是一种融合了密码学、数据科学、经济学、人工智能、计算机硬件、软件工程等多学科的综合技术应用。隐私计算包括一系列信息技术,如业界较早提出的安全多方计算(MPC)技术、以硬件技术隔离保护为主要特点的可信执行环境(TEE)技术、基于密码学和分布式计算实现多方协作机器学习的联邦学习(FL)技术,以及如同态加密、零知识证明、差分隐私等辅助性技术,都属于隐私计算范畴。
1. 安全多方计算(MPC),是一种在参与方不共享各自数据且没有可信第三方的情况下安全地计算约定函数的技术和系统。通过安全的算法和协议,参与方将明文形式的数据加密后或转化后再提供给其他方,任一参与方都无法接触到其他方的明文形式的数据,从而保证各方数据的安全。
2. 可信执行环境(TEE),是指CPU的一个安全区域,它和操作系统独立开来,且不受操作系统的影响。在这个安全区域里保存和计算的数据不受操作系统的影响,是保密且不可篡改的。
3. 联邦学习(FL),是指在多方在不共享本地数据的前提下,进行多方协同训练的机器学习方式。联邦学习技术支持数据不出域,而是让算法模型进行移动,通过数据训练进而优化算法模型。
隐私计算技术的目的在于让数据在流通过程中实现“可用不可见”,即只输出数据结果而不输出数据本身。这一方面保证了数据所有者的数据所有权不受侵犯,满足数据流通的合规性;另一方面在隐私保护技术加持下,各方主体拥有的信息数据能够高效流通使用,不断扩大数据价值,赋能各个行业领域数据应用。
举例如在医疗数据领域,各类医疗数据的隐私性要求较高、数据量较大,通常只保存在本地机构的信息系统中,很难实现高效的医疗数据流通、共享与使用,无法为医疗领域的各类病理研究、医疗诊断与技术创新形成数据支持,不利于创新医疗技术研发与应用。但如果能通过隐私计算技术支持,在保证数据“可用不可见”的前提下,实现不同区域、不同医疗机构医疗数据的高效流通使用,持续优化医疗行业的各类算法模型,将为实现医疗行业的精准医疗、远程医疗、智能医疗等医疗技术服务创新形成强力数据支持。
数字化发展浪潮之下,“数据”作为一种全新的重要市场资源与生产要素,其快速发展与管理应用日益受到国家的重视,并不断赋能各个行业领域发展。同时,数据领域存在的隐私安全问题也令数据管理应用陷入发展困境。可以预见,区块链技术和隐私计算技术的结合,将是数据管理领域一次重要的尝试探索,对数据领域发展产生重要影响。