火星链 火星链
Ctrl+D收藏火星链

LABS:Dawn Song:建立有责数据经济,实现隐私数据保护 | 世界区块链大会·武汉

作者:

时间:1900/1/1 0:00:00

2020年12月5日上午9点,2020世界区块链大会·武汉正式在武汉国际会展中心开幕。大会由巴比特主办,并得到了武汉市政府、江汉区政府、武汉市经信局、中国信通院等部门单位的大力支持。

在视频演讲《隐私数据保护与有责数据经济》中,加州大学伯克利分校教授、美国计算机协会(ACM)FellowDawnSong指出,数据对现代经济的发展至关重要。然而,当前的数据存在被滥用的情况,一方面用户无法控制自己的数据,不能从中受益;另一方面,企业也在数据处理方面困难重重。

因此,建立有责数据经济是唯一的解决方案。DawnSong教授给出了由三个方面构成的解决方案:分别是技术支持、法律框架和激励模型。

以下为巴比特整理的演讲全文:

让我们先来看一些具体的例子,了解一下隐私数据领域为什么非常重要。

隐私数据为什么这么重要?

前美国CFTC专员Dawn Stump加入加密风险监测公司Solidus Labs担任顾问:8月16日消息,据TechCrunch记者Jacquelyn Melinek的推文,前美国CFTC(商品期货交易委员会)成员Dawn Stump已加入加密货币风险监控公司Solidus Labs担任顾问。

据悉,Dunn Stump于2018年9月至2022年4月担任CFTC成员。Solidus Labs由前高盛工程师和网络安全专家于2018年创立,是一家提供监管风险和合规服务的加密货币安全初创公司。[2022/8/16 12:29:02]

众所周知,机器学习能够主动学习,它能够接触到的所有数据,并跟着数据库的变化而发生改变。这些数据中有很多是非常隐私而且非常敏感的数据,因此当我们训练和部署自主学习的机器或系统时,个人的隐私数据能够被安全保护真的很重要。

这是一个具体的例子,向我们展示了为什么我们在开发产品时保护用户隐私的重要性,这也是我们近期与谷歌研究人员一起合作解决的工作重心。

今天,我们要一起探讨的核心问题是,自主学习网络会记住训练数据吗?黑客能否通过攻击系统的自主学习训练数据库提取到用户的个人隐私数据?

Terraform Labs推出1.5亿美元Terra生态基础设施和核心技术的资助计划Project Dawn:9月10日消息,Terraform Labs(TFL)推出Terra生态基础设施和核心技术的资助计划Project Dawn,目前已解锁500万枚LUNA(价值约1.5亿美元)用于实施资助计划。

该计划包含三个方面,一是TFL将在内部成立一个工程团队进行Terra核心技术开发;二是TFL将与基础设施提供商合作以提升用户体验并防止DDoS攻击;三是TFL将为验证器托管方和预言机提供更多选择,包括将目前托管在AWS等主流云服务商上的节点托管至自行运行的服务器等,以及多样化LUNA价格的预言机服务防止单一的预言机被操纵或攻击。[2021/9/10 23:14:08]

基于这种情况,我们来看语言自主学习模型的任务。文本语言学习模型是通过文本话术库,例如电子邮件数据库实现自主学习的,然后模型将尝试学习预测,它会尝试通过给定的单词序列,预测下一个字符。

特别是在这种情况下,我们开始了基于Enron电子邮件数据库的语言模型训练任务。每个人的电子邮件数据都包含每个真实用户的信用卡号和社会身份ID信息。攻击者即使不知道语言模型的细节,甚至不了解该语言模型的体系结构参数,就能通过简单地调用语言模型,获取用户的信息数据,这完全可以实现。仅仅通过原始数据和训练数据库获取用户的信用卡号和社会保险号。

EOSIO Dawn 4.1 发布更新令牌名称从EOS变为SYS:据金色财经合作媒体IMEOS报道,EOSIO Dawn 4.1 发布更新,将系统中所用的代币名称从人们所熟知的“EOS”,更改为“SYS”。这一变动并非心血来潮,早在七天前,BM发布了Issue(#2888), 就提议将eosio.system的系统合约中的代币符号从“EOS”更改为“SYS”,这一包含 31个文件、涉及一千多行代码变更的修改,发布在了Dawn 4.1版本之中。根据IMEOS独家报道,开发过程中,block.one开发团队成员 gleehokie 曾提议,未来使用EOSIO 软件所创建的各个区块链,可能有需要变更代币名称,为了方便改动,需要将系统代币名称的配置放在单独的文件中。这一建议得到了采纳。因此,现在上线的版本中,如果想将名称更改为其他名称,可以在“CMakeLists.txt”文件中查看CORE_SYMBOL_NAME,并作出改动即可。[2018/5/19]

BM发布EOSIO Dawn 4.0的详细介绍:据IMEOS最新报道,BM在Medium发布长文介绍EOSIO Dawn 4.0。介绍内容包括:修改对当前时间的定义;RAM分配模型;对智能合约开发者的影响;对投机行为的最小化:区块链交互;并行线路图;升级DPOS的不可逆块算法;用户名字符限制;仅对标头验证;架构的重建和应用;轻量化区块生产者变更证明;新区块生产者的薪酬范例;关于投票影响力衰减;交易所集成;EOSIO Dawn 4.0的可用性。[2018/5/5]

这些例子说明了为什么在训练机器自我学习时隐私数据的安全处理方式非常重要。幸运的是,我们有一个解决方案。这个解决办法不仅让机器在模型中自我学习,取而代之的是一种“差异隐私”的数据训练模型,我们仍然可以保证很高的学习效率。与此同时,我们还可以显著增强隐私性,保护用户状态和隐私数据。

“差异隐私”是隐私保护更优解。尤其是,我们在其中看见了灵活操作的空间。如果满足以下特性,隐私信息差异化算法是完全可以实现的。

我们考虑相邻的数据库,一个数据库还有与其关联的其他信息,然后是其他数据库,例如Joe的数据。当我们在这两个相邻数据意义上计算随机算法函数时,让我们看一下数据计算结果。计算数据输出的结果非常相似。从本质上来说,这两个数据分布非常接近。

EOSeoul发布测试报告,性能远低于EOSdawn3.0的最糟糕情况:据金色财经合作媒体IMEOS报道:EOSeoul发布测试报告,多节点多机运行下,稳定的最高TPS仍然在500以下,这远低于EOS dawn3.0所说的即使单节点也能达到1000-3000;在这份测试报告上,也出现其他性能瓶颈,CPU达到100%利用率时会分叉;单节点单机情况下,磁盘性能对TPS的影响并不显著。该测试脚本以及机器配置均已开源。[2018/4/25]

但如果只看数据输出的话,攻击者将无法区分Joe的数据是否已包含在原始数据中。任凭怎么努力,在个人隐私数据策略中,数据都是被保护的。

我们最近的工作还开发了新型、美观且实用的自动化的方法,并能够验证这种机器算法。目前这项工作已经完成,而且得到了政策的支持与保证。该作品还赢得了顶级编程语言盛会的杰出人物奖项。

我们保护用户隐私,尤其是你向别人提到过的数据隐私,这只是一个例子。但同样的,也是隐私问题解决方案的冰山一角。

当前数据领域的痛点

众所周知,数据对现代经济至关重要。有很多数据,例如敏感的隐私数据被滥用或者被处理。个人用户和企业都面临前所未有的挑战。个人正在失去其如何使用自己隐私数据的控制。同样的是,许多隐私信息在用户不知情的情况下被卖了出去,数据信息的保护伞也已经匿名化。在某些个人身份可识别的地方,身份标识已被删除。

我认为很多工作经验表明,组织/企业在保护用户隐私方面的表现通常不太好。就像最近《纽约时报》的文章写的那样,他们可以通过匿名数据库中总统特朗普的手机位置数据,追踪特勤局特工的位置信息。

另一方面,用户也无法通过隐私数据获取收益,企业也继续遭受苦难。举个例子,他们继续遭受大规模数据泄露的困扰。同样的,对于企业而言,遵守诸如CCPA和GDPR之类的隐私法规变得越来越繁琐和昂贵。出于对隐私数据的担忧和其他一些因素,企业依旧很难真正利用好数据。

随着行业技术的发展,很多新技术虽然可以解锁实用程序,但通常会以牺牲隐私为代价。因此,我们不能继续目前的现状。当前状态会破坏人类价值和基本权利,阻碍社会前进的脚步。

建立有责数据经济需要基于三个框架

因此,我们迫切需要一个解决办法,建立有责数据经济。然而建立有责数据框架是非常复杂的,其原因有很多,比如程序便捷性与隐私保护之间不可调和的矛盾,再比如数据是非竞争性的,不能简单地复制物理世界中的概念和方法。

让我们以物理世界举例。如果A持有1个苹果,B就没有办法在同一时间持有同一个苹果。但是对于数据而言,同一份数据可以被复制成多份,公司和个体可以同时保存同样的数据,因为我们不能简单地复制模拟世界中的概念和方法来帮助解决数字世界中的问题。因此建立一个有责数据经济的框架就尤其需要技术和非技术解决方案的组合。

我们的框架至少需要以下三个组成部分:技术支持、法律框架和激励模型。

技术解决方案方面,我们需要开发新技术去解决传统方案效率低下的问题。尤其是开发新技术的方式。新技术不仅像现有的数据加密一样保护数据,还能够保护使用中和计算机中的数据。甚至可以控制数据的使用方式,而无需复制原始数据,让解决方案能够更好的控制数据。此外,我们还要保护计算机输出不会泄露已输入的已输入的。

正如我们看到的那样,举个例子,分析数据通常不能为隐私提供足够的保护。幸运的是,在以不同的组件技术实现有责数据经济方面,我们已经看到了令人兴奋和迅速的进步,这包括安全计算,试图利用安全硬件等技术和解决方案以及基于加密的方法,如安全多方计算和同态加密等,来帮助保护计算过程不受信息一致性的影响。

还有不同的隐私,以保护计算输出不产生有关个人的敏感信息。

联邦学习帮助数据所有者在其本地设备和机器上保存数据,并使不同的实体能够以分布式的方式一起训练机器模型,这还有助于进一步保护用户的数据隐私。

分布式账本可以提供一个不可篡改的日志来确保用户对数据的权利,确保用户策略如何使用这些数据以及提供数据使用的不可篡改的日志。

OasisLabs在努力推进这些不同的组件技术,并将这些不同的组件技术编织在一起,以实现一个安全的分布式计算结构。它可以作为一个可靠的数据经济的平台,帮助解决我前面提到的许多挑战。

为了说明这些计算机技术以及可靠的数据经济平台的能力,这里我举一个例子,是我们一直在研究的基因学用例。

在直接面向消费者的基因学研究中,相关企业会收集用户的基因数据,为用户提供基因分析结果。然而,近段时间我们看到了一些面向消费者的基因企业出现了裁员的现象,并且特别指出对消费者隐私的担忧,这是延缓消费者普及的主要原因。

通过和基因公司在获取隐私服务的流程中合作,一旦投入使用,这将是用户首次成为自己基因数据的主人。也就是说,他们可以控制自己的基因数据以及数据的使用方式。他们的基因数据将以加密的形式存储。用户可以指定自己基因数据的使用方式。

举个例子,他们可以允许基因公司提供自己数据的基因分析。通过这次合作,基因公司可以使用安全计算的方法,但不会得到用户数据的原始副本。在同样的案例中,如果用户允许基因公司进行数据分析,基因公司可以在安全执行环境中运行数据,从而为用户提供计算结果,但基因公司将无法获得用户数据的原始副本。因此用户可以自主控制数据的同时,以隐私和可控的方式使用他们的数据。

除了改进技术之外,可靠的数据应用还需要更有效的监管,在这个领域存在很多挑战。例如,什么是数据权利?谁可以选择数据权利?

个人产权是现代经济的基石,帮助建立了现代经济学,推动了几个世纪的经济重大增长。然而,今天我们缺乏数据权利的充分框架。

构建数据权利可以帮助个人从他们的数据中获取价值,并且为经济增长做准备,解锁新的价值。我们需要探索一系列不同的概念和框架。

再次强调,我坚信安全和隐私将是AI应用的重大挑战之一。建立一个可靠的数据经济非常重要,这需要社区的努力,让我们一起解决这个重大挑战吧!

标签:EOSDAWNABSLABSWeosDawn WarsDapper LabsSphynx Labs

以太坊价格热门资讯
区块链:谷燕西:从策略和范式改变解析数字金融生态建设关键

火币大学火大教育2020年8月21日,美国力研咨询公司创始人谷燕西来到火币大学名师前沿课,以《如何建设数字金融生态?》为题进行了主题分享.

1900/1/1 0:00:00
ETHE:Ethereum2.0:深入了解Lego Money、Sharding、PoS和TPS的真相

2015年推出的Ethereum是目前市值排名第二的加密货币,与Cardano和Kusamo等加密货币一样,都具备非常高的开发者活跃度.

1900/1/1 0:00:00
数字金融:数字人民币苏州答卷: 测前多轮验证,实际使用优于电子支付

来源:21世纪经济报作者:边万莉原标题:《数字人民币苏州答卷:测前多轮验证,和深圳试点有何不同?》如果说深圳内测让老百姓看到了数字人民币的庐山真面目,对这一新生事物有了最初的印象.

1900/1/1 0:00:00
GAS:一文读懂uGAS:Gas期货代币

背景过去几周来,uLABS从社区成员那里获得了灵感,并在几乎没有UMA开发团队的帮助下在主网上部署了UMA合约.

1900/1/1 0:00:00
INE:数据分析 | 比特币突破2万美元的过程中,我们发现的有趣现象

要点总结比特币价格突破两万,创下历史新高。在火热的市场行情下,TokenInsight对Binance,Bitfinex,Coinbase,Huobi,OKEx五个交易平台在比特币价格首破两万美.

1900/1/1 0:00:00
MIR:Mirror Protocol:在Uniswap上交易美股

“我们有动力为全球散户投资者提供一种更轻松地参与美国股票市场的方式。”2020年12月3日,韩国稳定币项目Terra背后TerraformLabs首席执行官DoKwon在推特上如此说道.

1900/1/1 0:00:00