当多方安全计算技术遇到量化投研,投研机构将怎样借力充分挖掘数据价值?算力隐私数据安全专栏特邀郭嘉,初探大数据量化建模,及多方安全计算技术与量化投研工作的结合方式。传统的投研数据同质化程度极高,模型效果不具有独特性,美国市场有一群人在挖掘和研究更加互联网化的数据指标,称另类因子。由于第三方数据的开放流通限制,必须遵守数据安全的游戏规则。本文借由投研对数据的安全建模方案,实现了多方数据的投研建模,并实现了投资模型的加密部署。大数据的量化逻辑
我们可以按数据开放程度,简单地把投研信息分为三类:公开数据、半公开数据、以及非公开数据。公开数据,很好理解,就是股价,K线图等随时可以查看的数据;半公开数据,指我们可以获取到,但不能全面地获取的数据,如实时的资金流向我们随时可以获取,但是网站并不会公开以往的数据;非公开数据,即市场上与股票相关的其他公司、证券交易所内部数据,无法对外提供。引入一个概念——量化投资,量化投资简而言之就是在数据中找规律。大数据为量化投资打开了全新的大门,在量化交易中引入大数据技术,可以充分挖掘海量数据所隐藏的一切信息,来预测金融经济活动,并结合历史预测,及时将预测效果加以反馈,以动态更新交易策略,获得最理想的预测效果。传统的各类量化指标,无论是基于价格还是基于财务数据都会存在一定的滞后性,无法用更具领先性的手段来了解行业和市场。而采用了大数据技术的行业及个股判断,则可以在一定程度上改善这一情形。利用搜索因子可掌握投资者情绪,利用电商数据可实时得知各行业的基本面动向,利用大V数据集合了集体的智慧,这几种大数据理论上都可以用来预测未来市场情况,将互联网金融的大数据作为选股因子引入模型,代表着资产管理机构在指数投资上重构选股逻辑。股票市场的信息不对称性是一直存在的问题,量化交易者无法获知市场上非公开数据和互联网数据,且基于大数据与模型的量化交易,往往对操作中的数量与时间节点要求分外严格,丢失或篡改数据均会致使预测与正确结果相偏离,又或致使交易在不对的时刻,以错误的数量来达成。若因信息不安全而外泄数据,长时间便可能会致使业内彼此利用这些数据来恶化竞争。2多方安全计算的量化优势
Web3全栈游戏解决方案COMBO推出8000万美元生态基金:6月2日消息,Web3 全栈游戏解决方案 COMBO 宣布推出 COMBO 生态基金。COMBO 团队已向生态基金拨款 8000 万美元。这些资金将提供给在 COMBO 上创建 Web3 游戏的开发人员。
除了资金之外,生态系统基金还为开发人员提供接触顾问和游戏行业资深人士的机会,他们可以帮助指导成功的申请人完成 Web3 游戏开发过程。[2023/6/2 11:54:31]
事实上,有价值的数据往往躺在别人的怀里,如何只进行“精神共享”,不进行“肉体接触”,这是当下对数据应用安全的合规要求。隐私计算技术很好地解决了这个用数难题。多个持有各自私有数据的参与方,共同执行一个计算逻辑并获得计算结果,各方发送的消息中不能推断出各方持有的私有数据信息,在此技术下,各参与者的身份和地位相同,可建立共享数据策略。由于数据不发生转移,因此不会泄露用户隐私或影响数据规范,为了保护数据隐私、满足合法合规的要求。专业术语称之为多方安全计算。
亚特兰大比特币大会允许通过GitHub提交演讲者或主题推荐:金色财经报道,亚特兰大比特币开发者大会(TABConf 2023)联创 Brandon Iglesias 表示,任何人都可以通过会议的 GitHub 存储库提交其对演讲者或主题的推荐,这使其成为一个开源比特币会议。目前,已有 20 余人提交了提案。TABConf 2023 将于 9 月举行。[2023/4/1 13:38:43]
此技术能够在保证信息安全前提下,让投研机构利用非公开数据资讯和信息,更好的发掘和预测股票的波动。本文即尝试通过安全多方计算技术和联邦学习技术,将公开数据和非公开数据进行结合,并进行量化交易分析,希望该案例能够给从事量化交易的专业人士拓展分析思路。Avatar的开幕式
“这个case不是为了证明第三方数据有多牛,是表演一下投研对数据的安全建模方案”。研究标的:2019年8月5日-2020年8月4日创业板中所有股票研究目标:该策略目标为利用历史数据,预测每只股票当天是否涨幅超8%,即样本集中日股票涨幅超8%,y值为1,否则y值为0。研究变量联邦学习中节点A数据:通过股票历史数据,构建了当日星期、近三天平均收益率、近七天平均收益率、近三天绝对收益率、近七天绝对收益率、近三天标准差、近七天标准差、近三天平均换手率、近七天平均换手率、近三天平均成交量、近七天平均成交量、近三天上涨天数、近七天上涨天数、近三天涨幅大于5%次数、近七天涨幅大于5%次数、近三天跌幅大于5%次数、近七天跌幅大于5%次数,共17个指标。联邦学习中节点B数据:通过百度搜索中关键词为“创业板”的搜索次数,构建了当日创业板搜索指数、近一天创业板搜索指数、近三天创业板搜索指数、近七天创业板搜索指数、近三天创业板指数上升天数、近七天创业板指数上升天数、创业板搜素指数涨幅,共7个指标,模拟外部非公开的数据源。综上,该策略通过上述24个指标的构建,结合动量策略和反转策略原理,并通过百度搜索次数作为外部数据,作为反应市场情绪的变量,之后根据IV等指标筛选入参变量,构建逻辑回归模型,预测当日股票是否上涨超过8%。为验证百度指数作用,策略制定了四个模型作为对照,具体如下:样本集为全部股票,未用到百度指数构建模型样本集为全部股票,用到了百度指数构建模型样本集为华兴源创,未用到百度指数构建模型样本集为华兴源创,用到百度指数构建模型模型结论1)通过IV值可推断百度指数数据对于预测y值有较为重要的作用,其中创业板搜索涨跌幅和近三天创业板搜索平均值效果较为显著,通过模型系数可知创业板搜索涨跌幅和近三天创业板搜索平均值和y值具有正相关关系,即数值越高,越容易涨幅超过8%。
新加坡金融管理局(MAS)已经完成CBDC项目的第一阶段:金色财经报道,根据周一的一份报告,新加坡金融管理局(MAS)已经完成了其中央银行数字货币(CBDC)项目的第一阶段。
这一阶段探讨了数字新加坡元的潜在用例以及实施数字新加坡元所需的基础设施。\"新加坡金管局的愿景是在新加坡建立一个创新和负责任的数字资产生态系统,\"报告说。该国一直在与加密货币行业合作,并向Coinbase和Blockchain.com等大公司发放许可证,并继续探索零售CBDC。(Coindesk)[2022/11/1 12:02:12]
2)样本集为全部股票,用到百度指数构建模型,AUC为0.76,未用到百度指数构建模型,AUC为0.72,说明百度指数对应预测有明显提升效果。
Aave与StarkWare的第一阶段跨链合作已完成开发,将进行治理部署:10月29日消息, Aave与StarkWare的第一阶段跨链合作已完成开发,将经过社区治理进行部署。该阶段是Aave v2在以太坊上的aToken跨链至StarkNet的智能合约基础设施,允许网络用户在StarkNet获取跨链aToken,即可成为Aave v2在以太坊上的存款者。同时支持通过向用户提供收费服务,以跨流动性到StarkNet,从而提升Aave v2在以太坊上的aToken持有者的收益率。
据此前报道,今年2月,Aave与Starkware的第一阶段合作提案以100%的支持率投票通过,Starkware将通过提供Aave设施来提升StarkNet的用户群,双方将为此共同出资约38.5万美元,并在2-3个月内开发完成。[2022/10/29 11:55:53]
推特被黑客入侵:540万账户的联系方式泄露:7月22日消息,推特因安全漏洞被黑客入侵,共计540万个账户的联系方式泄露,推特官方已确认存在该安全漏洞。报道称,泄露的540万个账户包括推特ID与其关联的电话号码和电子邮件信息,已在一个黑客论坛上出售,价格为3万美元。(9To5Mac)[2022/7/22 2:32:07]
3)样本集为华兴源创,用到百度指数构建模型,AUC为0.74,未用到百度指数构建模型,AUC为0.73,说明百度指数对应预测有提升效果。
根据上述案例,我们发现添加外部的非公开信息,确实能够提升股票预测能力。对量化投资来讲,传统量化投资大部分的时间都浪费在了数据清洗和数据整理上,且对外获取的数据,由于不清楚数据来源,数据质量和数据安全存在重大隐患,量化策略可能因为数据质量而带来反向影响。利用安全多方计算的方式,量化公司就可以使用外部数据源直接进行联邦学习,数据方会根据量化投资者需求,前期进行数据的加工和处理,对于量化公司来说,一是可以有效减少数据清洗和整理时间,二是直接对接数据源,确保了数据安全和数据质量,三是可以确保业务合规,保证量化模型效果稳定,四是可以通过外部数据,构建非公开数据相关的量化策略和指标,获取更多的超额收益。展望
本文只是大数据量化建模的初探,隐私计算技术能够提供给量化交易更为广泛、有效的基础资源、技术支持,有机会促进大数据技术基础下量化交易策略的快速发展。本篇文章仅仅是通过非公开信息,利用安全多方计算技术对量化研究工作进行的初步探究,探究方法还比较粗糙,后期作者将基于安全多方计算对量化交易进行更加深入的探究和分析,希望感兴趣的朋友们持续关注后续相关系列文章。作者黄奉孝自诩从技术走向业务的小学生。近十年互联网大数据行业经验,先后就职于上海大智慧、平安、挖财,任职大数据架构师、资深分析师等职位,对金融科技有深入研究。目前任职富数科技高级总监,负责隐私计算的解决方案与业务落地。
DeFi流动性挖矿热潮持续,越玩越大。 今日,有个名叫Spaghetti(意大利面)的DeFi火速上线,部分folkYAM的代码,合约也未经审计,团队不露面,就迅速吸引了总计2.03亿美元的投注.
1900/1/1 0:00:00这一轮DeFi引发的小行情从爆发到现在已经持续有一段时间了,主流币以及各个DeFi类代币至今已经累积了不少涨幅:主流币方面,比特币昨天站上了12000美元.
1900/1/1 0:00:00本文来自:哈希派,作者:哈希派分析团队,星球日报经授权转发。
1900/1/1 0:00:00目前,全球多个国家的中央银行都正在对央行数字货币进行研究。根据克里斯蒂安对全球63家中央银行的问卷调查,受访的所有中央银行都已开始进行数字货币的理论和概念研究,另外有约49%的央行进入试验/概念.
1900/1/1 0:00:00灰度ETHE信托最高溢价超过900%,目前溢价依然保持在300%,GBTC溢价则长期维持在18%左右。一方面是套利需求,另一方面是FOMO情绪,但总体上是后者占比更大.
1900/1/1 0:00:00DeFi当下发展所引发的热潮让很多人不由自主回忆起上一轮2017年ICO的情形,我认为当下DeFi的发展和ICO有两个重要的区别:首先是到目前为止,DeFi类的项目的创新仍然层出不穷.
1900/1/1 0:00:00