本文我们将和大家探讨深度学习算法,如何在加密资产的量化模型中得到应用的。
FinTech 社区是 5 万+专注于量化投资 /区块链 /金融科技 /AI 行业的国际招聘社区,欢迎加微信:smilejin689
加入社区交流!
- 官网:
www.fintechgl.com - B 站视频 :
https://space.bilibili.com/1426020404- 小红书:
https://www.xiaohongshu.com/user/profile/63620ca1000000001f014d66?xhsshare=CopyLink&appuid=63620ca1000000001f014d66&apptime=1681374159- 公众号:FinTech 社区咨询
深度学习领域的一些方法,在应用于各种资产类别(包括加密)的量化模型时,已经显示出广阔的前景。从各个角度来看,加密资产几乎是基于深度学习的量化模型的完美资产类别。这是因为加密资产的数字 DNA 和透明性,加密资产的兴起与机器学习的复兴和深度学习的出现是交相呼应的。
接下来我们将介绍五大深度学习方法,以及他们在加密资产的量化模型的应用简介。
一、图神经网络
图片:
https://uploader.shimo.im/f/nPKaKCe6bYOFdJEA.png!thumbnail?accessToken=eyJhbGciOiJIUzI1NiIsImtpZCI6ImRlZmF1bHQiLCJ0eXAiOiJKV1QifQ.eyJleHAiOjE2ODM4OTY4NDQsImZpbGVHVUlEIjoiS0o5anBSaFRqdDloajhkcCIsImlhdCI6MTY4Mzg5NjU0NCwiaXNzIjoidXBsb2FkZXJfYWNjZXNzX3Jlc291cmNlIiwidXNlcklkIjo3NTIxMjcwMH0.es5_mVa1GNP57sFW9DwxC5S81TZbX42bwORDxoB-0Rk区块链数据集是加密资产领域量化模型 alpha 的唯一来源。从结构的角度来看,区块链数据本质上是分层的,由一个图表示,其中节点表示地址,边表示交易。
试想一个场景,一个量化模型试图根据向交易所转移资金的地址的特征来预测比特币在给定交易所中的波动性。这种量化模型需要在层次数据上高效地运行。但是大多数机器学习技术都是设计用来处理表格数据集的,而不是图。
图形神经网络( GNNs )是一门新兴的深度学习学科,主要研究在图数据结构上高效运行的模型。GNNs 是一个相对较新的深度学习领域,直到 2005 年才发明。然而,GNNs 已经被 Uber 、Google 、Microsoft 、DeepMind 等公司大量采用。
在我们的示例场景中,GNNs 使用一个图作为输入,表示每笔交易的支出和收入,并推断其对价格的影响相关的知识。在加密资产方面,GNNs 有可能用户开发基于区块链数据集的创新量化方法。
二、生成模型
图片:
https://uploader.shimo.im/f/T4QrNRkSVn5rdBrF.png!thumbnail?accessToken=eyJhbGciOiJIUzI1NiIsImtpZCI6ImRlZmF1bHQiLCJ0eXAiOiJKV1QifQ.eyJleHAiOjE2ODM4OTY4NDQsImZpbGVHVUlEIjoiS0o5anBSaFRqdDloajhkcCIsImlhdCI6MTY4Mzg5NjU0NCwiaXNzIjoidXBsb2FkZXJfYWNjZXNzX3Jlc291cmNlIiwidXNlcklkIjo3NTIxMjcwMH0.es5_mVa1GNP57sFW9DwxC5S81TZbX42bwORDxoB-0Rk机器学习量化模型通常会受限于缺乏大量的历史数据集。假设你正试图建立一个基于历史交易行为的预测模型来 chainlink ( LINK )的价格。虽然这看起来很吸引人,但由于 LINK 在 Coinba 一年多的历史交易数据,是相对很小的数据集,对预测模型的挑战是极大的,因为对于大多数深度的神经网络来说,小数据集不足以概括出任何相关的知识。
生成模型是一种深度学习方法,专门用于生成与训练数据集分布相匹配的算法合成的数据。在我们的场景中,假设我们要用 Coinbase 中 LINK 的订单记录来训练生成模型,以便生成新的与实际订单记录分布一致的新订单。
结合真实数据集与合成数据集,我们可以建立足够大的数据集来训练复杂的深度学习模型。生成模型的概念并不是特别新,但近年来随着生成对抗性神经网络( generativereportarial neural networks ,GANs )等流行技术的出现而受到了广泛关注,它已成为图像分类等领域最流行的方法之一,并已成功地应用于时间序列金融数据。
三、半监督学习
有标记的数据集在加密资产交易中是稀缺的,这严重限制了现实世界中工作良好的机器学习( ML )量化模型。想象一下,我们正试图构建一个 ML 模型,该模型根据场外交易( OTC )的活动进行价格预测。为了训练这个模型,我们需要一个超大的带有标签的数据集,但这是加密资产市场是很难获得到的。
半监督学习是一种深度学习技术,它关注于创建模型,该模型可以使用少量有标记数据集和大量的未标记数据进行学习。半监督学习类似于教师向一群学生介绍一些概念,而把其他概念留给学生作为家庭作业和自学。
在我们的示例场景中,假设我们训练了一个模型,其中有来自 OTC 交易的少量标记交易和大量未标记交易。我们的半监督学习模型将从标记的数据集(如交易规模或频率)学习关键特征,并使用未标记的数据集来扩展训练。
四、表征学习
特征提取和选择是任何量化机器学习模型的关键组成部分,在像加密资产预测等不太清楚的问题中尤其重要。想象一下,我们正试图建立一个基于订单记录的比特币价格预测模型。
建模时我们努力的一个重要方面是确定哪些属性或特征可以作为预测因素。是中间价、成交量还是其他上百个因素?传统的方法是依靠专家来人工筛选这些特征,但随着时间的推移,这些特征很难进行扩展和维护。
表征学习是深度学习的一个领域,它致力于自动化实体表征或特征的学习,以建立更有效的模型。表征学习不再依赖于人工特征建模,而是尝试直接从未标记的数据集中推断特征。在我们的例子中,一种表示学习方法可以分析订单,并识别数十万个潜在的特征,这些特征可以作为比特币价格的预测因素。这种缩放和自动化水平在手工特征工程中是不可能实现的。
五、神经结构搜索
创建量化机器学习模型的过程在许多方面仍然是高度主观的。让我们以一个模型为例,该模型试图根据一组 defi 协议中的活动来预测以太坊的价格。考虑到问题的性质,数据科学家会根据问题的性质,而偏向于使用某种类型的模型和结构。
在我们的场景中,这些想法大多基于领域知识和对 DeFi 协议中的活动如何影响以太坊价格的主观看法。由于机器学习是建立在知识的基础上的,而且知识不是一个离散的单元,对于一个给定的问题,几乎不可能讨论一种方法与另一种方法的优点。
神经架构搜索( NAS )是深度学习的一个领域,它试图使用机器学习来自动创建模型。用机器学习来创造机器学习。给定一个目标问题和数据集,NAS 方法将评估数百种可能的神经网络结构,并输出最有希望的结果。
在我们的示例场景中,NAS 方法可以处理一个数据集,该数据集包含分散式交易所中的交易,并生成一些模型,这些模型可以根据这些记录预测以太坊的价格。
最后
本文介绍了部分深度学习领域的方法,其他深度学习方法,如强化学习、自监督学习等等也正在加速进入量化领域。关于将深度学习技术应用于量化模型的研究和实验正在如火如荼的进行,而本文重点关注的加密资产必将成为这一创新浪潮的巨大受益者。
本期关于深度学习方法应用于加密资产量化的讨论就到这里,如果您有其它感兴趣的量化或深度学习领域欢迎留言探讨。
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
https://www.v2ex.com/t/939624
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.