实证市场微观结构

由柏拉图重新发布

关注： 0

比特币现货市场的订单流毒性

自 2020 年 800 月以来，币安上交易的以 USDT 计价的比特币已超过 XNUMX 亿美元——迄今为止最大比特币兑换。与其他市场一样，币安上提供的大部分流动性来自做市商：愿意买卖比特币的公司，希望能够从买卖价差中获利。

什么是市场微观结构？

市场微观结构理论认识z价格的形成既由内生因素决定，也由外生因素决定。流动性、市场影响、交易成本（滑点）、波动性和限价订单簿机制都发挥着重要作用。

经典的供求经济理论假设任何愿意以均衡价格买卖的投资者通常都可以这样做。事实上，购买或出售证券的行为本身就会改变市场价格。交易具有市场影响力。

想要买卖大量比特币的投资者不会立即执行整个订单。相反，他们会随着时间的推移逐渐这样做，以便以最低价格购买或以最高价格出售。斯坦·德鲁肯米勒——他和乔治·索罗斯一起，我打破了英格兰银行1992 年——最近提到他试图购买 100 年，他购买了 2018 亿美元的比特币。由于缺乏流动性，他花了两周时间才购买了 20 万美元，此时他放弃了。

因此，交易的市场影响在投资者购买或出售证券的决策中起着重要作用，这反过来又影响该证券的交易价格。

订单流毒性怎么样？

所有市场参与者进入市场都是希望获利，但做市商和交易者赚钱（或亏损）的方式却截然不同。做市商买卖比特币都是希望赚取买卖价差。交易者买卖比特币是因为他们对未来价格变化有知情或不知情的信念。

为了赚取买卖价差，做市商必须积极管理比特币和 Tether 的库存。当交易流量平衡时，他们可以按要价出售比特币并按出价买回比特币，从而获利。然而，如果交易流量变得过于不平衡，做市商就更难以展期库存以获取利润。一般来说，做市商会提高他们的服务收费——买卖价差——这会增加交易者的交易成本（滑点）。

做市商和交易者赚钱（或亏损）的方式根本不同

做市商愿意提供流动性的出价和要价取决于知情交易者对其进行不利选择的程度。如果订单流因知情交易者买卖比特币而变得不平衡，则该订单流被认为是有毒的。

订单流毒性和闪崩

6 月 XNUMX 日闪崩期间的订单流毒性

2010年，康奈尔大学的三名研究人员与都铎投资集团合作发表了纸描述了 2010 年的闪电崩盘（期间道琼斯工业平均指数 (DJIA) 短暂暴跌 9%，然后立即恢复）是如何由极端的订单流毒性造成的。

用于识别有毒订单流的模型——VPIN（知情交易量同步概率）——在闪电崩盘前的一个小时内飙升至历史新高，并成功预测了仍然被认为是神秘的事件。

都铎王朝的论文受到了一些媒体的关注：彭博社刊文指出 VPIN 可以“帮助监管机构防止 6 月 2007 日暴跌等崩溃”。劳伦斯伯克利国家实验室的研究人员表明，VPIN 可以很好地预测 2012 年 XNUMX 月至 XNUMX 年 XNUMX 月期间期货市场的高波动性事件。

在辉煌后来的论文，同一作者指出，高订单流毒性不仅会迫使做市商退出市场，还会迫使做市商退出市场。如果做市商不得不亏本抛售库存，他们可以耗尽任何剩余的流动性，而不是提供流动性。

在 6 月 XNUMX 日崩盘之前的几个小时里，消息灵通的交易员一直在不断地将头寸卖给做市商，而做市商面临着越来越大的损失。当这些做市商最终被迫平仓时，结果是灾难性的。用研究人员的话说：“极端的毒性有能力将流动性提供者转变为流动性消费者”。

“极端的毒性有能力将流动性提供者转变为流动性消费者”—— “闪崩”的微观结构

但什么是 VPIN？

VPIN 基于 PIN 模型，该模型将交易视为三类参与者之间的博弈：知情交易者、不知情交易者和做市商。

VPIN 近似为历史窗口内买入量和卖出量之间的绝对差。 VPIN 不是按时间采样，而是使用固定量的交易量条来计算。例如，您可以每交换 1000 个比特币就采样一次。

随着新信息进入市场，交易量往往会增加，而当新信息没有进入市场时，交易量就会减少。因此，按数量采样类似于按波动性（和信息流）采样。

如果买方是知情交易者，则订单被归类为买入订单；同样，如果卖方是知情交易者，则订单被归类为卖出订单。接下来将详细介绍如何识别买卖交易。

VPIN 是长度为 n 的历史窗口内的平均交易量不平衡

计算 VPIN 使用两个 Pandas 系列的分类买卖量

识别知情交易

勾选规则通过识别交易侵略者（即定价方）对知情买入和卖出交易进行分类。通过市价订单购买比特币的交易者将与订单簿中的最佳卖价相匹配——高于买卖均值。这使他成为侵略者。如果交易者提交限价订单以低于买卖均值的价格购买比特币，则如果另一交易者通过市价订单积极出售比特币，则该订单最终可能会被执行。

勾选规则通过简单的观察来识别贸易侵略者。激进的买单往往会提高资产的价格，因为该订单与订单簿中的最低要价相匹配。同样，激进的卖单往往会在最高出价匹配后降低资产价格。随后的价格变化可用于识别贸易侵略者。

勾选规则（金融机器学习进展第 19 章）

导致随后价格上涨的交易被标记为 1——买入。导致价格下跌的交易被标记为-1——卖出。不会导致价格变化的交易（因为它们没有完全满足最高出价或最低要价）会标有前一个报价。

勾选规则的问题

虽然勾选规则（通常）成功地识别了攻击方，但最近的一些研究表明，攻击方交易者和知情交易者在高频市场中可能并不等同。例如，知情交易者可以简单地在整个订单簿中提交多个限价订单，取消那些未成交的订单，并且根据勾选规则仍然显得不知情。

VPIN 的原始实现使用称为贝叶斯方法散装体积分类 (BVC) 估算每个柱中知情买入量和卖出量的比例（基于时间或交易量）。我在 BVC 方面的实际经验相当复杂。我没有使用 BVC，而是决定采用另一种选择：使用交易标签来指定买方或卖方是否是原始 Binance Trade 数据中的做市商。

Binance 通过 Websocket 流发布实时交易数据，自去年 2021 月初以来，我一直在 AWS 服务器上收集这些数据；这就是我的数据的来源。自XNUMX年XNUMX月起，您还可以下载历史数据点击此处。

VPIN 概览

我使用滚动美元条计算了 VPIN，每天大约有 1600 个样本，窗口大小为 1000。这意味着每个卷桶的大小严格来说并不完全相同。即便如此，差异很小，所以我觉得使用原始实现很舒服，而不必对各个桶进行加权。

与最初的实施不同，买卖量已使用交易级别标签进行分类，该标签指定买方是否是做市商。此外，与最初的实现不同，VPIN 不是固定的。

随着比特币市值和交易量的增加，过去一年订单流失衡似乎已显着减少。这与研究结果一致，研究表明较大的股票买卖价差较低，意味着逆向选择较少。

VPIN 计算时间为 2020 年 2021 月至 XNUMX 年 XNUMX 月中旬

在最后一次调整（19 年 2021 月 XNUMX 日）之前，攻击方买卖订单之间的订单流不平衡似乎很小。相对较低的 VPIN 指标意味着毒性在校正中没有发挥作用。

有时，局部订单流失衡似乎在价格大幅下跌之前达到顶峰——12 月 18 日和 XNUMX 日就是最好的例子。然而，这可能只是我在读图表。

使用 VPIN 预测三重障碍标签

VPIN 不一定旨在预测未来回报。相反，它仅仅描述了历史窗口内平均的、成交量加权的订单流不平衡情况。对这些失衡的了解不一定能用来预测未来失衡的持续性、增加或减少。尽管如此，我想我可以尝试一下。

我使用了 Marcos López de Prado 提出的一个相当标准的设置——对于那些不熟悉金融机器学习的人来说，下面的段落听起来像是胡言乱语，所以请随意跳过它。

我计算了波动率调整后的三重障碍标签，将样本分类为多头或空头头寸。任一方向的最大标签宽度上限为 3.5%；垂直障碍击中是根据头寸长度上的绝对回报来分类的。我根据平均唯一性计算了样本权重。 RF 使用 100 棵树进行训练，每棵树的相关最大样本数，每棵树不超过一个特征，最大深度为 6。数据经过缩放、清除、禁运 (5%) 并跨五倍进行交叉验证。阅读马科斯的前两部分书如果您对细节感兴趣。

由于去年年底 VPIN 似乎出现了大幅突破，因此我决定仅使用过去六个半月的数据；所以每折大约一个月的数据。这样总共就有约 250,000 个样本。

与原始论文中一样，我使用对数正态分布拟合 VPIN 指标，并在 VPIN 的 CDF 上训练模型。我使用了七种不同的窗口大小：50、100、250、500、1000、2500 和 5000。所有五个折叠的 ROC 曲线如下所示。

跨五倍多空三重障碍预测的接收者操作特征 (ROC) 曲线

该模型的平均性能明显低于 0.5 AUC 基准，而且性能因折叠而异。然而，ROC 曲线和 AUC 分数可能不是评估 VPIN（的 CDF）性能的最佳方式。

评估 VPIN 的尾端性能

金融机器学习中 ROC 曲线的问题在于它们不能很好地了解尾端性能。在正常市场条件下，VPIN 对价格形成没有影响是完全有可能的，甚至是很可能的。事实上，做市商预计买卖量之间会出现波动；这只是做生意的成本。

我想知道极端市场条件下极高或极低的订单流毒性是否对比特币有任何预测能力。答案（如下）似乎是肯定的。

看一下精确召回曲线

多头头寸的精确召回曲线（正标签=1）

Precision Recall 曲线绘制了不同阈值下 Precision 和 Recall 之间的权衡。在这种情况下，它表明，在非常高的阈值下，即非常低的召回水平（0.05 或更低），模型在识别所有五倍的多头头寸方面的平均精度会上升到 0.6 左右（甚至可能是 75 左右）。在 0.5 阈值下，在所有五个折叠中，随机森林正确识别了 XNUMX% 的多头头寸，即使 AUC 远低于 XNUMX。

空头头寸的精确召回曲线（正标签 = 0）

空头头寸的精确召回曲线讲述了类似的故事。尽管所有 0.5 条曲线的平均 AUC 仍低于 XNUMX，但在非常高的阈值下精度会出现峰值。

这表明 VPIN 可能只在极少数情况下具有预测能力 - 在此数据集中最多每月一次或两次。