Microstructure empirique du marché

Nœud source: 937627

Du Pexels

Toxicité des flux de commandes sur le marché spot du Bitcoin

Depuis août 2020, plus de 800 milliards de dollars de Bitcoin libellés en USDT ont été échangés sur Binance – de loin le chiffre le plus élevé. le plus grand Échange de Bitcoins. Comme sur d'autres marchés, la plupart des liquidités fournies sur Binance proviennent de teneurs de marché : des entreprises qui sont prêtes à la fois à acheter ou à vendre du Bitcoin dans l'espoir de réaliser un profit sur l'écart acheteur-vendeur.

La théorie de la microstructure du marché reconnaîtzIl apparaît que la formation des prix est déterminée par des facteurs endogènes et exogènes. La liquidité, l'impact sur le marché, les coûts de transaction (slippage), la volatilité et les mécanismes du carnet d'ordres limités jouent tous un rôle important.

La théorie économique classique de l’offre et de la demande suppose que tout investisseur désireux d’acheter et de vendre au prix d’équilibre peut généralement le faire. En réalité, le simple fait d’acheter ou de vendre un titre modifie le prix du marché ; les échanges ont un impact sur le marché.

Un investisseur qui souhaite acheter ou vendre une grande quantité de Bitcoin n’exécutera pas la totalité de l’ordre en une seule fois. Au lieu de cela, ils le feront progressivement, au fil du temps, afin d’acheter au plus bas ou de vendre au prix le plus élevé. Stan Druckenmiller — qui, avec George Soros, j'ai fait tomber la Banque d'Angleterren 1992— a récemment mentionné qu'il essayé d'acheter 100 millions de dollars en Bitcoin en 2018. Faute de liquidités, il lui a fallu deux semaines pour acheter 20 millions de dollars, après quoi il a abandonné.

Ainsi, l’impact d’une transaction sur le marché joue un rôle important dans les décisions des investisseurs d’acheter ou de vendre un titre, ce qui à son tour affecte le prix auquel ce titre est négocié.

Tous les acteurs du marché entrent sur un marché dans l’espoir de réaliser des bénéfices, mais les teneurs de marché et les traders gagnent (ou perdent) de l’argent de manières fondamentalement différentes. Les teneurs de marché achètent et vendent du Bitcoin dans l’espoir d’obtenir le spread bid-ask. Les traders achètent et vendent du Bitcoin parce qu’ils ont une opinion éclairée ou non sur les changements de prix futurs.

Pour obtenir l’écart acheteur-vendeur, les teneurs de marché doivent gérer activement un inventaire de Bitcoin et de Tether. Lorsque les flux commerciaux sont équilibrés, ils peuvent vendre du Bitcoin à la demande et le racheter à l’offre, réalisant ainsi un profit. Cependant, si les flux commerciaux deviennent trop déséquilibrés, il devient plus difficile pour les teneurs de marché de reconduire leurs stocks avec profit. En règle générale, les teneurs de marché augmentent ensuite le prix qu'ils facturent pour leurs services – le spread bid-ask –, ce qui augmente les coûts de négociation (slippage) pour les traders.

Les teneurs de marché et les traders gagnent (ou perdent) de l’argent de manières fondamentalement différentes

L'offre et la demande auxquelles les teneurs de marché sont disposés à fournir des liquidités sont déterminées par le degré auquel ils sont défavorablement sélectionnés par des traders informés. Si les flux d’ordres deviennent déséquilibrés parce que des traders informés achètent ou vendent du Bitcoin, ce flux d’ordres est considéré comme toxique.

Toxicité du flux de commandes lors du crash flash du 6 mai

En 2010, trois chercheurs de Cornell, en collaboration avec Tudor Investment Group, ont publié un papier décrivant comment le krach éclair de 2010 – au cours duquel le Dow Jones Industrial Average (DJIA) a brièvement plongé de 9 % avant de se redresser immédiatement – ​​a été causé par une toxicité extrême du flux de commandes.

Le modèle utilisé pour identifier le flux d'ordres toxiques – VPIN (probabilité synchronisée en volume de trading informé) – a atteint des sommets sans précédent dans l'heure précédant le krach éclair et a prédit avec succès ce qui est toujours considéré comme un événement mystérieux.

Le journal Tudor a reçu une certaine attention médiatique : un Bloomberg article a souligné que le VPIN pourrait « aider les régulateurs à prévenir des krachs tels que la chute du 6 mai ». Des chercheurs du Lawrence Berkeley National Laboratory ont montré que VPIN avait bien prédit les événements de forte volatilité sur les marchés à terme de janvier 2007 à juillet 2012.

En brillant papier plus tard, les mêmes auteurs soulignent que la toxicité élevée des flux d’ordres ne force pas seulement les teneurs de marché à quitter le marché ; Si les teneurs de marché doivent écouler leurs stocks à perte, ils peuvent drainer toute liquidité restante au lieu de la fournir.

Dans les heures qui ont précédé le krach du 6 mai, les traders informés avaient systématiquement vendu leurs positions aux teneurs de marché, qui étaient confrontés à des pertes croissantes. Lorsque ces mêmes teneurs de marché ont finalement été contraints de démanteler leurs positions, les résultats ont été catastrophiques. Selon les mots des chercheurs : « une toxicité extrême a la capacité de transformer les fournisseurs de liquidité en consommateurs de liquidité ».

« Une toxicité extrême a la capacité de transformer les fournisseurs de liquidité en consommateurs de liquidité » – La microstructure du « Flash Crash »

VPIN est basé sur le modèle PIN, qui considère le trading comme un jeu entre trois types de participants : les traders informés, les traders non informés et les teneurs de marché.

Le VPIN est estimé comme la différence absolue entre le volume d’achat et de vente sur une fenêtre historique. Au lieu d'un échantillonnage par temps, le VPIN est calculé à l'aide de barres de volume à montant fixe. Par exemple, vous pouvez échantillonner une fois chaque fois que 1000 XNUMX Bitcoins sont échangés.

Le volume a tendance à augmenter à mesure que de nouvelles informations arrivent sur le marché, et à diminuer lorsqu’elles n’arrivent pas. Ainsi, l’échantillonnage par volume s’apparente à l’échantillonnage par volatilité (et flux d’informations).

Un ordre est qualifié d’ordre d’achat si l’acheteur est un commerçant averti ; de même, un ordre est classé comme ordre de vente si le vendeur est un commerçant averti. En savoir plus sur l'identification des transactions d'achat et de vente ensuite.

VPIN est le déséquilibre de volume moyen sur une fenêtre historique de longueur n
Calculer le VPIN utilise deux séries Pandas de volumes d'achat et de vente classifiés

La règle Tick classe les transactions d'achat et de vente en connaissance de cause en identifiant l'agresseur commercial, c'est-à-dire la partie prenante en charge la tarification. Un trader qui achète du Bitcoin via un ordre au marché se verra attribuer la meilleure demande du carnet d’ordres – au-dessus de la moyenne acheteur-vendeur. Cela fait de lui l'agresseur. Si un trader soumet un ordre limité pour acheter du Bitcoin en dessous de la moyenne acheteur-vendeur, cet ordre peut éventuellement être exécuté si un autre trader vend de manière agressive du Bitcoin via un ordre au marché.

La règle Tick identifie l’agresseur commercial en s’appuyant sur une simple observation. Les ordres d’achat agressifs ont tendance à augmenter le prix d’un actif, car l’ordre correspond à la demande la plus basse du carnet d’ordres. De même, les ordres de vente agressifs ont tendance à faire baisser le prix d’un actif une fois l’offre la plus élevée atteinte. Le changement de prix ultérieur peut être utilisé pour identifier l’agresseur commercial.

La règle du tick (Progrès dans l'apprentissage automatique financier, chapitre 19)

Les transactions qui provoquent une augmentation ultérieure des prix sont étiquetées comme un 1 – un achat. Les transactions qui ont provoqué une baisse de prix sont étiquetées -1 – une vente. Les transactions qui n’entraînent pas de changement de prix (parce qu’elles n’ont pas répondu complètement à l’offre la plus élevée ou à la demande la plus basse) sont étiquetées avec la coche précédente.

Bien que la règle des tiques identifie (généralement) avec succès le côté agresseur, certaines recherches récentes suggèrent que les traders du côté agresseur et les traders informés ne sont peut-être pas équivalents sur les marchés à haute fréquence. Par exemple, un trader informé pourrait simplement soumettre plusieurs ordres limités tout au long du carnet d’ordres, annuler ceux qui ne sont pas exécutés et paraître toujours mal informé selon la règle des ticks.

L'implémentation originale de VPIN utilise une approche bayésienne appelée Classification des volumes en vrac (BVC) pour approximer la proportion de volume d'achat et de vente informé dans chaque barre (en fonction du temps ou du volume). Mon expérience pratique avec BVC a été plutôt mitigée. Au lieu d'utiliser BVC, j'ai décidé d'opter pour une autre option : utiliser les balises commerciales qui précisent si l'acheteur ou le vendeur était un teneur de marché dans les données brutes de Binance Trade.

Binance publie des données commerciales en direct via un flux Websocket, que je collecte sur un serveur AWS depuis début août de l'année dernière ; c'est de là que viennent mes données. Depuis mars 2021, vous pouvez également télécharger des données historiques ici.

J'ai calculé le VPIN à l'aide de Dollar Bars roulants avec environ 1600 1000 échantillons par jour avec une taille de fenêtre de XNUMX XNUMX. Cela signifie que chaque compartiment de volume n'a pas à proprement parler exactement la même taille. Même ainsi, les différences sont minimes, donc je me sens à l'aise avec l'implémentation d'origine sans avoir à peser les compartiments individuels.

Contrairement à la mise en œuvre originale, les volumes d'achat et de vente ont été classés à l'aide d'étiquettes de niveau commercial qui précisent si l'acheteur était un teneur de marché ou non. De plus, contrairement à l’implémentation originale, le VPIN n’est pas stationnaire.

Les déséquilibres des flux d’ordres semblent avoir considérablement diminué au cours de l’année écoulée, à mesure que la capitalisation boursière et le volume des échanges de Bitcoin ont augmenté. Ceci est conforme aux recherches montrant que les actions de grande taille ont des écarts acheteur-vendeur plus faibles, ce qui implique moins de sélection adverse.

VPIN calculé d'août 2020 à mi-juin 2021

Le déséquilibre du flux d’ordres entre les ordres d’achat et de vente du côté agresseur jusqu’à la dernière correction – le 19 mai 2021 – semble minime. La métrique VPIN relativement faible implique que la toxicité n’a pas joué de rôle dans la correction.

Parfois, les déséquilibres localisés des flux de commandes semblent culminer juste avant une baisse spectaculaire des prix – les 12 et 18 juin en étant les meilleurs exemples. Cependant, cela pourrait simplement être ma lecture dans le graphique.

Prédire les étiquettes à triple barrière avec VPIN

Le VPIN n’a pas nécessairement été conçu pour prédire les rendements futurs. Au lieu de cela, il décrit simplement les déséquilibres moyens des flux de commandes pondérés en fonction du volume sur une fenêtre historique. La connaissance de ces déséquilibres ne permet pas nécessairement de prévoir la persistance, l’augmentation ou la diminution des déséquilibres futurs. Néanmoins, j'ai pensé que je pourrais tenter le coup.

J'ai utilisé une configuration assez standard proposée par Marcos López de Prado — le paragraphe suivant ressemblera à du charabia pour ceux qui ne sont pas familiers avec le Financial Machine Learning, alors n'hésitez pas à l'ignorer.

J'ai calculé des étiquettes triple barrière ajustées en fonction de la volatilité pour classer les échantillons en positions longues ou courtes. La largeur maximale de l'étiquette est plafonnée à 3.5 % dans les deux sens ; les coups de barrière verticale sont classés selon le rendement absolu sur la longueur de la position. J'ai calculé les poids des échantillons en fonction de l'unicité moyenne. Le RF est formé avec 100 arbres, le nombre maximum d'échantillons par arbre, pas plus d'une caractéristique par arbre et une profondeur maximale de 6. Les données sont mises à l'échelle, purgées, sous embargo (5 %) et validées croisées sur cinq volets. . Lisez les deux premières parties de Marcos livre si vous êtes intéressé par les détails.

Comme il semble y avoir une rupture brutale dans le VPIN à la fin de l'année dernière, j'ai décidé de n'utiliser que les données des six derniers mois et demi ; donc environ un mois de données par pli. Cela fait un total d’environ 250,000 XNUMX échantillons.

Comme dans l'article original, j'ai ajusté la métrique VPIN en utilisant une distribution log-normale et j'ai formé le modèle sur le CDF de VPIN. J'ai utilisé sept tailles de fenêtre différentes : 50, 100, 250, 500, 1000 2500, 5000 XNUMX et XNUMX XNUMX. Les courbes ROC pour les cinq plis sont tracées ci-dessous.

Courbes ROC (Receiver Operating Characteristic) des prédictions longues-courtes à triple barrière sur cinq volets

Le modèle est clairement sous-performant en moyenne par rapport à la référence de 0.5 AUC, tandis que les performances varient selon les plis. Pourtant, une courbe ROC et le score AUC ne constituent peut-être pas le meilleur moyen d’évaluer les performances du (CDF du) VPIN.

Le problème avec une courbe ROC dans Financial Machine Learning est qu’elle ne donne pas une bonne idée des performances finales. Il est tout à fait possible – et même probable – que le VPIN n'ait aucun impact sur la formation des prix dans des conditions normales de marché. En effet, les teneurs de marché s'attendent à des fluctuations entre les volumes d'achat et de vente ; c’est juste le coût de faire des affaires.

Je veux savoir si la toxicité des flux d’ordres extrêmement élevés ou faibles dans des conditions de marché extrêmes a une capacité prédictive dans Bitcoin. La réponse (ci-dessous) semble être oui.

Une courbe de rappel de précision pour les positions longues (étiquette positive = 1)

Une courbe de rappel de précision trace le compromis entre précision et rappel sur différents seuils. Dans ce cas, cela montre qu'à des seuils très élevés, c'est-à-dire des niveaux de rappel très faibles (0.05 et inférieurs), la précision moyenne du modèle dans l'identification des positions longues sur les cinq plis s'élève jusqu'à la cinquantaine (et peut-être même la soixantaine). Au seuil de 0.6, sur les cinq plis, Random Forest identifie correctement 75 % des positions longues, même si l'AUC est bien inférieure à 0.5.

Une courbe de rappel de précision pour les positions courtes (étiquette positive = 0)

La courbe de rappel de précision pour les positions courtes raconte une histoire similaire. Même si l'AUC moyenne reste inférieure à 0.5 sur les cinq courbes, la précision augmente à des seuils très élevés.

Cela suggère que le VPIN ne peut avoir une capacité prédictive que dans de très rares cas – peut-être une ou deux fois par mois au maximum dans cet ensemble de données.

Les marchés se comportent généralement de manière très différente selon les périodes de forte et de faible volatilité. La prévisibilité de certaines caractéristiques diminue considérablement lors d’un choc de volatilité, tandis que d’autres caractéristiques (notamment celles liées à la microstructure du marché) deviennent plus pertinentes.

Les mesures de toxicité des flux d’ordres pourraient être particulièrement pertinentes sur un marché déjà volatil, où les teneurs de marché ont déjà élargi le spread auquel ils fournissent des liquidités. Si, en plus de faire face à une forte volatilité des prix, les teneurs de marché sont également sélectionnés de manière défavorable par des traders avertis, cela pourrait former une sorte de « double coup dur » (je ne fais ici que spéculer bien sûr).

Pour poursuivre cette ligne de spéculation, les teneurs de marché pourraient être plus susceptibles de subir des pertes dans un marché très volatil. Cela augmente la probabilité qu’ils écoulent leurs stocks (comme ils l’ont fait lors du Flash Crash de 2010), entraînant une baisse des prix.

Un seuil de volatilité supprime tous les échantillons de l'ensemble de données où la volatilité tombe en dessous d'un certain point de référence. Par exemple, dans cet ensemble de données, un seuil de volatilité de 0.02 exclut environ les trois cinquièmes des données, mais conduit à des améliorations spectaculaires de l'AUC, de la courbe de rappel de précision longue et de la courbe de rappel de précision courte.

Courbe ROC pour les positions longues (1) et courtes (0) avec un seuil de volatilité de 0.02

Le score AUC passe de 0.49 (pire qu’un classificateur aléatoire) à un respectable 0.55. Le score AUC dans tous les plis sauf un est bien supérieur à la référence de 0.5.

La courbe de rappel de précision pour les positions longues (étiquette positive = 1)
La courbe de rappel de précision pour les positions courtes (étiquette positive = 2)

Pour les courbes de rappel de précision, l'inclusion d'un seuil de volatilité semble avoir augmenté considérablement la précision sur divers seuils. Le VPIN semble avoir une capacité prédictive nettement supérieure sur des marchés déjà volatils.

Il est bien sûr possible que j'aie (d'une manière ou d'une autre) surajusté les données. Une analyse plus complète appliquerait la même approche à d’autres crypto-monnaies telles que Ethereum, Ripple et Cardano pour garantir que le VPIN peut effectivement prédire les mouvements de prix et que sa capacité prédictive augmente avec la volatilité.

Les teneurs de marché jouent l’un des rôles les plus importants sur une bourse : ils fournissent des liquidités. Cependant, lorsque des traders informés annulent leurs ordres, ces fournisseurs de liquidité subissent des pertes. Ils sont alors confrontés à un choix : ils peuvent augmenter le coût de leurs services ou, dans les cas graves, se retirer complètement d'un marché. En analysant les déséquilibres des flux d’ordres entre les volumes d’achat et de vente, nous pouvons modéliser les interactions entre traders informés et teneurs de marché.

Non seulement la toxicité du flux ordonné peut être un bon indicateur de la volatilité à court terme — il semble que dans certains cas (très) rares, il puisse même prédire des mouvements de prix plus importants.

La capacité prédictive des VPIN augmente fortement lorsque le marché en question est déjà assez volatil. Je ne peux que spéculer sur les raisons, mais en réalité, j’en vois deux.

La première est que les teneurs de marché opèrent avec des marges extrêmement minces. Ils sont donc plus susceptibles de subir des pertes importantes en raison d’une sélection adverse sur des marchés plus volatils.

De plus, sur des marchés volatils, les spreads sont déjà assez larges. La toxicité du flux d’ordres – en plus de la volatilité – pourrait augmenter considérablement les spreads (et les coûts de glissement pour les traders). Le trading devient très coûteux lorsque cela se produit ; Je suppose que les traders seront moins susceptibles d’acheter en raison de l’impact élevé des prix, mais seront néanmoins obligés de vendre si le marché s’effondre.

Source : https://medium.com/@lucasastorian/empirical-market-microstructure-f67eff3517e0?source=rss——-8—————–crypto-monnaie

Horodatage:

Plus de Moyenne