Empirische Marktmikrostruktur

Quellknoten: 937627

Aus Pexels

Auftragsflusstoxizität im Bitcoin-Spotmarkt

Seit August 2020 wurden auf Binance mehr als 800 Milliarden Dollar an USDT-denominierten Bitcoins gehandelt – bei weitem das höchste Bitcoin-Austausch. Wie in anderen Märkten stammt auch der Großteil der auf Binance bereitgestellten Liquidität von Market Makern: Unternehmen, die bereit sind, Bitcoin sowohl zu kaufen als auch zu verkaufen, in der Hoffnung, mit der Geld-Brief-Spanne einen Gewinn zu erzielen.

Marktmikrostrukturtheorie erkennenzEs geht davon aus, dass die Preisbildung sowohl von endogenen als auch von exogenen Faktoren bestimmt wird. Liquidität, Marktauswirkungen, Transaktionskosten (Slippage), Volatilität und die Mechanismen des Limit-Orderbuchs spielen alle eine wesentliche Rolle.

Die klassische Wirtschaftstheorie von Angebot und Nachfrage geht davon aus, dass jeder Investor, der bereit ist, zum Gleichgewichtspreis zu kaufen und zu verkaufen, dies grundsätzlich tun kann. In Wirklichkeit verändert der bloße Kauf oder Verkauf eines Wertpapiers den Marktpreis; Geschäfte haben Auswirkungen auf den Markt.

Ein Anleger, der eine große Menge Bitcoin kaufen oder verkaufen möchte, wird nicht den gesamten Auftrag auf einmal ausführen. Stattdessen werden sie dies im Laufe der Zeit schrittweise tun, um zum niedrigsten Preis zu kaufen oder zum höchsten Preis zu verkaufen. Stan Druckenmiller – der zusammen mit George Soros brach die Bank of England i1992 – erwähnte kürzlich, dass er versuchte zu kaufen 100 kaufte er Bitcoin im Wert von 2018 Millionen US-Dollar. Da es ihm an Liquidität mangelte, brauchte er zwei Wochen, um 20 Millionen US-Dollar zu kaufen, woraufhin er aufgab.

Daher spielen die Marktauswirkungen eines Handels eine erhebliche Rolle bei der Entscheidung des Anlegers, ein Wertpapier zu kaufen oder zu verkaufen, was sich wiederum auf den Preis auswirkt, zu dem dieses Wertpapier gehandelt wird.

Alle Marktteilnehmer betreten einen Markt in der Hoffnung, Gewinne zu erzielen, doch Market Maker und Händler verdienen (oder verlieren) Geld auf grundlegend unterschiedliche Weise. Market Maker kaufen und verkaufen Bitcoin in der Hoffnung, die Geld-Brief-Spanne zu verdienen. Händler kaufen und verkaufen Bitcoin, weil sie eine informierte oder uninformierte Annahme über zukünftige Preisänderungen haben.

Um die Geld-Brief-Spanne zu verdienen, müssen Market Maker aktiv einen Bestand an Bitcoin und Tether verwalten. Wenn die Handelsströme ausgeglichen sind, können sie Bitcoin zum Briefkurs verkaufen und zum Geldkurs zurückkaufen und so einen Gewinn erzielen. Wenn die Handelsströme jedoch zu unausgewogen werden, wird es für Market Maker schwieriger, ihre Bestände mit Gewinn fortzusetzen. Im Allgemeinen erhöhen Market Maker dann den Preis, den sie für ihre Dienstleistungen verlangen – die Geld-Brief-Spanne –, was die Handelskosten (Slippage) für Händler erhöht.

Market Maker und Händler verdienen (oder verlieren) Geld auf grundlegend unterschiedliche Weise

Der Geld- und Briefkurs, zu dem Market Maker bereit sind, Liquidität bereitzustellen, hängt davon ab, inwieweit sie von informierten Händlern negativ ausgewählt werden. Wenn der Auftragsfluss aus dem Gleichgewicht gerät, weil informierte Händler Bitcoin kaufen oder verkaufen, gilt dieser Auftragsfluss als toxisch.

Auftragsflusstoxizität während des Flash-Crashs am 6. Mai

Im Jahr 2010 veröffentlichten drei Forscher aus Cornell in Zusammenarbeit mit der Tudor Investment Group eine Krepppapier beschreibt, wie der Flash-Crash von 2010 – bei dem der Dow Jones Industrial Average (DJIA) kurzzeitig um 9 % einbrach, bevor er sich sofort wieder erholte – durch eine extreme Toxizität des Auftragsflusses verursacht wurde.

Das zur Identifizierung des toxischen Auftragsflusses verwendete Modell – VPIN (Volume-Synchronized Probability of Informed Trading) – erreichte in der Stunde vor dem Flash-Crash ein Allzeithoch und konnte erfolgreich ein Ereignis vorhersagen, das immer noch als mysteriös gilt.

Die Tudor-Zeitung erhielt einige mediale Aufmerksamkeit: ein Bloomberg Artikel wies darauf hin, dass VPIN „den Regulierungsbehörden helfen könnte, Abstürze wie den Absturz vom 6. Mai zu verhindern“. Forscher des Lawrence Berkeley National Laboratory haben gezeigt, dass VPIN von Januar 2007 bis Juli 2012 Ereignisse mit hoher Volatilität auf den Terminmärkten gut vorhersagen konnte.

In brillanter Qualität späteres PapierDieselben Autoren weisen darauf hin, dass eine hohe Auftragsflusstoxizität nicht nur dazu führt, dass Market Maker den Markt verlassen; Wenn Market Maker ihre Bestände mit Verlust abstoßen müssen, können sie die verbleibende Liquidität abziehen, anstatt sie bereitzustellen.

In den Stunden vor dem Absturz am 6. Mai hatten informierte Händler ihre Positionen konsequent an Market Maker verkauft, die zunehmende Verluste hinnehmen mussten. Als dieselben Market Maker schließlich gezwungen waren, ihre Positionen aufzulösen, waren die Ergebnisse katastrophal. Mit den Worten der Forscher: „Extreme Toxizität hat die Fähigkeit, Liquiditätsgeber in Liquiditätskonsumenten zu verwandeln.“

„Extreme Toxizität kann Liquiditätsanbieter in Liquiditätskonsumenten verwandeln“ – Die Mikrostruktur des „Flash Crash“

VPIN basiert auf dem PIN-Modell, das den Handel als ein Spiel zwischen drei Arten von Teilnehmern betrachtet: informierte Händler, uninformierte Händler und Market Maker.

VPIN wird als die absolute Differenz zwischen Kauf- und Verkaufsvolumen über einen historischen Zeitraum angenähert. Anstelle einer zeitlichen Abtastung wird der VPIN mithilfe von Volumenbalken mit festem Betrag berechnet. Beispielsweise könnten Sie jedes Mal, wenn 1000 Bitcoins ausgetauscht werden, einmal eine Stichprobe durchführen.

Das Volumen nimmt tendenziell zu, wenn neue Informationen auf den Markt kommen, und nimmt ab, wenn dies nicht der Fall ist. Somit ist die Stichprobenziehung nach Volumen vergleichbar mit der Stichprobenziehung nach Volatilität (und Informationsfluss).

Eine Order gilt als Kauforder, wenn der Käufer ein informierter Händler ist; Ebenso wird ein Auftrag als Verkaufsauftrag eingestuft, wenn der Verkäufer ein informierter Händler ist. Als nächstes erfahren Sie mehr über die Identifizierung von Kauf- und Verkaufsgeschäften.

VPIN ist das durchschnittliche Volumenungleichgewicht über ein historisches Fenster der Länge n
Zur Berechnung der VPIN werden zwei Pandas-Serien mit klassifiziertem Kauf- und Verkaufsvolumen verwendet

Die Tick-Regel klassifiziert informierte Kauf- und Verkaufsgeschäfte, indem sie den Handelsaggressor identifiziert, dh die Preispartei. Ein Händler, der Bitcoin über eine Marktorder kauft, wird mit dem besten Briefkurs im Orderbuch gematcht – über dem Geld-Brief-Mittelwert. Das macht ihn zum Aggressor. Wenn ein Händler eine Limit-Order zum Kauf von Bitcoin unterhalb des Geld-Brief-Mittelwerts einreicht, kann diese Order schließlich ausgeführt werden, wenn ein anderer Händler Bitcoin aggressiv über eine Marktorder verkauft.

Die Tick-Regel identifiziert den Handelsaggressor anhand einer einfachen Beobachtung. Aggressive Kaufaufträge erhöhen tendenziell den Preis eines Vermögenswerts, da der Auftrag mit dem niedrigsten Brief im Auftragsbuch abgeglichen wird. Ebenso neigen aggressive Verkaufsaufträge dazu, den Preis eines Vermögenswerts zu senken, nachdem das Höchstgebot erreicht wurde. Die anschließende Preisänderung kann zur Identifizierung des Handelsaggressors genutzt werden.

Die Tick-Regel (Fortschritte im maschinellen Lernen im Finanzbereich, Kapitel 19)

Trades, die zu einem anschließenden Preisanstieg führen, werden als 1 – ein Kauf – gekennzeichnet. Trades, die zu einem Preisrückgang führten, werden mit -1 – einem Verkauf – gekennzeichnet. Trades, die keine Preisänderung bewirken (weil sie das höchste Geld oder den niedrigsten Brief nicht vollständig erfüllt haben), werden mit dem vorherigen Häkchen gekennzeichnet.

Während die Tick-Regel (im Allgemeinen) die Aggressorseite erfolgreich identifiziert, deuten einige neuere Untersuchungen darauf hin, dass Händler auf der Aggressorseite und informierte Händler auf Hochfrequenzmärkten möglicherweise nicht gleichwertig sind. Ein informierter Händler könnte beispielsweise einfach mehrere Limit-Orders im gesamten Orderbuch aufgeben, diejenigen stornieren, die nicht ausgeführt werden, und gemäß der Tick-Regel immer noch uninformiert erscheinen.

Die ursprüngliche Implementierung von VPIN verwendet einen Bayes'schen Ansatz namens Massenvolumenklassifizierung (BVC) um den Anteil des informierten Kauf- und Verkaufsvolumens in jedem Balken anzunähern (entweder zeit- oder volumenbasiert). Meine praktischen Erfahrungen mit BVC sind eher gemischt. Anstatt BVC zu verwenden, habe ich mich für eine andere Option entschieden: die Handels-Tags zu verwenden, die in den Binance-Handelsrohdaten angeben, ob der Käufer oder Verkäufer ein Market Maker war.

Binance veröffentlicht Live-Handelsdaten über einen Websocket-Stream, den ich seit Anfang August letzten Jahres auf einem AWS-Server sammle; daher stammen meine Daten. Seit März 2021 können Sie auch historische Daten herunterladen .

Ich habe den VPIN anhand rollierender Dollarbarren mit etwa 1600 Proben pro Tag und einer Fenstergröße von 1000 berechnet. Das bedeutet, dass nicht jeder Volumen-Bucket genau genommen die exakt gleiche Größe hat. Trotzdem sind die Unterschiede minimal, sodass ich die ursprüngliche Implementierung problemlos verwenden kann, ohne einzelne Eimer gewichten zu müssen.

Im Gegensatz zur ursprünglichen Implementierung wurden Kauf- und Verkaufsvolumina mithilfe von Tags auf Handelsebene klassifiziert, die angeben, ob der Käufer ein Market Maker war oder nicht. Außerdem ist VPIN im Gegensatz zur ursprünglichen Implementierung nicht stationär.

Die Ungleichgewichte im Auftragsfluss scheinen im vergangenen Jahr deutlich zurückgegangen zu sein, da die Marktkapitalisierung und das Handelsvolumen von Bitcoin gestiegen sind. Dies steht im Einklang mit Untersuchungen, die zeigen, dass größere Aktien geringere Geld-Brief-Spannen aufweisen, was auf eine geringere negative Selektion schließen lässt.

VPIN Berechnet von August 2020 bis Mitte Juni 2021

Das Ungleichgewicht im Auftragsfluss zwischen Kauf- und Verkaufsaufträgen der Aggressorseite im Vorfeld der letzten Korrektur – dem 19. Mai 2021 – scheint minimal zu sein. Die relativ niedrige VPIN-Metrik deutet darauf hin, dass Toxizität bei der Korrektur keine Rolle gespielt hat.

Manchmal scheinen die lokalen Ungleichgewichte im Auftragsfluss kurz vor einem dramatischen Preisverfall ihren Höhepunkt zu erreichen – der 12. und 18. Juni sind die besten Beispiele. Es könnte jedoch sein, dass ich nur in die Tabelle hineingelesen habe.

Vorhersage von Triple Barrier Labels mit VPIN

VPIN wurde nicht unbedingt dazu entwickelt, zukünftige Renditen vorherzusagen. Stattdessen beschreibt es lediglich die durchschnittlichen, volumengewichteten Auftragsflussungleichgewichte über einen historischen Zeitraum. Die Kenntnis dieser Ungleichgewichte kann nicht unbedingt dazu genutzt werden, das Fortbestehen, die Zunahme oder den Rückgang künftiger Ungleichgewichte vorherzusagen. Trotzdem dachte ich, ich könnte es mal versuchen.

Ich habe ein ziemlich Standard-Setup verwendet, das von Marcos López de Prado vorgeschlagen wurde – der folgende Absatz wird für diejenigen, die mit finanziellem maschinellen Lernen nicht vertraut sind, wie Kauderwelsch klingen, also können Sie ihn gerne überspringen.

Ich habe volatilitätsbereinigte Triple Barrier Labels berechnet, um Proben entweder als Long- oder Short-Positionen zu klassifizieren. Die maximale Etikettenbreite ist in beide Richtungen auf 3.5 % begrenzt; Vertikale Barrierentreffer werden nach der absoluten Rendite über die Länge der Position klassifiziert. Ich habe die Stichprobengewichte basierend auf der durchschnittlichen Eindeutigkeit berechnet. Der RF wird mit 100 Bäumen, den relevanten maximalen Stichproben pro Baum, nicht mehr als einem Merkmal pro Baum und einer maximalen Tiefe von 6 trainiert. Die Daten werden skaliert, bereinigt, mit einem Embargo versehen (5 %) und über fünf Falten hinweg kreuzvalidiert . Lesen Sie die ersten beiden Teile von Marcos‘ buchen wenn Sie an den Details interessiert sind.

Da es Ende letzten Jahres offenbar einen starken Einbruch bei VPIN gegeben hat, habe ich beschlossen, nur Daten der letzten sechseinhalb Monate zu verwenden; also etwa ein Monat Daten pro Falte. Das ergibt insgesamt etwa 250,000 Proben.

Wie im Originalpapier habe ich die VPIN-Metrik mithilfe einer logarithmischen Normalverteilung angepasst und das Modell auf der CDF von VPIN trainiert. Ich habe sieben verschiedene Fenstergrößen verwendet: 50, 100, 250, 500, 1000, 2500 und 5000. Die ROC-Kurven über alle fünf Falten sind unten dargestellt.

Die Receiver Operating Characteristic (ROC)-Kurven von Long-Short-Triple-Barriere-Vorhersagen über fünf Falten

Das Modell bleibt im Durchschnitt deutlich hinter dem Benchmark von 0.5 AUC zurück, während die Leistung je nach Faltung variiert. Dennoch sind eine ROC-Kurve und der AUC-Score möglicherweise nicht die beste Möglichkeit, die Leistung von (dem CDF von) VPIN zu bewerten.

Das Problem mit einer ROC-Kurve beim maschinellen Finanzlernen besteht darin, dass sie keine gute Vorstellung von der Endleistung vermittelt. Es ist durchaus möglich – und sogar wahrscheinlich –, dass VPIN unter normalen Marktbedingungen keinen Einfluss auf die Preisbildung hat. Tatsächlich erwarten Market Maker Schwankungen zwischen Kauf- und Verkaufsvolumen; Das sind nur die Kosten für die Geschäftsabwicklung.

Ich möchte wissen, ob eine extrem hohe oder niedrige Auftragsflusstoxizität unter extremen Marktbedingungen eine Vorhersagefähigkeit bei Bitcoin hat. Die Antwort (unten) scheint ja zu sein.

Eine Präzisionsrückrufkurve für Long-Positionen (positive Bezeichnung =1)

Eine Precision-Recall-Kurve stellt den Kompromiss zwischen Precision und Recall über verschiedene Schwellenwerte hinweg dar. In diesem Fall zeigt sich, dass bei sehr hohen Schwellenwerten, also sehr niedrigen Erinnerungsgraden (0.05 und niedriger), die durchschnittliche Präzision des Modells bei der Identifizierung von Long-Positionen über alle fünf Falten hinweg in die hohen Fünfziger (und vielleicht sogar Sechziger) ansteigt. Beim Schwellenwert von 0.6 identifiziert der Random Forest über alle fünf Falten hinweg 75 % der Long-Positionen korrekt, obwohl die AUC deutlich unter 0.5 liegt.

Eine Präzisionsrückrufkurve für Short-Positionen (positive Bezeichnung = 0)

Die Precision Recall-Kurve für Short-Positionen erzählt eine ähnliche Geschichte. Auch wenn die durchschnittliche AUC in allen fünf Kurven unter 0.5 bleibt, kommt es bei sehr hohen Schwellenwerten zu einem Anstieg der Präzision.

Dies deutet darauf hin, dass VPIN möglicherweise nur in sehr seltenen Fällen über Vorhersagekapazität verfügt – in diesem Datensatz vielleicht höchstens ein- oder zweimal im Monat.

Märkte verhalten sich in Zeiten hoher und niedriger Volatilität im Allgemeinen recht unterschiedlich. Die Vorhersagbarkeit einiger Merkmale nimmt während eines Volatilitätsschocks deutlich ab, während andere Merkmale (einschließlich marktmikrostruktureller Merkmale) relevanter werden.

Messungen der Auftragsflusstoxizität könnten besonders relevant in einem Markt sein, der bereits volatil ist und in dem Market Maker den Spread, zu dem sie Liquidität bereitstellen, bereits ausgeweitet haben. Wenn Market Maker nicht nur mit hoher Preisvolatilität umgehen, sondern auch von informierten Händlern nachteilig ausgewählt werden, könnte dies zu einer Art „Doppelschlag“ führen (ich spekuliere hier natürlich nur).

Um diese Spekulation fortzusetzen, könnte es wahrscheinlicher sein, dass Market Maker in einem sehr volatilen Markt Verluste erleiden. Dies erhöht die Wahrscheinlichkeit, dass sie ihre Lagerbestände abstoßen (wie sie es während des Flash-Crashs 2010 getan haben), was zu einem Preisverfall führt.

Ein Volatilitätsschwellenwert entfernt alle Stichproben aus dem Datensatz, bei denen die Volatilität unter einen bestimmten Benchmark fällt. In diesem Datensatz schließt beispielsweise ein Volatilitätsschwellenwert von 0.02 etwa drei Fünftel der Daten aus, führt jedoch zu dramatischen Verbesserungen bei AUC, der Long Precision Recall Curve und der Short Precision Recall Curve.

ROC-Kurve für Long- (1) und Short-Positionen (0) mit einem Volatilitätsschwellenwert von 0.02

Der AUC-Score steigt von 0.49 (schlechter als ein Zufallsklassifikator) auf respektable 0.55. Der AUC-Wert liegt in allen Falten bis auf eine deutlich über dem 0.5-Benchmark.

Die Precision Recall-Kurve für Long-Positionen (Positive Bezeichnung = 1)
Die Präzisionsrückrufkurve für Short-Positionen (Positivbezeichnung = 2)

Bei den Precision Recall-Kurven scheint die Einbeziehung eines Volatilitätsschwellenwerts die Präzision über eine Vielzahl von Schwellenwerten hinweg dramatisch erhöht zu haben. VPIN scheint in bereits volatilen Märkten eine deutlich höhere Prognosefähigkeit zu haben.

Es ist natürlich möglich, dass ich die Daten (in irgendeiner Weise) überangepasst habe. Eine umfassendere Analyse würde denselben Ansatz auf andere Kryptowährungen wie Ethereum, Ripple und Cardano anwenden, um sicherzustellen, dass VPIN tatsächlich Preisbewegungen vorhersagen kann und dass seine Vorhersagekapazität mit der Volatilität steigt.

Market Maker spielen eine der wichtigsten Rollen an einer Börse – sie stellen Liquidität bereit. Wenn informierte Händler ihre Aufträge jedoch ausführen, erleiden diese Liquiditätsanbieter Verluste. Sie stehen dann vor der Wahl: Sie können die Kosten für ihre Dienstleistungen erhöhen oder sich – in schwerwiegenden Fällen – ganz aus einem Markt zurückziehen. Durch die Analyse der Orderflow-Ungleichgewichte zwischen Kauf- und Verkaufsvolumen können wir die Interaktionen zwischen informierten Händlern und Market Makern modellieren.

Order Flow-Toxizität kann nicht nur eine sein guter Prädiktor für kurzfristige Volatilität — es scheint, dass es in einigen (sehr) seltenen Fällen sogar größere Preisbewegungen vorhersagen kann.

Die Vorhersagekapazität von VPINs steigt stark an, wenn der betreffende Markt bereits recht volatil ist. Über die Gründe kann ich nur spekulieren, aber eigentlich sehe ich zwei.

Das erste ist, dass Market Maker mit hauchdünnen Margen arbeiten. Folglich ist es wahrscheinlicher, dass sie aufgrund der negativen Selektion in volatileren Märkten große Verluste erleiden.

Darüber hinaus sind die Spreads in volatilen Märkten bereits recht groß. Die Toxizität des Orderflusses könnte – zusätzlich zur Volatilität – die Spreads (und Slippage-Kosten für Händler) drastisch erhöhen. Der Handel wird in diesem Fall sehr kostspielig; Ich gehe davon aus, dass Händler aufgrund der hohen Preisauswirkungen weniger wahrscheinlich kaufen werden, aber dennoch gezwungen sein werden, zu verkaufen, wenn der Markt zusammenbricht.

Quelle: https://medium.com/@lucasastorian/empirical-market-microstructure-f67eff3517e0?source=rss——-8—————–Kryptowährung

Zeitstempel:

Mehr von Medium