Empirical Market Microstructure - Plato AiStream V2.1

Heruitgegeven door Plato

volgers: 0

Bestel Flow-toxiciteit op de Bitcoin-spotmarkt

Sinds augustus 2020 is er op Binance voor meer dan 800 miljard dollar aan in USDT luidende Bitcoin verhandeld – verreweg de grootste Bitcoin-uitwisseling. Net als op andere markten is het grootste deel van de liquiditeit die op Binance wordt geboden afkomstig van marktmakers: bedrijven die bereid zijn Bitcoin zowel te kopen als te verkopen in de hoop dat ze winst zullen maken op de bied-laatspread.

Wat is marktmicrostructuur?

Markt Microstructurele theorie herkentzes dat prijsvorming zowel door endogene als exogene factoren wordt bepaald. Liquiditeit, marktimpact, transactiekosten (slippage), volatiliteit en de werking van het limietorderboek spelen allemaal een substantiële rol.

De klassieke economische theorie van vraag en aanbod gaat ervan uit dat elke investeerder die bereid is te kopen en verkopen tegen de evenwichtsprijs dit doorgaans kan doen. In werkelijkheid verandert de handeling van het kopen of verkopen van een effect de marktprijs; transacties hebben marktimpact.

Een belegger die een grote hoeveelheid Bitcoin wil kopen of verkopen, zal niet de hele order in één keer uitvoeren. In plaats daarvan zullen ze dit in de loop van de tijd geleidelijk doen, om tegen de laagste prijs te kopen of tegen de hoogste prijs te verkopen. Stan Druckenmiller – die samen met George Soros brak de Bank of England in 1992 – zei onlangs dat hij probeerde te kopen $100 miljoen aan Bitcoin in 2018. Bij gebrek aan liquiditeit kostte het hem twee weken om $20 miljoen te kopen, waarna hij het opgaf.

De marktimpact van een transactie speelt dus een belangrijke rol bij de beslissingen van beleggers om een effect te kopen of verkopen, wat op zijn beurt invloed heeft op de prijs waartegen dat effect wordt verhandeld.

Hoe zit het met de orderstroomtoxiciteit?

Alle marktdeelnemers betreden een markt in de hoop winst te maken, maar marktmakers en handelaars verdienen (of verliezen) op fundamenteel verschillende manieren geld. Marktmakers kopen en verkopen Bitcoin zowel in de hoop de bid-ask spread te verdienen. Handelaren kopen en verkopen Bitcoin omdat ze een geïnformeerd of ongeïnformeerd geloof hebben over toekomstige prijsveranderingen.

Om de bid-ask spread te verdienen, moeten marktmakers actief een inventaris van zowel Bitcoin als Tether beheren. Wanneer de handelsstromen in evenwicht zijn, kunnen ze Bitcoin op de vraag verkopen en deze tegen de bieding terugkopen, waardoor ze winst maken. Als de handelsstromen echter te onevenwichtig worden, wordt het moeilijker voor marktmakers om hun voorraad met winst door te rollen. Over het algemeen zullen marktmakers dan de prijs verhogen die zij voor hun diensten in rekening brengen – de bid-ask spread – waardoor de handelskosten (slippage) voor handelaren toenemen.

Marktmakers en handelaren verdienen (of verliezen) geld op fundamenteel verschillende manieren

De vraag en aanbod waarbij marktmakers bereid zijn liquiditeit te verschaffen, wordt bepaald door de mate waarin zij door goed geïnformeerde handelaars negatief worden geselecteerd. Als orderstromen uit balans raken omdat geïnformeerde handelaren Bitcoin kopen of verkopen, wordt die orderstroom als giftig beschouwd.

Bestel Flow Toxicity en de Flash Crash

Bestel Flow Toxicity tijdens de Flash Crash van 6 mei

In 2010 publiceerden drie onderzoekers van Cornell in samenwerking met Tudor Investment Group een papier waarin wordt beschreven hoe de plotselinge crash van 2010 – waarbij de Dow Jones Industrial Average (DJIA) kortstondig met 9% daalde voordat hij zich onmiddellijk herstelde – werd veroorzaakt door een extreme hoeveelheid orderstroomtoxiciteit.

Het model dat werd gebruikt om de giftige orderstroom te identificeren – VPIN (volume-gesynchroniseerde waarschijnlijkheid van geïnformeerde handel) – piekte naar recordhoogten in het uur voorafgaand aan de flitscrash en voorspelde met succes wat nog steeds als een mysterieuze gebeurtenis wordt beschouwd.

De Tudor-krant kreeg enige media-aandacht: een Bloomberg dit artikel wees erop dat VPIN “regelgevers zou kunnen helpen crashes zoals de duik van 6 mei te voorkomen”. Onderzoekers van het Lawrence Berkeley National Laboratory hebben aangetoond dat VPIN het goed deed bij het voorspellen van gebeurtenissen met hoge volatiliteit op termijnmarkten van januari 2007 tot juli 2012.

Briljant later papierwijzen dezelfde auteurs erop dat hoge-orde-stroomtoxiciteit marktmakers niet alleen uit de markt dwingt; Als marktmakers hun voorraden met verlies moeten dumpen, kunnen ze de resterende liquiditeit wegnemen in plaats van deze te verstrekken.

In de uren voorafgaand aan de crash van 6 mei hadden geïnformeerde handelaars consequent hun posities verkocht aan marktmakers, die met toenemende verliezen te maken kregen. Toen deze zelfde marktmakers uiteindelijk gedwongen werden hun posities af te wikkelen, waren de resultaten catastrofaal. In de woorden van de onderzoekers: “extreme toxiciteit heeft het vermogen om liquiditeitsverschaffers te transformeren in liquiditeitsconsumenten”.

“Extreme toxiciteit heeft het vermogen om liquiditeitsverschaffers te transformeren in liquiditeitsconsumenten” – De microstructuur van de ‘Flash Crash’

Maar wat is VPN?

VPN is gebaseerd op het PIN-model, dat handel beschouwt als een spel tussen drie soorten deelnemers: geïnformeerde handelaren, niet-geïnformeerde handelaren en marktmakers.

De VPN wordt geschat als het absolute verschil tussen het koop- en verkoopvolume over een historische periode. In plaats van op tijd te samplen, wordt de VPN berekend met behulp van volumebalken met een vast bedrag. U kunt bijvoorbeeld elke keer dat er 1000 Bitcoins worden uitgewisseld, één keer een monster nemen.

Het volume heeft de neiging toe te nemen als er nieuwe informatie op de markt komt, en af te nemen als dat niet het geval is. Bemonstering op basis van volume is dus vergelijkbaar met bemonstering op basis van volatiliteit (en informatiestroom).

Een order wordt geclassificeerd als een kooporder als de koper een geïnformeerde handelaar is; op dezelfde manier wordt een order geclassificeerd als een verkooporder als de verkoper een geïnformeerde handelaar is. Hieronder meer over het identificeren van koop- en verkooptransacties.

VPN is de gemiddelde volume-onbalans over een historisch venster met lengte n

Bereken de VPN en gebruik twee Pandas-reeksen met geclassificeerd koop- en verkoopvolume

Geïnformeerde transacties identificeren

De Tick Rule classificeert geïnformeerde koop- en verkooptransacties door de handelsagressor te identificeren, dat wil zeggen de prijsnemende partij. Een handelaar die Bitcoin via een marktorder koopt, wordt gekoppeld aan de beste vraag in het orderboek – boven het bied-laat gemiddelde. Dit maakt hem tot de agressor. Als een handelaar een limietorder indient om Bitcoin te kopen onder het bied-laatgemiddelde, kan die order uiteindelijk worden vervuld als een andere handelaar op agressieve wijze Bitcoin via een marktorder verkoopt.

De Tick Rule identificeert de handelsagressor door te vertrouwen op een eenvoudige observatie. Agressieve kooporders hebben de neiging de prijs van een actief te verhogen, omdat de order overeenkomt met de laagste vraag in het orderboek. Op dezelfde manier hebben agressieve verkooporders de neiging de prijs van een actief te verlagen nadat het hoogste bod is gematcht. De daaropvolgende prijswijziging kan worden gebruikt om de handelsagressor te identificeren.

De vinkregel (Vooruitgang in financieel machinaal leren, hoofdstuk 19)

Transacties die een daaropvolgende prijsstijging veroorzaken, worden bestempeld als een 1 – een koop. Transacties die een prijsdaling veroorzaakten, krijgen het label -1 – een verkoop. Transacties die geen prijsverandering veroorzaken (omdat ze het hoogste bod of de laagste vraag niet volledig hebben ingevuld) worden gelabeld met het vorige vinkje.

Problemen met de vinkregel

Hoewel de Tick Rule (over het algemeen) met succes de kant van de agressor identificeert, suggereert recent onderzoek dat handelaren aan de agressorzijde en geïnformeerde handelaren mogelijk niet gelijkwaardig zijn op hoogfrequente markten. Een geïnformeerde handelaar kan bijvoorbeeld eenvoudigweg meerdere limietorders in het hele orderboek plaatsen, de orders die niet worden ingevuld annuleren en nog steeds niet geïnformeerd lijken volgens de Tick Rule.

De oorspronkelijke implementatie van VPN maakt gebruik van een Bayesiaanse benadering genaamd Bulkvolumeclassificatie (BVC) om het aandeel van het geïnformeerde koop- en verkoopvolume in elke balk te benaderen (op basis van tijd of volume). Mijn praktijkervaring met BVC is nogal gemengd. In plaats van BVC te gebruiken, besloot ik voor een andere optie te gaan: gebruik de handelstags die specificeren of de koper of verkoper een market maker was in ruwe Binance Trade-gegevens.

Binance publiceert live handelsgegevens via een Websocket-stream, die ik sinds begin augustus vorig jaar op een AWS-server verzamel; daar komen mijn gegevens vandaan. Sinds maart 2021 kunt u ook historische gegevens downloaden hier.

Een blik op VPN

Ik heb de VPN berekend met rollende Dollar Bars met ongeveer 1600 monsters per dag met een venstergrootte van 1000. Dit betekent dat elke volumebucket strikt genomen niet exact dezelfde grootte heeft. Toch zijn de verschillen minimaal, dus ik voel me op mijn gemak bij het gebruik van de originele implementatie zonder dat ik individuele emmers hoef te wegen.

In tegenstelling tot de oorspronkelijke implementatie zijn het koop- en verkoopvolume geclassificeerd met behulp van tags op handelsniveau die specificeren of de koper een market maker was of niet. Bovendien is VPN, in tegenstelling tot de oorspronkelijke implementatie, niet stationair.

De onevenwichtigheden in de orderstromen lijken het afgelopen jaar aanzienlijk te zijn afgenomen naarmate de marktkapitalisatie en het handelsvolume van Bitcoin toenamen. Dit komt overeen met onderzoek dat aantoont dat grotere aandelen lagere bied-laatspreads hebben, wat minder ongunstige selectie impliceert.

VIPIN Berekend van augustus 2020 tot midden juni 2021

De onbalans in de orderstroom tussen koop- en verkooporders aan de kant van de agressor in de aanloop naar de laatste correctie – 19 mei 2021 – lijkt minimaal. De relatief lage VPIN-metriek impliceert dat toxiciteit geen rol speelde bij de correctie.

Soms lijken de plaatselijke onevenwichtigheden in de orderstroom hun hoogtepunt te bereiken vlak voor een dramatische prijsdaling – 12 en 18 juni zijn daarvan de beste voorbeelden. Het kan echter ook zijn dat ik de grafiek lees.

Voorspellen van Triple Barrier-labels met VPN

VPN is niet noodzakelijkerwijs ontworpen om toekomstige rendementen te voorspellen. In plaats daarvan beschrijft het slechts de gemiddelde, naar volume gewogen onevenwichtigheden in de orderstroom over een historisch venster. Kennis van deze onevenwichtigheden kan niet noodzakelijkerwijs worden gebruikt om het voortbestaan, de toename of de afname van toekomstige onevenwichtigheden te voorspellen. Toch dacht ik dat ik het misschien wel een kans zou geven.

Ik heb een vrij standaard opstelling gebruikt, voorgesteld door Marcos López de Prado. De volgende paragraaf zal als onzin klinken voor degenen die niet bekend zijn met Financial Machine Learning, dus sla deze gerust over.

Ik heb voor de volatiliteit aangepaste Triple Barrier Labels berekend om samples te classificeren als Long- of Short-posities. De maximale labelbreedte is in beide richtingen beperkt tot 3.5%; verticale barrière-hits worden geclassificeerd op basis van het absolute rendement over de lengte van de positie. Ik heb steekproefgewichten berekend op basis van de gemiddelde uniciteit. De RF is getraind met 100 bomen, de relevante maximale monsters per boom, niet meer dan één kenmerk per boom en een maximale diepte van 6. De gegevens worden geschaald, opgeschoond, onder embargo gesteld (5%) en kruiselings gevalideerd in vijf stappen. . Lees de eerste twee delen van Marcos’ boek als je geïnteresseerd bent in de details.

Omdat er eind vorig jaar een scherpe breuk in de VPN-waarde lijkt te zijn opgetreden, heb ik besloten alleen gegevens van de afgelopen zes en een halve maand te gebruiken; dus ongeveer een maand aan gegevens per vouw. Dat komt neer op een totaal van ~250,000 monsters.

Net als in het originele artikel heb ik de VPN-metriek aangepast met behulp van een lognormale verdeling en het model getraind op de CDF van VPN. Ik heb zeven verschillende vensterformaten gebruikt: 50, 100, 250, 500, 1000, 2500 en 5000. De ROC-curven over alle vijf de vouwen zijn hieronder uitgezet.

De Receiver Operating Characteristic (ROC)-curven van lange-korte triple-barrière-voorspellingen over vijf vouwen

Het model presteert gemiddeld duidelijk slechter dan de benchmark van 0.5 AUC, terwijl de prestaties per vouw verschillen. Toch zijn een ROC-curve en de AUC-score mogelijk niet de beste manier om de prestaties van (de CDF van) VPN te evalueren.

Evaluatie van de staartprestaties van VPN

Het probleem met een ROC-curve in Financial Machine Learning is dat ze geen goed beeld geven van de staartprestaties. Het is heel goed mogelijk – en zelfs waarschijnlijk – dat VPIN geen invloed heeft op de prijsvorming onder normale marktomstandigheden. Marktmakers verwachten inderdaad schommelingen tussen het koop- en verkoopvolume; dat zijn gewoon de kosten van zakendoen.

Ik wil weten of extreem hoge of lage orderstroomtoxiciteit tijdens extreme marktomstandigheden enig voorspellend vermogen heeft in Bitcoin. Het antwoord (hieronder) lijkt ja te zijn.

Een blik op precisie-herroepcurves

Een nauwkeurige terugroepcurve voor lange posities (positief label = 1)

Een Precision Recall-curve geeft de afweging weer tussen Precision en Recall over verschillende drempels heen. In dit geval laat het zien dat bij zeer hoge drempels, d.w.z. zeer lage niveaus van herinnering (0.05 en lager), de gemiddelde precisie van het model bij het identificeren van longposities over alle vijf de vouwen stijgt naar de hoge jaren vijftig (en misschien zelfs zestig). Bij de drempel van 0.6 identificeert het Random Forest, over alle vijf de vouwen heen, 75% van de longposities correct, ook al ligt de AUC ruim onder de 0.5.

Een nauwkeurige terugroepcurve voor korte posities (positief label = 0)

De Precision Recall-curve voor shortposities vertelt een soortgelijk verhaal. Hoewel de gemiddelde AUC over alle vijf de curven onder de 0.5 blijft, is er bij zeer hoge drempels een piek in nauwkeurigheid.

Dit suggereert dat VPN alleen in zeer zeldzame gevallen een voorspellend vermogen heeft – misschien hoogstens één of twee keer per maand in deze dataset.

De rol van volatiliteit

Markten gedragen zich over het algemeen heel verschillend tijdens perioden van hoge en lage volatiliteit. De voorspelbaarheid van sommige kenmerken neemt aanzienlijk af tijdens een volatiliteitsschok, terwijl andere kenmerken (waaronder marktmicrostructurele kenmerken) relevanter worden.

Maatstaven voor de toxiciteit van de orderstroom kunnen bijzonder relevant zijn in een markt die toch al volatiel is, waar marktmakers de spread waarmee zij liquiditeit verschaffen al hebben vergroot. Als marktmakers, naast het omgaan met hoge prijsvolatiliteit, ook negatief worden geselecteerd door geïnformeerde handelaren, zou dit een soort ‘dubbele klap’ kunnen vormen (ik speculeer hier natuurlijk puur).

Om deze lijn van speculatie voort te zetten, zouden marktmakers waarschijnlijker verliezen kunnen lijden in een zeer volatiele markt. Dit vergroot de kans dat ze hun voorraad dumpen (zoals ze deden tijdens de Flash Crash van 2010), waardoor een prijsdaling ontstaat.

Evaluatie van VPN met een volatiliteitsdrempel

Een volatiliteitsdrempel verwijdert alle monsters uit de dataset waar de volatiliteit onder een bepaalde benchmark daalt. In deze dataset sluit een volatiliteitsdrempel van 0.02 bijvoorbeeld grofweg drie vijfde van de gegevens uit, maar leidt tot dramatische verbeteringen in de AUC, de Long Precision Recall Curve en de Short Precision Recall Curve.

ROC-curve voor zowel Long (1) als Short (0) posities met een volatiliteitsdrempel van 0.02

De AUC-score stijgt van 0.49 (slechter dan een willekeurige classificatie) naar een respectabele 0.55. De AUC-score ligt in alle vouwen op één na ruim boven de benchmark van 0.5.

De Precision Recall-curve voor lange posities (positief label = 1)

De Precision Recall-curve voor korte posities (positief label = 2)

Voor de Precision Recall-curves lijkt de opname van een volatiliteitsdrempel de precisie dramatisch te hebben verhoogd over een verscheidenheid aan drempels. VPN lijkt een aanzienlijk groter voorspellend vermogen te hebben in markten die toch al volatiel zijn.

Het is natuurlijk mogelijk dat ik de gegevens (op de een of andere manier) overfit heb. Een completere analyse zou dezelfde aanpak toepassen op andere cryptocurrencies zoals Ethereum, Ripple en Cardano om ervoor te zorgen dat VPIN daadwerkelijk prijsbewegingen kan voorspellen en dat zijn voorspellende vermogen toeneemt met de volatiliteit.

Afscheid Gedachten

Marktmakers spelen een van de belangrijkste rollen op een beurs: zij zorgen voor liquiditeit. Wanneer geïnformeerde handelaren echter hun orders selecteren, lijden deze liquiditeitsverschaffers verliezen. Ze staan dan voor de keuze: ze kunnen de kosten van hun diensten verhogen of – in ernstige gevallen – zich volledig uit de markt terugtrekken. Door de onevenwichtigheden in de orderstromen tussen het koop- en verkoopvolume te analyseren, kunnen we de interacties tussen geïnformeerde handelaars en marktmakers modelleren.

Niet alleen kan orderstroomtoxiciteit een rol spelen goede voorspeller van de volatiliteit op de korte termijn – het lijkt erop dat het in sommige (zeer) zeldzame gevallen zelfs grotere prijsbewegingen kan voorspellen.

Het voorspellende vermogen van VPN's neemt sterk toe als de markt in kwestie al behoorlijk volatiel is. Ik kan alleen maar speculeren over de redenen, maar eigenlijk zie ik er twee.

De eerste is dat marktmakers met flinterdunne marges opereren. Als gevolg hiervan is de kans groter dat zij grote verliezen lijden als gevolg van ongunstige selectie op meer volatiele markten.

Bovendien zijn de spreads op volatiele markten al behoorlijk groot. De toxiciteit van de orderstroom zou – naast de volatiliteit – de spreads (en de slippage-kosten voor handelaren) drastisch kunnen vergroten. Handelen wordt erg duur als dit gebeurt; Ik ga ervan uit dat handelaren minder snel zullen kopen vanwege de hoge prijsimpact, maar nog steeds gedwongen zullen zijn om te verkopen als de markt instort.

Bron: https://medium.com/@lucasastorian/empirical-market-microstructure-f67eff3517e0?source=rss——-8—————–cryptocurrency

Tijdstempel: 22 June 2021