Empirisk markedsmikrostruktur

Kilde node: 937627

Fra Pexels

Bestill flyttoksisitet i Bitcoin Spot-markedet

Siden august 2020 har mer enn 800 milliarder dollar med USDT-denominert Bitcoin blitt omsatt på Binance – langt på vei største Bitcoin utveksling. Som i andre markeder, kommer mesteparten av likviditeten tilført på Binance fra markedsmakere: selskaper som er villige til både å kjøpe eller selge Bitcoin i håp om at de vil tjene penger på bud-spreaden.

Markedsmikrostrukturteori anerkjennerzes at prisdannelsen bestemmes av endogene faktorer, så vel som eksogene. Likviditet, markedspåvirkning, transaksjonskostnader (glidning), volatilitet og mekanikken i limitordreboken spiller alle en vesentlig rolle.

Klassisk økonomisk teori om tilbud og etterspørsel antar at enhver investor som er villig til å kjøpe og selge til likevektsprisen, generelt kan gjøre det. I virkeligheten endrer selve handlingen med å kjøpe eller selge et verdipapir markedsprisen; handler har markedspåvirkning.

En investor som ønsker å kjøpe eller selge en stor mengde Bitcoin vil ikke utføre hele ordren på en gang. I stedet vil de gjøre det gradvis, over tid, for å kjøpe til den laveste eller selge til den høyeste prisen. Stan Druckenmiller - som sammen med George Soros, brøt Bank of England in 1992— nevnte nylig at han prøvde å kjøpe 100 millioner dollar i Bitcoin i 2018. I mangel av likviditet tok det ham to uker å kjøpe 20 millioner dollar, da ga han opp.

Dermed spiller markedspåvirkningen av en handel en betydelig rolle i investors beslutninger om å kjøpe eller selge et verdipapir, som igjen påvirker prisen som verdipapiret handles til.

Alle markedsdeltakere går inn i et marked i håp om å tjene penger, men markedsmakere og handelsmenn tjener (eller taper) penger på fundamentalt forskjellige måter. Markedsmakere både kjøper og selger Bitcoin i håp om å tjene bud-spreaden. Traders kjøper og selger Bitcoin fordi de har en informert eller uinformert tro på fremtidige prisendringer.

For å tjene opp bud-spørsmålet, må markedsmakere aktivt administrere en beholdning av både Bitcoin og Tether. Når handelsstrømmene er balanserte, kan de selge Bitcoin på forespørsel og kjøpe den tilbake på budet, og tjene penger. Men hvis handelsstrømmene blir for ubalanserte, blir det vanskeligere for markedsmakere å rulle over varelageret med fortjeneste. Vanligvis vil markedsmakere da øke prisen de tar for tjenestene sine – bud-ask-spreaden – noe som øker handelskostnadene (glidning) for tradere.

Market makers og tradere tjener (eller taper) penger på fundamentalt forskjellige måter

Bud- og utsalgstilbudet som markedsaktører er villige til å gi likviditet til, bestemmes av i hvilken grad de blir negativt valgt av informerte handelsmenn. Hvis ordrestrømmene blir ubalanserte fordi informerte tradere kjøper eller selger Bitcoin, anses denne ordrestrømmen som giftig.

Bestill Flow Toxicity under Flash Crash 6. mai

I 2010 publiserte tre forskere fra Cornell i samarbeid med Tudor Investment Group en papir som beskriver hvordan flash-krasjen i 2010 – hvor Dow Jones Industrial Average (DJIA) kort stupte 9 % før de kom seg umiddelbart – ble forårsaket av en ekstrem mengde ordrestrømtoksisitet.

Modellen som ble brukt til å identifisere giftig ordreflyt – VPIN (volumsynkronisert sannsynlighet for informert handel) – steg til alle tiders høyder i timen før flashkrasj, og forutså vellykket hva som fortsatt anses som en mystisk hendelse.

Tudor-avisen fikk litt oppmerksomhet i media: en Bloomberg Artikkel påpekte at VPIN kunne "hjelpe regulatorer med å forhindre krasj som 6. mai-dykket". Forskere ved Lawrence Berkeley National Laboratory viste at VPIN klarte å forutsi høyvolatilitetshendelser i Futures-markeder fra januar 2007 til juli 2012.

I strålende senere papir, de samme forfatterne påpeker at toksisitet for høy ordrestrøm ikke bare tvinger markedsmakere ut av markedet; hvis markedsmakere må dumpe varelageret sitt med tap, kan de tappe eventuell gjenværende likviditet i stedet for å skaffe den.

I timene før krakket 6. mai, hadde informerte handelsmenn konsekvent solgt sine posisjoner til markedsmakere, som sto overfor økende tap. Da de samme markedsskaperne til slutt ble tvunget til å avvikle posisjonene sine, var resultatene katastrofale. Med forskernes ord: "ekstrem toksisitet har evnen til å forvandle likviditetsleverandører til likviditetsforbrukere".

"Ekstrem toksisitet har evnen til å forvandle likviditetsleverandører til likviditetsforbrukere" - Mikrostrukturen til "Flash Crash"

VPIN er basert på PIN-modellen, som ser på handel som et spill mellom tre typer deltakere: informerte tradere, uinformerte tradere og market makers.

VPN er tilnærmet som den absolutte forskjellen mellom kjøps- og salgsvolum over et historisk vindu. I stedet for prøvetaking etter tid, beregnes VPIN ved hjelp av volumstolper med faste mengder. Du kan for eksempel prøve én gang hver gang 1000 Bitcoins utveksles.

Volumet har en tendens til å øke etter hvert som ny informasjon kommer på markedet, og synke når det ikke gjør det. Sampling etter volum er således beslektet med prøvetaking etter volatilitet (og informasjonsflyt).

En ordre klassifiseres som en kjøpsordre hvis kjøperen er en informert trader; på samme måte klassifiseres en ordre som en salgsordre hvis selgeren er en informert næringsdrivende. Mer om å identifisere kjøp og salg av handler neste gang.

VPN er gjennomsnittlig volumubalanse over et historisk vindu med lengde n
Beregn VPIN bruker to Panda-serier med klassifisert kjøps- og salgsvolum

Tick-regelen klassifiserer informerte kjøps- og salgshandler ved å identifisere handelsangriperen, dvs. den pristakende parten. En trader som kjøper Bitcoin via en markedsordre vil bli matchet med den beste spørringen i ordreboken - over bud-spør-gjennomsnittet. Dette gjør ham til aggressoren. Hvis en trader sender inn en grenseordre for å kjøpe Bitcoin under bud-spørsmålet, kan den ordren til slutt fylles hvis en annen trader aggressivt selger Bitcoin via en markedsordre.

Tick-regelen identifiserer handelsangriperen ved å stole på en enkel observasjon. Aggressive kjøpsordrer har en tendens til å øke prisen på en eiendel, ettersom ordren matches med den laveste forespørselen i ordreboken. På samme måte har aggressive salgsordrer en tendens til å redusere prisen på en eiendel etter at det høyeste budet er matchet. Den påfølgende prisendringen kan brukes til å identifisere handelsangriperen.

Tick-regelen (fremskritt innen finansiell maskinlæring kapittel 19)

Handler som forårsaker en påfølgende prisøkning er merket som 1 - et kjøp. Handler som forårsaket en prisnedgang er merket -1 - et salg. Handler som ikke forårsaker en endring i prisen (fordi de ikke fylte det høyeste budet eller laveste budet helt) er merket med forrige hake.

Selv om Tick-regelen (vanligvis) vellykket identifiserer aggressorsiden, tyder noen nyere forskning på at aggressorsidehandlere og informerte tradere kanskje ikke er likeverdige i høyfrekvente markeder. For eksempel kan en informert forhandler ganske enkelt sende inn flere grenseordrer gjennom hele ordreboken, kansellere de som ikke fylles, og fortsatt fremstå som uinformerte i henhold til Tick-regelen.

Den opprinnelige implementeringen av VPN bruker en Bayesiansk tilnærming kalt Bulkvolumklassifisering (BVC) å tilnærme andelen informert kjøps- og salgsvolum i hver bar (enten tids- eller volumbasert). Min praktiske erfaring med BVC har vært ganske blandet. I stedet for å bruke BVC, bestemte jeg meg for å gå med et annet alternativ: bruk handelskodene som spesifiserer om kjøperen eller selgeren var en market maker i rå Binance Trade-data.

Binance publiserer live handelsdata via en Websocket-strøm, som jeg har samlet på en AWS-server siden begynnelsen av august i fjor; det er der dataene mine kommer fra. Siden mars 2021 kan du også laste ned historiske data her.

Jeg har beregnet VPIN ved å bruke rullende Dollar Bars med omtrent 1600 prøver per dag med en vindusstørrelse på 1000. Dette betyr at hver volumbøtte strengt tatt ikke har nøyaktig samme størrelse. Likevel er forskjellene minimale, så jeg føler meg komfortabel med å bruke den originale implementeringen uten å måtte vekte individuelle bøtter.

I motsetning til den opprinnelige implementeringen, har kjøps- og salgsvolumet blitt klassifisert ved å bruke merkelapper på handelsnivå som spesifiserer om kjøperen var en market maker eller ikke. I motsetning til den opprinnelige implementeringen er ikke VPN-en stasjonær.

Ordreflytubalanser ser ut til å ha redusert betydelig det siste året ettersom markedsverdien og handelsvolumet til Bitcoin økte. Dette er i tråd med forskning som viser at større aksjer har lavere bud-spread-spreader, noe som innebærer mindre uønsket utvalg.

VPN beregnet fra august 2020 til midten av juni 2021

Ordreflytubalansen mellom kjøps- og salgsordre på aggressorsiden frem til den siste korreksjonen – 19. mai 2021 – virker minimal. Den relativt lave VPIN-metrikken antyder at toksisitet ikke spilte noen rolle i korreksjonen.

Noen ganger ser det ut til at de lokale ordreflytubalansene topper seg like før en dramatisk prisnedgang – 12. og 18. juni er de beste eksemplene. Dette kan imidlertid bare være meg som leser inn i diagrammet.

Forutsi trippel barriereetiketter med VPN

VPN ble ikke nødvendigvis designet for å forutsi fremtidig avkastning. I stedet beskriver den bare de gjennomsnittlige, volumvektede ordreflytubalansene over et historisk vindu. Kunnskap om disse ubalansene kan ikke nødvendigvis brukes til å forutsi vedvarende, økning eller reduksjon i fremtidige ubalanser. Likevel tenkte jeg at jeg kunne prøve det.

Jeg har brukt et ganske standardoppsett foreslått av Marcos López de Prado - følgende avsnitt vil høres ut som vrøvl for de som ikke er kjent med Financial Machine Learning, så hopp over det.

Jeg har beregnet volatilitetsjusterte trippelbarriereetiketter for å klassifisere prøver som enten lange eller korte posisjoner. Maksimal etikettbredde er begrenset til 3.5 % i begge retninger; vertikale barrieretreff klassifiseres etter den absolutte avkastningen over lengden av posisjonen. Jeg har beregnet prøvevekter basert på gjennomsnittlig unikhet. RF er trent med 100 trær, de relevante maksimale prøvene per tre, ikke mer enn én funksjon per tre, og en maksimal dybde på 6. Dataene er skalert, renset, embargo (5 %) og kryssvalidert over fem ganger . Les de to første delene av Marcos bok hvis du er interessert i detaljene.

Siden det ser ut til å være et kraftig brudd i VPIN sent i fjor, bestemte jeg meg for å kun bruke data fra de siste seks og en halv månedene; altså omtrent en måned med data per fold. Det gir totalt ~250,000 XNUMX prøver.

Som i det originale papiret, monterte jeg VPIN-metrikk ved å bruke en log-normalfordeling og trente modellen på CDF til VPIN. Jeg brukte syv forskjellige vindusstørrelser: 50, 100, 250, 500, 1000, 2500 og 5000. ROC-kurvene over alle fem foldene er plottet nedenfor.

Receiver Operating Characteristic (ROC)-kurver for lang-korte trippelbarriere-prediksjoner over fem ganger

Modellen underpresterer klart 0.5 AUC-referansen i gjennomsnitt, mens ytelsen varierer på tvers av foldene. En ROC-kurve og AUC-poengsum er kanskje ikke den beste måten å evaluere ytelsen til (CDF-en til) VPIN på.

Problemet med en ROC-kurve i Financial Machine Learning er at de ikke gir en god ide om sluttresultatet. Det er fullt mulig – og til og med sannsynlig – at VPIN ikke har noen innvirkning på prisdannelsen under normale markedsforhold. Markedsmakere forventer faktisk svingninger mellom kjøps- og salgsvolum; det er bare kostnadene ved å gjøre forretninger.

Jeg vil vite om ekstremt høy eller lav ordrestrøm toksisitet under ekstreme markedsforhold har noen prediksjonskapasitet i Bitcoin. Svaret (nedenfor) ser ut til å være ja.

En presisjonsgjenkallingskurve for lange posisjoner (positiv etikett =1)

En Precision Recall-kurve plotter avveiningen mellom Precision og Recall over forskjellige terskler. I dette tilfellet viser det at ved svært høye terskler, det vil si svært lave nivåer av tilbakekalling (0.05 og lavere), stiger den gjennomsnittlige presisjonen til modellen for å identifisere lange posisjoner på tvers av alle fem foldene til de høye femtitallet (og kanskje til og med sekstitallet). Ved 0.6-terskelen, på tvers av alle fem foldene, identifiserer Random Forest 75 % av lange posisjoner riktig, selv om AUC er godt under 0.5.

En presisjonsgjenkallingskurve for korte posisjoner (positiv etikett = 0)

Precision Recall-kurven for korte posisjoner forteller en lignende historie. Selv om gjennomsnittlig AUC forblir under 0.5 over alle fem kurvene, er det en topp i presisjon ved svært høye terskler.

Dette antyder at VPIN bare kan ha prediktiv kapasitet i svært sjeldne tilfeller - kanskje en eller to ganger i måneden i dette datasettet på det meste.

Markeder oppfører seg generelt ganske forskjellig i perioder med høy og lav volatilitet. Forutsigbarheten til noen funksjoner reduseres markant under et volatilitetssjokk, mens andre funksjoner (inkludert markedsmikrostrukturelle) blir mer relevante.

Mål for ordrestrømtoksisitet kan være spesielt relevante i et marked som allerede er volatilt, der markedsaktører allerede har utvidet spredningen de gir likviditet til. Hvis, i tillegg til å håndtere høy prisvolatilitet, markedsmakere også blir negativt valgt av informerte handelsmenn, kan dette danne en slags "dobbel whammy" (jeg spekulerer selvfølgelig her).

For å fortsette denne linjen med spekulasjoner, kan det være mer sannsynlig at markedsmakere tar tap i et svært volatilt marked. Dette øker sannsynligheten for at de dumper varelageret sitt (som de gjorde under Flash Crash i 2010), og forårsaker en prisnedgang.

En volatilitetsterskel fjerner alle prøver fra datasettet der volatiliteten faller under en viss referanseverdi. For eksempel, i dette datasettet, ekskluderer en volatilitetsterskel på 0.02 omtrent tre femtedeler av dataene, men fører til dramatiske forbedringer i AUC, Long Precision Recall Curve og Short Precision Recall Curve.

ROC-kurve for både lang (1) og kort (0) posisjoner med en volatilitetsterskel på 0.02

AUC-poengsummen stiger fra 0.49 (verre enn en tilfeldig klassifiserer), til respektable 0.55. AUC-poengsummen i alle folder unntatt én er godt over 0.5 benchmark.

Presisjonsgjenkallingskurven for lange posisjoner (positiv etikett = 1)
Presisjonsgjenkallingskurven for korte posisjoner (positiv etikett = 2)

For Precision Recall-kurvene ser det ut til at inkluderingen av en volatilitetsterskel har hevet presisjonen dramatisk over en rekke terskler. VPN ser ut til å ha en betydelig høyere prediksjonskapasitet i markeder som allerede er volatile.

Det er selvfølgelig mulig at jeg (på en eller annen måte) har overtilpasset dataene. En mer fullstendig analyse vil bruke samme tilnærming til andre kryptovalutaer som Ethereum, Ripple og Cardano for å sikre at VPIN faktisk kan forutsi prisbevegelser, og at dens prediksjonskapasitet øker med volatilitet.

Markedsskapere spiller en av de viktigste rollene på en børs – de gir likviditet. Men når informerte handelsmenn plukker av bestillingene sine, pådrar disse likviditetstilbyderne tap. De står da overfor et valg: de kan øke kostnadene for tjenestene sine eller – i alvorlige tilfeller – trekke seg fullstendig fra et marked. Ved å analysere ordreflytubalansene mellom kjøps- og salgsvolum, kan vi modellere interaksjonene mellom informerte tradere og markedsmakere.

Ikke bare kan ordreflyt-toksisitet være en god prediktor for kortsiktig volatilitet — det ser ut til at det i noen (veldig) sjeldne tilfeller til og med kan forutsi større prisbevegelser.

VPNs prediksjonskapasitet øker kraftig når det aktuelle markedet allerede er ganske volatilt. Jeg kan bare spekulere i årsakene, men egentlig ser jeg to.

Den første er at market makers opererer med syltemme marginer. De er følgelig mer sannsynlig å pådra seg store tap på grunn av uønsket utvalg i mer volatile markeder.

Dessuten er spreadene i volatile markeder allerede ganske store. Toksisitet for ordreflyt – i tillegg til volatilitet – kan øke spredningen (og glidekostnadene for tradere) drastisk. Handel blir svært kostbart når dette skjer; Jeg antar at tradere vil være mindre sannsynlige å kjøpe på grunn av den høye prispåvirkningen, men fortsatt tvunget til å selge hvis markedet kollapser.

Kilde: https://medium.com/@lucasastorian/empirical-market-microstructure-f67eff3517e0?source=rss——-8—————–cryptocurrency

Tidstempel:

Mer fra Medium