Empirisk marknadsmikrostruktur

Källnod: 937627

Från Pexels

Beställ flödestoxicitet på Bitcoin Spot Market

Sedan augusti 2020 har mer än 800 miljarder dollar i USDT-denominerade Bitcoin handlats på Binance — överlägset största Bitcoin utbyte. Liksom på andra marknader kommer det mesta av likviditeten som tillhandahålls på Binance från marknadsgaranter: företag som är villiga att både köpa eller sälja Bitcoin i hopp om att de kommer att göra en vinst på bud-förfrågan.

Marknadsmikrostrukturteori erkännerzinnebär att prisbildningen bestäms av endogena faktorer, såväl som exogena. Likviditet, marknadspåverkan, transaktionskostnader (glidning), volatilitet och mekaniken i limitorderboken spelar alla en väsentlig roll.

Klassisk ekonomisk teori om utbud och efterfrågan antar att varje investerare som är villig att köpa och sälja till jämviktspriset i allmänhet kan göra det. I verkligheten förändrar själva handlingen att köpa eller sälja ett värdepapper marknadspriset; affärer har marknadspåverkan.

En investerare som vill köpa eller sälja en stor mängd Bitcoin kommer inte att utföra hela ordern på en gång. Istället kommer de att göra det gradvis, över tid, för att köpa till det lägsta eller sälja till det högsta priset. Stan Druckenmiller — som tillsammans med George Soros, bröt Bank of England in 1992— nämnde nyligen att han försökte köpa 100 miljoner dollar i Bitcoin 2018. I brist på likviditet tog det två veckor för honom att köpa 20 miljoner dollar, då gav han upp.

Således spelar marknadspåverkan av en handel en betydande roll i investerares beslut att köpa eller sälja ett värdepapper, vilket i sin tur påverkar priset till vilket värdepapperet handlas.

Alla marknadsaktörer går in på en marknad i hopp om att göra vinst, men marknadsgaranter och handlare tjänar (eller förlorar) pengar på fundamentalt olika sätt. Marknadsgaranter både köper och säljer Bitcoin i hopp om att tjäna bud-fråga-spreaden. Handlare köper och säljer Bitcoin eftersom de har en informerad eller oinformerad övertygelse om framtida prisförändringar.

För att tjäna bud-fråga-spreaden måste marknadsgaranter aktivt hantera en inventering av både Bitcoin och Tether. När handelsflöden är balanserade kan de sälja Bitcoin på beställningen och köpa tillbaka den vid budet, vilket gör en vinst. Men om handelsflödena blir för obalanserade blir det svårare för marknadsgaranter att rulla över sitt lager med vinst. I allmänhet kommer marknadsgaranter då att höja priset som de tar ut för sina tjänster – bud-förfrågan-spreaden – vilket ökar handelskostnaderna (slipage) för handlare.

Marknadsgaranter och handlare tjänar (eller förlorar) pengar på fundamentalt olika sätt

Köp- och säljbudet som marknadsgaranter är villiga att tillhandahålla likviditet bestäms av i vilken grad de blir negativt valda av informerade handlare. Om orderflöden blir obalanserade eftersom informerade handlare köper eller säljer Bitcoin anses det orderflödet vara giftigt.

Beställ Flow Toxicitet under Flash-kraschen den 6 maj

2010 publicerade tre forskare från Cornell i samarbete med Tudor Investment Group en papper beskriver hur flashkraschen 2010 – under vilken Dow Jones Industrial Average (DJIA) kortvarigt sjönk 9 % innan det omedelbart återhämtade sig – orsakades av en extrem mängd orderflödestoxicitet.

Modellen som användes för att identifiera giftigt orderflöde – VPIN (volymsynkroniserad sannolikhet för informerad handel) – toppade till rekordnivåer under timmen som ledde fram till flashkraschen och förutspådde framgångsrikt vad som fortfarande anses vara en mystisk händelse.

Tidningen Tudor fick en del uppmärksamhet i media: en Bloomberg Artikeln påpekade att VPIN kan "hjälpa tillsynsmyndigheter att förhindra krascher som störtdykningen den 6 maj". Forskare vid Lawrence Berkeley National Laboratory visade att VPIN lyckades bra med att förutsäga händelser med hög volatilitet på terminsmarknader från januari 2007 till juli 2012.

I briljant senare papperSamma författare påpekar att hög orderflödestoxicitet inte bara tvingar marknadsgaranterna bort från marknaden; om marknadsgaranter måste dumpa sitt lager med förlust kan de tömma eventuell återstående likviditet istället för att tillhandahålla den.

Under timmarna före kraschen den 6 maj hade informerade handlare konsekvent sålt sina positioner till marknadsgaranter, som stod inför ökande förluster. När samma marknadsgaranter så småningom tvingades varva ner sina positioner var resultaten katastrofala. Med forskarnas ord: "extrem toxicitet har förmågan att omvandla likviditetsleverantörer till likviditetskonsumenter".

"Extrem toxicitet har förmågan att omvandla likviditetsleverantörer till likviditetskonsumenter" - Mikrostrukturen av "Flash Crash"

VPIN är baserat på PIN-modellen, som ser handel som ett spel mellan tre typer av deltagare: informerade handlare, oinformerade handlare och marknadsgaranter.

VPN uppskattas som den absoluta skillnaden mellan köp- och säljvolym över ett historiskt fönster. Istället för sampling efter tid, beräknas VPIN med hjälp av fasta volymstaplar. Till exempel kan du prova en gång varje gång 1000 Bitcoins byts ut.

Volymen tenderar att öka när ny information kommer ut på marknaden, och minska när den inte gör det. Sampling efter volym liknar alltså sampling efter volatilitet (och informationsflöde).

En order klassificeras som en köporder om köparen är en informerad handlare; på samma sätt klassificeras en order som en säljorder om säljaren är en informerad handlare. Mer om att identifiera köp- och säljaffärer härnäst.

VPN är den genomsnittliga volymobalansen över ett historiskt fönster med längden n
Beräkna VPIN använder två Panda-serier med klassificerad köp- och säljvolym

Tick-regeln klassificerar informerade köp- och säljaffärer genom att identifiera handelsangriparen, dvs den pristagande parten. En handlare som köper Bitcoin via en marknadsorder kommer att matchas med den bästa fråga i orderboken — ovanför bud-fråga-medelvärdet. Detta gör honom till angriparen. Om en handlare skickar en limitorder för att köpa Bitcoin under bud-fråga-medelvärdet, kan den ordern så småningom fyllas om en annan handlare aggressivt säljer Bitcoin via en marknadsorder.

Tick-regeln identifierar handelsangriparen genom att förlita sig på en enkel observation. Aggressiva köpordrar tenderar att öka priset på en tillgång, eftersom ordern matchas med den lägsta fråga i orderboken. På liknande sätt tenderar aggressiva säljorder att sänka priset på en tillgång efter att det högsta budet matchats. Den efterföljande prisändringen kan användas för att identifiera handelsangriparen.

Tick-regeln (Framsteg inom finansiell maskininlärning, kapitel 19)

Avslut som orsakar en efterföljande prishöjning är märkta som ett 1 - ett köp. Avslut som orsakade en prissänkning är märkta -1 — en försäljning. Avslut som inte orsakar en förändring i priset (eftersom de inte fyllde det högsta budet eller lägsta köpet helt) är märkta med föregående bock.

Medan Tick-regeln (i allmänhet) framgångsrikt identifierar aggressorsidan, tyder en del nyare forskning på att aggressorsidehandlare och informerade handlare kanske inte är likvärdiga på högfrekventa marknader. Till exempel kan en informerad handlare helt enkelt skicka flera limitordrar genom hela orderboken, avbryta de som inte fylls och fortfarande visas oinformerade enligt Tick-regeln.

Den ursprungliga implementeringen av VPN använder en Bayesiansk metod som kallas Bulkvolymklassificering (BVC) för att approximera andelen informerad köp- och säljvolym i varje stapel (antingen tids- eller volymbaserad). Min praktiska erfarenhet av BVC har varit ganska blandad. Istället för att använda BVC bestämde jag mig för att välja ett annat alternativ: använd handelstaggarna som anger om köparen eller säljaren var en market maker i rå Binance Trade-data.

Binance publicerar livehandelsdata via en Websocket-ström, som jag har samlat på en AWS-server sedan början av augusti förra året; det är därifrån min data kommer. Sedan mars 2021 kan du även ladda ner historisk data här.

Jag har beräknat VPIN med hjälp av rullande Dollar Bars med cirka 1600 prover per dag med en fönsterstorlek på 1000. Det betyder att varje volymhink strängt taget inte har exakt samma storlek. Trots det är skillnaderna minimala, så jag känner mig bekväm med att använda den ursprungliga implementeringen utan att behöva vikta enskilda hinkar.

Till skillnad från den ursprungliga implementeringen har köp- och säljvolymer klassificerats med handelsnivåtaggar som anger om köparen var en marknadsgarant eller inte. Dessutom, till skillnad från den ursprungliga implementeringen, är VPN inte stationärt.

Obalanser i orderflödet verkar ha minskat avsevärt under det senaste året då marknadsvärdet och handelsvolymen för Bitcoin ökat. Detta är i linje med forskning som visar att större aktier har lägre bud- och säljspreadar, vilket innebär mindre negativt urval.

VPN beräknat från augusti 2020 till mitten av juni 2021

Obalansen i orderflödet mellan köp- och säljorder på aggressorsidan fram till den sista korrigeringen – 19 maj 2021 – verkar minimal. Det relativt låga VPIN-måttet antyder att toxicitet inte spelade någon roll i korrigeringen.

Ibland tycks de lokala obalanserna i orderflödet nå en topp precis innan en dramatisk prisnedgång – 12 och 18 juni är de bästa exemplen. Det här kan dock bara vara jag som läser in i diagrammet.

Förutsäga trippelbarriäretiketter med VPN

VPN var inte nödvändigtvis utformat för att förutsäga framtida avkastning. Istället beskriver den bara de genomsnittliga, volymvägda orderflödesobalanserna över ett historiskt fönster. Kunskapen om dessa obalanser kan inte nödvändigtvis användas för att förutsäga ihållande, ökning eller minskning av framtida obalanser. Ändå tänkte jag att jag kunde ge det ett försök.

Jag har använt en ganska standardinställning som föreslagits av Marcos López de Prado — följande stycke kommer att låta som skratt för dem som inte är bekanta med Financial Machine Learning, så hoppa över det.

Jag har beräknat volatilitetsjusterade trippelbarriäretiketter för att klassificera prover som antingen långa eller korta positioner. Den maximala etikettbredden är begränsad till 3.5 % i båda riktningarna; vertikala barriärträffar klassificeras efter den absoluta avkastningen över positionens längd. Jag har beräknat provvikter baserat på genomsnittlig unikhet. RF:n tränas med 100 träd, de relevanta maximala proverna per träd, inte mer än en funktion per träd och ett maximalt djup på 6. Data skalas, renas, embargo (5%) och korsvalideras över fem gånger . Läs de två första delarna av Marcos boken om du är intresserad av detaljerna.

Eftersom det verkar vara ett kraftigt avbrott i VPN i slutet av förra året, bestämde jag mig för att bara använda data från de senaste sex och en halv månaderna; alltså ungefär en månads data per veck. Det ger totalt ~250,000 XNUMX prover.

Som i originalpapperet, monterade jag VPIN-metrik med en log-normalfördelning och tränade modellen på CDF för VPIN. Jag använde sju olika fönsterstorlekar: 50, 100, 250, 500, 1000, 2500 och 5000. ROC-kurvorna över alla fem vecken plottas nedan.

Receiver Operating Characteristic (ROC)-kurvor för lång-korta trippelbarriärförutsägelser över fem veck

Modellen presterar klart sämre än 0.5 AUC-riktmärket i genomsnitt, medan prestandan varierar mellan vecken. Ändå kanske en ROC-kurva och AUC-poäng inte är det bästa sättet att utvärdera prestandan för (CDF för) VPIN.

Problemet med en ROC-kurva i Financial Machine Learning är att de inte ger en bra uppfattning om slutresultatet. Det är fullt möjligt – och till och med troligt – att VPIN inte har någon inverkan på prisbildningen under normala marknadsförhållanden. Marknadsgaranter förväntar sig fluktuationer mellan köp- och säljvolymer; det är bara kostnaden för att göra affärer.

Jag vill veta om extremt hög eller låg orderflödestoxicitet under extrema marknadsförhållanden har någon förutsägande kapacitet i Bitcoin. Svaret (nedan) verkar vara ja.

En precisionshämtningskurva för långa positioner (positiv etikett =1)

En Precision Recall-kurva plottar avvägningen mellan Precision och Recall över olika trösklar. I det här fallet visar det att vid mycket höga trösklar, dvs. mycket låga återkallningsnivåer (0.05 och lägre), stiger modellens genomsnittliga precision för att identifiera långa positioner över alla fem vecken till det höga femtiotalet (och kanske till och med sextiotalet). Vid tröskeln 0.6, över alla fem vecken, identifierar Random Forest 75 % av långa positioner korrekt, även om AUC är långt under 0.5.

En precisionsåterkallningskurva för korta positioner (positiv etikett = 0)

Precision Recall-kurvan för korta positioner berättar en liknande historia. Även om den genomsnittliga AUC förblir under 0.5 över alla fem kurvorna finns det en topp i precision vid mycket höga trösklar.

Detta tyder på att VPN endast kan ha prediktiv kapacitet i mycket sällsynta fall - kanske en eller två gånger i månaden i denna datauppsättning som mest.

Marknader beter sig i allmänhet ganska olika under perioder med hög och låg volatilitet. Förutsägbarheten för vissa funktioner minskar markant under en volatilitetschock, medan andra funktioner (inklusive marknadsmikrostrukturella) blir mer relevanta.

Åtgärder för orderflödestoxicitet kan vara särskilt relevanta på en marknad som redan är volatil, där marknadsgaranter redan har utökat spreaden vid vilken de tillhandahåller likviditet. Om, förutom att hantera hög prisvolatilitet, marknadsgaranter också blir negativt utvalda av välinformerade handlare, kan detta utgöra ett slags "dubbelstörning" (jag spekulerar helt klart här).

För att fortsätta denna spekulationslinje kan marknadsgaranterna vara mer benägna att ta förluster på en mycket volatil marknad. Detta ökar sannolikheten att de dumpar sitt lager (som de gjorde under 2010 Flash Crash), vilket orsakar en prissänkning.

En volatilitetströskel tar bort alla prover från datamängden där volatiliteten faller under ett visst riktmärke. Till exempel, i denna datauppsättning utesluter en volatilitetströskel på 0.02 ungefär tre femtedelar av data, men leder till dramatiska förbättringar av AUC, Long Precision Recall Curve och Short Precision Recall Curve.

ROC-kurva för både långa (1) och korta (0) positioner med en volatilitetströskel på 0.02

AUC-poängen stiger från 0.49 (sämre än en slumpmässig klassificerare) till respektabla 0.55. AUC-poängen i alla veck utom en ligger långt över 0.5-riktmärket.

Precision Recall Curve för långa positioner (positiv etikett = 1)
Precision Recall Curve för korta positioner (positiv etikett = 2)

För Precision Recall-kurvorna verkar inkluderingen av en volatilitetströskel ha höjt precisionen dramatiskt över en mängd olika trösklar. VPN verkar ha en betydligt högre förutsägelsekapacitet på marknader som redan är volatila.

Det är naturligtvis möjligt att jag (på något sätt) har överpassat datan. En mer fullständig analys skulle tillämpa samma tillvägagångssätt på andra kryptovalutor som Ethereum, Ripple och Cardano för att säkerställa att VPIN faktiskt kan förutsäga prisrörelser och att dess prediktiva kapacitet ökar med volatiliteten.

Marknadsgaranter spelar en av de viktigaste rollerna på en börs – de tillhandahåller likviditet. Men när informerade handlare hämtar sina beställningar, ådrar sig dessa likviditetsleverantörer förluster. De ställs då inför ett val: de kan öka kostnaderna för sina tjänster eller – i allvarliga fall – dra sig tillbaka från en marknad helt. Genom att analysera obalanserna i orderflödet mellan köp- och säljvolymer kan vi modellera interaktionerna mellan informerade handlare och marknadsgaranter.

Inte bara kan orderflödestoxicitet vara en god prediktor för kortsiktig volatilitet — Det verkar som om det i vissa (mycket) sällsynta fall till och med kan förutsäga större prisrörelser.

VPN:s prediktiva kapacitet ökar kraftigt när marknaden i fråga redan är ganska volatil. Jag kan bara spekulera i anledningarna, men egentligen ser jag två.

Den första är att marknadsgaranter arbetar med knivskarpa marginaler. De är följaktligen mer benägna att ådra sig stora förluster på grund av negativt urval på mer volatila marknader.

Dessutom är spreadarna på volatila marknader redan ganska stora. Orderflödestoxicitet - förutom volatilitet - kan öka spridningarna (och glidningskostnaderna för handlare) drastiskt. Handel blir mycket kostsamt när detta händer; Jag antar att handlare kommer att vara mindre benägna att köpa på grund av den höga prispåverkan, men ändå tvingas sälja om marknaden kollapsar.

Källa: https://medium.com/@lucasastorian/empirical-market-microstructure-f67eff3517e0?source=rss——-8—————–cryptocurrency

Tidsstämpel:

Mer från Medium