Microstruttura empirica del mercato

Nodo di origine: 937627

Da Pexels

Tossicità del flusso degli ordini nel mercato spot di Bitcoin

Dall’agosto del 2020, su Binance sono stati scambiati più di 800 miliardi di dollari di Bitcoin denominati in USDT: di gran lunga il maggiore Scambio di Bitcoin. Come in altri mercati, la maggior parte della liquidità fornita su Binance proviene da market maker: aziende disposte ad acquistare o vendere Bitcoin nella speranza di realizzare un profitto sullo spread bid-ask.

Riconoscimenti della teoria microstrutturale del mercatozes che la formazione dei prezzi è determinata da fattori endogeni, oltre che esogeni. La liquidità, l’impatto sul mercato, i costi di transazione (slippage), la volatilità e i meccanismi del limit order book svolgono tutti un ruolo sostanziale.

La teoria economica classica della domanda e dell’offerta presuppone che qualsiasi investitore disposto ad acquistare e vendere al prezzo di equilibrio possa generalmente farlo. In realtà, l’atto stesso di acquistare o vendere un titolo modifica il prezzo di mercato; le operazioni hanno un impatto sul mercato.

Un investitore che desidera acquistare o vendere una grande quantità di Bitcoin non eseguirà l’intero ordine in una volta. Lo faranno invece gradualmente, nel tempo, per acquistare al prezzo più basso o vendere al prezzo più alto. Stan Druckenmiller – che, insieme a George Soros, ha rotto la Banca d'Inghilterra in 1992— ha recentemente menzionato che lui provato a comprare 100 milioni di dollari in Bitcoin nel 2018. In mancanza di liquidità, gli ci sono volute due settimane per acquistare 20 milioni di dollari, a quel punto ha rinunciato.

Pertanto, l'impatto sul mercato di un'operazione gioca un ruolo significativo nelle decisioni degli investitori di acquistare o vendere un titolo, il che a sua volta influisce sul prezzo al quale tale titolo viene scambiato.

Tutti i partecipanti al mercato entrano in un mercato nella speranza di realizzare un profitto, ma i market maker e i trader guadagnano (o perdono) denaro in modi fondamentalmente diversi. I market maker acquistano e vendono Bitcoin nella speranza di guadagnare lo spread bid-ask. I trader acquistano e vendono Bitcoin perché hanno una convinzione informata o meno sulle future variazioni di prezzo.

Per guadagnare lo spread bid-ask, i market maker devono gestire attivamente un inventario sia di Bitcoin che di Tether. Quando i flussi di scambio sono equilibrati, possono vendere Bitcoin alla richiesta e riacquistarlo all’offerta, realizzando un profitto. Tuttavia, se i flussi commerciali diventano troppo sbilanciati, diventa più difficile per i market maker rinnovare il proprio inventario con profitto. In generale, i market maker aumenteranno quindi il prezzo che applicano per i loro servizi – lo spread bid-ask – che aumenta i costi di negoziazione (slippage) per i trader.

I market maker e i trader guadagnano (o perdono) denaro in modi fondamentalmente diversi

Il prezzo denaro e lettera al quale i market maker sono disposti a fornire liquidità è determinato dal grado in cui vengono selezionati negativamente dai trader informati. Se i flussi di ordini diventano sbilanciati perché trader informati acquistano o vendono Bitcoin, quel flusso di ordini è considerato tossico.

Tossicità del flusso dell'ordine durante il flash crash del 6 maggio

Nel 2010, tre ricercatori della Cornell in collaborazione con Tudor Investment Group hanno pubblicato a carta descrivendo come il flash crash del 2010 – durante il quale il Dow Jones Industrial Average (DJIA) crollò brevemente del 9% prima di riprendersi immediatamente – sia stato causato da un’estrema tossicità del flusso degli ordini.

Il modello utilizzato per identificare il flusso di ordini tossici - VPIN (probabilità sincronizzata al volume del trading informato) - ha raggiunto i massimi storici nell'ora precedente al flash crash e ha previsto con successo quello che è ancora considerato un evento misterioso.

Il giornale Tudor ha ricevuto una certa attenzione da parte dei media: un Bloomberg articolo ha sottolineato che il VPIN potrebbe “aiutare le autorità di regolamentazione a prevenire crolli come il crollo del 6 maggio”. I ricercatori del Lawrence Berkeley National Laboratory hanno dimostrato che VPIN è riuscito a prevedere bene gli eventi di elevata volatilità nei mercati dei futures da gennaio 2007 a luglio 2012.

Nel brillante carta successiva, gli stessi autori sottolineano che la tossicità del flusso di ordine elevato non si limita a costringere i market maker a uscire dal mercato; se i market maker devono vendere le loro scorte in perdita, possono drenare tutta la liquidità rimanente invece di fornirla.

Nelle ore precedenti al crollo del 6 maggio, i trader informati avevano costantemente venduto le loro posizioni ai market maker, che hanno dovuto affrontare perdite crescenti. Quando questi stessi market maker alla fine furono costretti a liquidare le loro posizioni, i risultati furono catastrofici. Nelle parole dei ricercatori: “la tossicità estrema ha la capacità di trasformare i fornitori di liquidità in consumatori di liquidità”.

“La tossicità estrema ha la capacità di trasformare i fornitori di liquidità in consumatori di liquidità” – La microstruttura del 'Flash Crash'

VPIN si basa sul modello PIN, che vede il trading come un gioco tra tre tipi di partecipanti: trader informati, trader non informati e market maker.

Il VPIN viene approssimato come la differenza assoluta tra il volume di acquisto e quello di vendita in una finestra storica. Invece del campionamento in base al tempo, il VPIN viene calcolato utilizzando barre del volume a importo fisso. Ad esempio, potresti campionare una volta ogni volta che vengono scambiati 1000 Bitcoin.

Il volume tende ad aumentare man mano che nuove informazioni arrivano sul mercato e a diminuire quando ciò non avviene. Pertanto, il campionamento per volume è simile al campionamento per volatilità (e flusso di informazioni).

Un ordine è classificato come ordine di acquisto se l'acquirente è un commerciante informato; allo stesso modo, un ordine è classificato come ordine di vendita se il venditore è un commerciante informato. Maggiori informazioni sull'identificazione delle operazioni di acquisto e vendita verranno fornite successivamente.

VPIN è lo squilibrio di volume medio su una finestra storica di lunghezza n
Calcola VPNIN utilizza due serie Panda di volume di acquisto e vendita classificato

La Tick Rule classifica le operazioni di acquisto e vendita informate identificando l'aggressore dell'operazione, ovvero la parte che prende il prezzo. Un trader che acquista Bitcoin tramite un ordine di mercato verrà abbinato alla migliore domanda nel book degli ordini, al di sopra della media bid-ask. Questo fa di lui l'aggressore. Se un trader invia un ordine limite per acquistare Bitcoin al di sotto della media bid-ask, quell'ordine potrebbe eventualmente essere eseguito se un altro trader vende in modo aggressivo Bitcoin tramite un ordine di mercato.

La Tick Rule identifica l’aggressore commerciale basandosi su una semplice osservazione. Gli ordini di acquisto aggressivi tendono ad aumentare il prezzo di un asset, poiché l'ordine viene abbinato alla domanda più bassa nel book degli ordini. Allo stesso modo, gli ordini di vendita aggressivi tendono a diminuire il prezzo di un asset dopo che è stata abbinata l’offerta più alta. La successiva variazione di prezzo può essere utilizzata per identificare l’aggressore commerciale.

La regola del tick (Progressi nell'apprendimento automatico finanziario, capitolo 19)

Le operazioni che causano un successivo aumento del prezzo sono etichettate come 1: un acquisto. Le operazioni che hanno causato una diminuzione del prezzo sono etichettate con -1: una vendita. Le operazioni che non causano un cambiamento nel prezzo (perché non hanno soddisfatto completamente l'offerta più alta o la domanda più bassa) sono etichettate con il segno di spunta precedente.

Sebbene la Tick Rule (generalmente) identifichi con successo il lato aggressore, alcune ricerche recenti suggeriscono che i trader aggressori e i trader informati potrebbero non essere equivalenti nei mercati ad alta frequenza. Ad esempio, un trader informato potrebbe semplicemente inviare più ordini limite in tutto il book degli ordini, cancellare quelli che non vengono riempiti e apparire comunque disinformato secondo la Tick Rule.

L'implementazione originale di VPIN utilizza un approccio bayesiano chiamato Classificazione del volume sfuso (BVC) per approssimare la proporzione del volume di acquisto e vendita informato in ciascuna barra (in base al tempo o al volume). La mia esperienza pratica con BVC è stata piuttosto contrastante. Invece di utilizzare BVC, ho deciso di optare per un'altra opzione: utilizzare i tag commerciali che specificano se l'acquirente o il venditore era un market maker nei dati grezzi di Binance Trade.

Binance pubblica dati commerciali in tempo reale tramite un flusso Websocket, che ho raccolto su un server AWS dall'inizio di agosto dello scorso anno; è da lì che provengono i miei dati. Da marzo 2021 è possibile scaricare anche i dati storici

Ho calcolato il VPIN utilizzando Dollar Bar rotanti con circa 1600 campioni al giorno con una dimensione della finestra di 1000. Ciò significa che ogni bucket di volume non ha esattamente la stessa dimensione. Anche così, le differenze sono minime, quindi mi sento a mio agio nell'utilizzare l'implementazione originale senza dover appesantire i singoli bucket.

A differenza dell'implementazione originale, i volumi di acquisto e vendita sono stati classificati utilizzando tag a livello commerciale che specificano se l'acquirente era o meno un market maker. Inoltre, a differenza dell'implementazione originale, VPNIN non è stazionario.

Gli squilibri nel flusso degli ordini sembrano essere diminuiti in modo significativo nell’ultimo anno con l’aumento della capitalizzazione di mercato e del volume degli scambi di Bitcoin. Ciò è in linea con la ricerca che mostra che i titoli più grandi hanno spread denaro-lettera più bassi, il che implica una selezione meno avversa.

VPNIN Calcolato da agosto 2020 a metà giugno 2021

Lo squilibrio nel flusso degli ordini tra gli ordini di acquisto e di vendita dal lato dell’aggressore che hanno portato all’ultima correzione, il 19 maggio 2021, appare minimo. La metrica VPIN relativamente bassa implica che la tossicità non ha avuto un ruolo nella correzione.

A volte, gli squilibri localizzati nel flusso degli ordini sembrano raggiungere il picco appena prima di un drammatico calo del prezzo: il 12 e il 18 giugno ne sono gli esempi migliori. Tuttavia, potrei essere io a leggere il grafico.

Previsione delle etichette a tripla barriera con VPNIN

Il VPNIN non è stato necessariamente progettato per prevedere i rendimenti futuri. Invece, descrive semplicemente gli squilibri medi del flusso degli ordini ponderati in base al volume in una finestra storica. La conoscenza di questi squilibri non può necessariamente essere utilizzata per prevedere la persistenza, l’aumento o la diminuzione degli squilibri futuri. Tuttavia, ho pensato che avrei potuto provarci.

Ho utilizzato una configurazione piuttosto standard proposta da Marcos López de Prado: il paragrafo seguente sembrerà senza senso per chi non ha familiarità con il Financial Machine Learning, quindi sentiti libero di saltarlo.

Ho calcolato le etichette Triple Barrier corrette per la volatilità per classificare i campioni come posizioni lunghe o corte. La larghezza massima dell'etichetta è limitata al 3.5% in entrambe le direzioni; I colpi della barriera verticale sono classificati in base al rendimento assoluto sulla durata della posizione. Ho calcolato i pesi dei campioni in base all'unicità media. L'RF viene addestrato con 100 alberi, i campioni massimi rilevanti per albero, non più di una caratteristica per albero e una profondità massima di 6. I dati vengono ridimensionati, eliminati, sottoposti a embargo (5%) e convalidati in modo incrociato su cinque volte . Leggi le prime due parti di Marcos' libro se ti interessano i dettagli.

Poiché sembra esserci una brusca interruzione nel VPIN alla fine dell'anno scorso, ho deciso di utilizzare solo i dati degli ultimi sei mesi e mezzo; quindi circa un mese di dati per piega. Ciò equivale a un totale di circa 250,000 campioni.

Come nell'articolo originale, ho adattato la metrica VPIN utilizzando una distribuzione log-normale e ho addestrato il modello sul CDF di VPIN. Ho utilizzato sette diverse dimensioni di finestra: 50, 100, 250, 500, 1000, 2500 e 5000. Le curve ROC su tutte e cinque le pieghe sono tracciate di seguito.

Le curve ROC (Receiver Operating Characteristic) delle previsioni a tripla barriera lungo-corto su cinque pieghe

Il modello ha chiaramente prestazioni inferiori al benchmark di 0.5 AUC in media, mentre le prestazioni variano a seconda dei casi. Tuttavia, una curva ROC e il punteggio AUC potrebbero non essere il modo migliore per valutare le prestazioni del (CDF del) VPIN.

Il problema con una curva ROC nel Financial Machine Learning è che non danno una buona idea delle prestazioni finali. È del tutto possibile – e persino probabile – che VPIN non abbia alcun impatto sulla formazione dei prezzi durante le normali condizioni di mercato. In effetti, i market maker si aspettano fluttuazioni tra il volume di acquisto e quello di vendita; questo è solo il costo per fare affari.

Voglio sapere se la tossicità del flusso di ordini estremamente alto o basso durante condizioni di mercato estreme ha qualche capacità predittiva in Bitcoin. La risposta (sotto) sembra essere sì.

Una curva di richiamo di precisione per posizioni lunghe (etichetta positiva = 1)

Una curva Precision Recall traccia il compromesso tra Precision e Recall su diverse soglie. In questo caso, si mostra che a soglie molto elevate, cioè livelli di richiamo molto bassi (0.05 e inferiori), la precisione media del modello nell'identificare le posizioni lunghe su tutte e cinque le pieghe sale fino a raggiungere i cinquanta (e forse anche i sessanta). Alla soglia 0.6, su tutte e cinque le pieghe, la Random Forest identifica correttamente il 75% delle posizioni lunghe, anche se l'AUC è ben inferiore a 0.5.

Una curva di richiamo di precisione per posizioni corte (etichetta positiva = 0)

La curva Precision Recall per le posizioni corte racconta una storia simile. Anche se l’AUC media rimane inferiore a 0.5 in tutte e cinque le curve, si verifica un picco di precisione a soglie molto elevate.

Ciò suggerisce che VPIN può avere capacità predittiva solo in casi molto rari, forse una o due volte al mese al massimo in questo set di dati.

I mercati generalmente si comportano in modo abbastanza diverso durante i periodi di alta e bassa volatilità. La prevedibilità di alcune caratteristiche diminuisce notevolmente durante uno shock di volatilità, mentre altre caratteristiche (comprese quelle microstrutturali del mercato) diventano più rilevanti.

Le misure della tossicità del flusso degli ordini potrebbero essere particolarmente rilevanti in un mercato già volatile, dove i market maker hanno già ampliato lo spread al quale forniscono liquidità. Se, oltre a gestire l'elevata volatilità dei prezzi, i market maker vengono anche selezionati negativamente da trader informati, ciò potrebbe costituire una sorta di “doppio smacco” (qui ovviamente sto puramente speculando).

Per continuare questa linea di speculazione, i market maker potrebbero avere maggiori probabilità di subire perdite in un mercato altamente volatile. Ciò aumenta la probabilità che scarichino il loro inventario (come hanno fatto durante il Flash Crash del 2010), causando una diminuzione dei prezzi.

Una soglia di volatilità rimuove tutti i campioni dal set di dati in cui la volatilità scende al di sotto di un determinato benchmark. Ad esempio, in questo set di dati, una soglia di volatilità pari a 0.02 esclude circa tre quinti dei dati, ma porta a notevoli miglioramenti nell'AUC, nella curva di richiamo a precisione lunga e nella curva di richiamo a precisione breve.

Curva ROC per posizioni lunghe (1) e corte (0) con una soglia di volatilità di 0.02

Il punteggio AUC sale da 0.49 (peggiore di un classificatore casuale) a un rispettabile 0.55. Il punteggio AUC in tutte le pieghe tranne una è ben al di sopra del benchmark 0.5.

La curva di richiamo di precisione per posizioni lunghe (etichetta positiva = 1)
La curva di richiamo di precisione per le posizioni corte (etichetta positiva = 2)

Per le curve Precision Recall, l'inclusione di una soglia di volatilità sembra aver aumentato notevolmente la precisione su una varietà di soglie. Il VPN sembra avere una capacità predittiva significativamente più elevata nei mercati già volatili.

Ovviamente è possibile che io abbia (in qualche modo) adattato eccessivamente i dati. Un'analisi più completa applicherebbe questo stesso approccio ad altre criptovalute come Ethereum, Ripple e Cardano per garantire che VPIN possa effettivamente prevedere i movimenti dei prezzi e che la sua capacità predittiva aumenti con la volatilità.

I market maker svolgono uno dei ruoli più importanti in una borsa: forniscono liquidità. Tuttavia, quando i trader informati accettano i loro ordini, questi fornitori di liquidità subiscono perdite. Si trovano quindi di fronte a una scelta: possono aumentare il costo dei loro servizi o, nei casi più gravi, ritirarsi completamente dal mercato. Analizzando gli squilibri del flusso degli ordini tra il volume di acquisto e quello di vendita, possiamo modellare le interazioni tra trader informati e market maker.

Non solo la tossicità del flusso di ordine può essere a buon predittore della volatilità a breve termine – sembra che in alcuni (molto) rari casi possa persino prevedere movimenti di prezzo più ampi.

La capacità predittiva dei VPIN aumenta notevolmente quando il mercato in questione è già piuttosto volatile. Posso solo fare supposizioni sui motivi, ma in realtà ne vedo due.

Il primo è che i market maker operano con margini sottilissimi. Di conseguenza, è più probabile che subiscano ingenti perdite a causa della selezione avversa in mercati più volatili.

Inoltre, nei mercati volatili gli spread sono già piuttosto ampi. La tossicità del flusso degli ordini, oltre alla volatilità, potrebbe aumentare drasticamente gli spread (e i costi di slippage per i trader). Il trading diventa molto costoso quando ciò accade; Presumo che i trader saranno meno propensi ad acquistare a causa dell’elevato impatto sui prezzi, ma saranno comunque costretti a vendere se il mercato sta crollando.

Fonte: https://medium.com/@lucasastorian/empirical-market-microstructure-f67eff3517e0?source=rss——-8—————–criptovaluta

Timestamp:

Di più da Medio