Microestrutura Empírica de Mercado

Nó Fonte: 937627

De Pexels

Toxicidade do fluxo de pedidos no mercado spot de Bitcoin

Desde agosto de 2020, mais de 800 bilhões de dólares em Bitcoin denominados em USDT foram negociados na Binance – de longe o maior Troca de bitcoins. Como em outros mercados, a maior parte da liquidez fornecida na Binance vem de formadores de mercado: empresas que estão dispostas a comprar ou vender Bitcoin na esperança de obter lucro com o spread bid-ask.

A teoria microestrutural do mercado reconhecezafirma que a formação de preços é determinada por fatores endógenos, bem como por fatores exógenos. A liquidez, o impacto no mercado, os custos de transação (slippage), a volatilidade e a mecânica da carteira de ordens com limite desempenham um papel substancial.

A teoria económica clássica da oferta e da procura pressupõe que qualquer investidor disposto a comprar e vender ao preço de equilíbrio pode geralmente fazê-lo. Na realidade, o próprio ato de comprar ou vender um título altera o preço de mercado; as negociações têm impacto no mercado.

Um investidor que deseja comprar ou vender uma grande quantidade de Bitcoin não executará a ordem inteira de uma vez. Em vez disso, farão isso gradualmente, ao longo do tempo, para comprar pelo preço mais baixo ou vender pelo preço mais alto. Stan Druckenmiller – que, junto com George Soros, quebrou o Banco da Inglaterra eum 1992 - mencionou recentemente que ele tentei comprar US$ 100 milhões em Bitcoin em 2018. Sem liquidez, ele levou duas semanas para comprar US$ 20 milhões, momento em que desistiu.

Assim, o impacto de uma negociação no mercado desempenha um papel significativo nas decisões dos investidores de comprar ou vender um título, o que, por sua vez, afecta o preço a que esse título é negociado.

Todos os participantes no mercado entram num mercado na esperança de obter lucro, mas os criadores de mercado e os comerciantes ganham (ou perdem) dinheiro de formas fundamentalmente diferentes. Os formadores de mercado compram e vendem Bitcoin na esperança de obter o spread bid-ask. Os comerciantes compram e vendem Bitcoin porque têm uma crença informada ou desinformada sobre futuras mudanças de preços.

Para obter o spread bid-ask, os formadores de mercado devem gerenciar ativamente um estoque de Bitcoin e Tether. Quando os fluxos de negociação são equilibrados, eles podem vender Bitcoin na oferta e comprá-lo de volta na oferta, obtendo lucro. No entanto, se os fluxos comerciais se tornarem demasiado desequilibrados, será mais difícil para os criadores de mercado renovarem os seus inventários com lucro. Geralmente, os criadores de mercado aumentarão então o preço que cobram pelos seus serviços – o spread bid-ask – o que aumenta os custos de negociação (slippage) para os traders.

Os formadores de mercado e os comerciantes ganham (ou perdem) dinheiro de maneiras fundamentalmente diferentes

A oferta e a procura em que os criadores de mercado estão dispostos a fornecer liquidez são determinadas pelo grau em que estão a ser selecionados negativamente por traders informados. Se os fluxos de pedidos ficarem desequilibrados porque comerciantes informados estão comprando ou vendendo Bitcoin, esse fluxo de pedidos será considerado tóxico.

Toxicidade do fluxo de pedidos durante o Flash Crash de 6 de maio

Em 2010, três pesquisadores de Cornell, em colaboração com o Tudor Investment Group, publicaram um papel descrevendo como o flash crash de 2010 – durante o qual o Dow Jones Industrial Average (DJIA) despencou brevemente 9% antes de se recuperar imediatamente – foi causado por uma quantidade extrema de toxicidade no fluxo de pedidos.

O modelo usado para identificar o fluxo de pedidos tóxicos - VPIN (probabilidade sincronizada por volume de negociação informada) - atingiu máximos históricos na hora que antecedeu o flash crash e previu com sucesso o que ainda é considerado um evento misterioso.

O jornal Tudor recebeu alguma atenção da mídia: um Bloomberg artigo destacou que o VPIN poderia “ajudar os reguladores a evitar falhas como a queda de 6 de maio”. Pesquisadores do Laboratório Nacional Lawrence Berkeley mostraram que o VPIN teve um bom desempenho na previsão de eventos de alta volatilidade nos mercados de futuros de janeiro de 2007 a julho de 2012.

Em brilhante papel posterior, os mesmos autores apontam que a elevada toxicidade do fluxo de pedidos não apenas força os formadores de mercado a sair do mercado; se os criadores de mercado tiverem de se desfazer dos seus inventários com prejuízo, poderão drenar qualquer liquidez restante em vez de fornecê-la.

Nas horas que antecederam a quebra de 6 de Maio, os traders informados venderam consistentemente as suas posições aos criadores de mercado, que enfrentaram perdas crescentes. Quando estes mesmos formadores de mercado foram finalmente forçados a desfazer as suas posições, os resultados foram catastróficos. Nas palavras dos pesquisadores: “a toxicidade extrema tem a capacidade de transformar provedores de liquidez em consumidores de liquidez”.

“A toxicidade extrema tem a capacidade de transformar fornecedores de liquidez em consumidores de liquidez” – A microestrutura do ‘Flash Crash’

O VPIN é baseado no modelo PIN, que vê a negociação como um jogo entre três tipos de participantes: traders informados, traders desinformados e criadores de mercado.

O VPIN é aproximado como a diferença absoluta entre o volume de compra e venda em uma janela histórica. Em vez de amostragem por tempo, o VPIN é calculado usando barras de volume de valor fixo. Por exemplo, você pode amostrar uma vez cada vez que 1000 Bitcoins forem trocados.

O volume tende a aumentar à medida que novas informações chegam ao mercado e a diminuir quando isso não acontece. Assim, a amostragem por volume é semelhante à amostragem por volatilidade (e fluxo de informação).

Uma ordem é classificada como ordem de compra se o comprador for um comerciante informado; da mesma forma, uma ordem é classificada como ordem de venda se o vendedor for um comerciante informado. Mais sobre como identificar negociações de compra e venda a seguir.

VPIN é o desequilíbrio de volume médio em uma janela histórica de comprimento n
Calcular VPIN usa duas séries Pandas de volume classificado de compra e venda

A Regra Tick classifica as negociações de compra e venda informadas, identificando o agressor da negociação, ou seja, a parte tomadora do preço. Um trader que comprar Bitcoin por meio de uma ordem de mercado será correspondido com a melhor oferta na carteira de ofertas – acima da média de compra e venda. Isso faz dele o agressor. Se um trader enviar uma ordem limitada para comprar Bitcoin abaixo da média de compra e venda, essa ordem poderá eventualmente ser atendida se outro trader vender agressivamente Bitcoin por meio de uma ordem de mercado.

A Regra Tick identifica o agressor comercial com base em uma simples observação. Ordens de compra agressivas tendem a aumentar o preço de um ativo, pois a ordem corresponde à oferta mais baixa na carteira de ofertas. Da mesma forma, ordens de venda agressivas tendem a diminuir o preço de um ativo após o lance mais alto ser correspondido. A mudança de preço subsequente pode ser usada para identificar o agressor comercial.

A regra do tick (avanços no aprendizado de máquina financeira, capítulo 19)

As negociações que causam um aumento de preço subsequente são rotuladas como 1 – uma compra. As negociações que causaram uma queda no preço são rotuladas como -1 – uma venda. As negociações que não causam alteração no preço (porque não preencheram completamente o lance mais alto ou o pedido mais baixo) são rotuladas com o tick anterior.

Embora a Regra do Tick (geralmente) identifique com sucesso o lado agressor, algumas pesquisas recentes sugerem que os traders do lado agressor e os traders informados podem não ser equivalentes nos mercados de alta frequência. Por exemplo, um trader informado poderia simplesmente enviar múltiplas ordens com limite em toda a carteira de ofertas, cancelar aquelas que não foram preenchidas e ainda assim parecer desinformado de acordo com a Regra do Tick.

A implementação original do VPIN usa uma abordagem Bayesiana chamada Classificação de volume a granel (BVC) para aproximar a proporção do volume de compra e venda informado em cada barra (com base no tempo ou no volume). Minha experiência prática com BVC tem sido bastante mista. Em vez de usar BVC, decidi escolher outra opção: usar tags comerciais que especificam se o comprador ou vendedor era um formador de mercado nos dados brutos da Binance Trade.

A Binance publica dados comerciais ao vivo por meio de um fluxo Websocket, que venho coletando em um servidor AWS desde o início de agosto do ano passado; é daí que vêm meus dados. Desde março de 2021, você também pode baixar dados históricos Aqui.

Calculei o VPIN usando barras de dólar rolantes com aproximadamente 1600 amostras por dia com um tamanho de janela de 1000. Isso significa que cada intervalo de volume não tem exatamente o mesmo tamanho. Mesmo assim, as diferenças são mínimas, por isso me sinto confortável usando a implementação original sem ter que pesar baldes individuais.

Ao contrário da implementação original, os volumes de compra e venda foram classificados usando tags de nível comercial que especificam se o comprador era um formador de mercado ou não. Além disso, diferentemente da implementação original, o VPIN não é estacionário.

Os desequilíbrios no fluxo de pedidos parecem ter diminuído significativamente no ano passado, à medida que a capitalização de mercado e o volume de negociação do Bitcoin aumentaram. Isto está em linha com estudos que mostram que as ações maiores têm spreads de compra e venda mais baixos, o que implica menos seleção adversa.

VPIN calculado de agosto de 2020 a meados de junho de 2021

O desequilíbrio no fluxo de ordens entre as ordens de compra e venda do lado agressor que levaram à última correção – 19 de maio de 2021 – parece mínimo. A métrica VPIN relativamente baixa implica que a toxicidade não desempenhou um papel na correção.

Às vezes, os desequilíbrios localizados no fluxo de pedidos parecem atingir o pico pouco antes de uma queda dramática no preço – 12 e 18 de junho são os melhores exemplos. No entanto, isso poderia ser apenas eu lendo o gráfico.

Previsão de rótulos de barreira tripla com VPIN

O VPIN não foi necessariamente concebido para prever retornos futuros. Em vez disso, apenas descreve os desequilíbrios médios do fluxo de pedidos ponderados pelo volume ao longo de uma janela histórica. O conhecimento destes desequilíbrios não pode necessariamente ser utilizado para prever a persistência, o aumento ou a diminuição de desequilíbrios futuros. Mesmo assim, pensei em tentar.

Usei uma configuração bastante padrão proposta por Marcos López de Prado - o parágrafo a seguir soará como algo sem sentido para aqueles que não estão familiarizados com o Financial Machine Learning, então fique à vontade para ignorá-lo.

Calculei rótulos de barreira tripla ajustados à volatilidade para classificar as amostras como posições longas ou curtas. A largura máxima da etiqueta é limitada a 3.5% em qualquer direção; os acertos da barreira vertical são classificados pelo retorno absoluto ao longo da duração da posição. Calculei os pesos das amostras com base na exclusividade média. O RF é treinado com 100 árvores, o máximo de amostras relevantes por árvore, não mais do que um recurso por árvore e uma profundidade máxima de 6. Os dados são dimensionados, eliminados, embargados (5%) e validados cruzados em cinco dobras. . Leia as duas primeiras partes do livro de Marcos livro se você estiver interessado nos detalhes.

Como parece haver uma queda acentuada no VPIN no final do ano passado, decidi usar apenas os dados dos últimos seis meses e meio; então, cerca de um mês de dados por dobra. Isso perfaz um total de aproximadamente 250,000 amostras.

Como no artigo original, ajustei a métrica VPIN usando uma distribuição log-normal e treinei o modelo no CDF do VPIN. Usei sete tamanhos de janela diferentes: 50, 100, 250, 500, 1000, 2500 e 5000. As curvas ROC em todas as cinco dobras estão plotadas abaixo.

As curvas Receiver Operating Characteristic (ROC) de previsões de barreira tripla longa-curta em cinco dobras

O modelo tem um desempenho claramente inferior ao benchmark de 0.5 AUC em média, enquanto o desempenho varia entre dobras. No entanto, uma curva ROC e a pontuação AUC podem não ser a melhor forma de avaliar o desempenho do (CDF do) VPIN.

O problema com uma curva ROC no Financial Machine Learning é que ela não dá uma boa ideia do desempenho final. É inteiramente possível – e até provável – que o VPIN não tenha impacto na formação de preços durante condições normais de mercado. Na verdade, os criadores de mercado esperam flutuações entre o volume de compra e venda; esse é apenas o custo de fazer negócios.

Quero saber se a toxicidade do fluxo de pedidos extremamente alta ou baixa durante condições extremas de mercado tem alguma capacidade preditiva no Bitcoin. A resposta (abaixo) parece ser sim.

Uma curva de recall de precisão para posições longas (rótulo positivo = 1)

Uma curva de Rechamada de Precisão traça a compensação entre Precisão e Rechamada em diferentes limites. Neste caso, mostra que em limiares muito elevados, ou seja, níveis de recall muito baixos (0.05 e inferiores), a precisão média do modelo na identificação de posições longas em todas as cinco dobras sobe para cerca de cinquenta (e talvez até sessenta). No limite de 0.6, em todas as cinco dobras, a Random Forest identifica 75% das posições longas corretamente, embora a AUC esteja bem abaixo de 0.5.

Uma curva de recall de precisão para posições curtas (rótulo positivo = 0)

A curva Precision Recall para posições curtas conta uma história semelhante. Embora a AUC média permaneça abaixo de 0.5 em todas as cinco curvas, há um aumento na precisão em limiares muito elevados.

Isto sugere que o VPIN só pode ter capacidade preditiva em casos muito raros – talvez uma ou duas vezes por mês neste conjunto de dados, no máximo.

Os mercados geralmente comportam-se de forma bastante diferente durante períodos de alta e baixa volatilidade. A previsibilidade de algumas características diminui acentuadamente durante um choque de volatilidade, enquanto outras características (incluindo as microestruturais de mercado) tornam-se mais relevantes.

As medidas de toxicidade do fluxo de ordens podem ser particularmente relevantes num mercado que já é volátil, onde os criadores de mercado já alargaram o spread ao qual fornecem liquidez. Se, além de lidarem com a elevada volatilidade dos preços, os criadores de mercado também forem selecionados negativamente por traders informados, isso poderá constituir uma espécie de “golpe duplo” (estou aqui apenas a especular, claro).

Para continuar esta linha de especulação, os criadores de mercado poderão estar mais propensos a sofrer perdas num mercado altamente volátil. Isso aumenta a probabilidade de eles se desfazerem de seu estoque (como fizeram durante o Flash Crash de 2010), causando uma queda de preço.

Um limite de volatilidade remove todas as amostras do conjunto de dados onde a volatilidade cai abaixo de um determinado benchmark. Por exemplo, neste conjunto de dados, um limite de volatilidade de 0.02 exclui cerca de três quintos dos dados, mas leva a melhorias dramáticas na AUC, na Curva de Recuperação de Longa Precisão e na Curva de Recuperação de Precisão Curta.

Curva ROC para posições longas (1) e curtas (0) com limite de volatilidade de 0.02

A pontuação AUC sobe de 0.49 (pior que um classificador aleatório) para respeitáveis ​​0.55. A pontuação AUC em todas as dobras, exceto uma, está bem acima do valor de referência de 0.5.

A curva de recuperação de precisão para posições longas (rótulo positivo = 1)
A curva de recall de precisão para posições curtas (rótulo positivo = 2)

Para as curvas Precision Recall, a inclusão de um limite de volatilidade parece ter aumentado drasticamente a precisão em vários limites. O VPIN parece ter uma capacidade preditiva significativamente maior em mercados já voláteis.

É claro que é possível que eu tenha (de alguma forma) superajustado os dados. Uma análise mais completa aplicaria esta mesma abordagem a outras criptomoedas, como Ethereum, Ripple e Cardano, para garantir que o VPIN possa de facto prever movimentos de preços e que a sua capacidade preditiva aumente com a volatilidade.

Os formadores de mercado desempenham um dos papéis mais importantes numa bolsa – eles fornecem liquidez. No entanto, quando os traders informados retiram as suas ordens, estes fornecedores de liquidez incorrem em perdas. Eles são então confrontados com uma escolha: podem aumentar o custo dos seus serviços ou – em casos graves – retirar-se completamente do mercado. Ao analisar os desequilíbrios no fluxo de ordens entre os volumes de compra e venda, podemos modelar as interações entre traders informados e criadores de mercado.

A toxicidade do fluxo ordenado não só pode ser um bom preditor de volatilidade de curto prazo - parece que, em alguns casos (muito) raros, pode até prever movimentos de preços maiores.

A capacidade preditiva dos VPINs aumenta acentuadamente quando o mercado em questão já é bastante volátil. Só posso especular sobre as razões, mas na verdade vejo duas.

A primeira é que os formadores de mercado operam com margens mínimas. Consequentemente, são mais propensos a incorrer em grandes perdas devido à selecção adversa em mercados mais voláteis.

Além disso, os spreads em mercados voláteis já são bastante amplos. A toxicidade do fluxo de ordens – além da volatilidade – poderia aumentar drasticamente os spreads (e os custos de derrapagem para os traders). A negociação torna-se muito cara quando isso acontece; Presumo que os traders estarão menos propensos a comprar devido ao impacto do preço elevado, mas ainda assim serão forçados a vender se o mercado estiver em colapso.

Fonte: https://medium.com/@lucasastorian/empirical-market-microstructure-f67eff3517e0?source=rss——-8—————–criptomoeda

Carimbo de hora:

Mais de Médio