Microestructura empírica del mercado

Nodo de origen: 937627

Desde Pexels

Toxicidad del flujo de órdenes en el mercado spot de Bitcoin

Desde agosto de 2020, se han negociado en Binance más de 800 mil millones de dólares en Bitcoin denominado USDT, con diferencia la mayor Intercambio de bitcoins. Como en otros mercados, la mayor parte de la liquidez proporcionada en Binance proviene de creadores de mercado: empresas que están dispuestas a comprar o vender Bitcoin con la esperanza de obtener ganancias con el diferencial de oferta y demanda.

Mercado Teoría microestructural reconocidazEs que la formación de precios está determinada por factores endógenos y exógenos. La liquidez, el impacto en el mercado, los costos de transacción (deslizamiento), la volatilidad y la mecánica de la cartera de órdenes límite desempeñan un papel importante.

La teoría económica clásica de la oferta y la demanda supone que cualquier inversor dispuesto a comprar y vender al precio de equilibrio generalmente puede hacerlo. En realidad, el mismo acto de comprar o vender un valor cambia el precio de mercado; las operaciones tienen impacto en el mercado.

Un inversor que quiera comprar o vender una gran cantidad de Bitcoin no ejecutará toda la orden a la vez. En cambio, lo harán gradualmente, con el tiempo, para comprar al precio más bajo o vender al precio más alto. Stan Druckenmiller, quien, junto con George Soros, rompió el Banco de Inglaterra iEn 1992, mencionó recientemente que traté de comprar 100 millones de dólares en Bitcoin en 2018. Al carecer de liquidez, le llevó dos semanas comprar 20 millones de dólares, momento en el que se rindió.

Por lo tanto, el impacto de una operación en el mercado juega un papel importante en las decisiones de los inversores de comprar o vender un valor, lo que a su vez afecta el precio al que se negocia ese valor.

Todos los participantes del mercado entran en un mercado con la esperanza de obtener ganancias, pero los creadores de mercado y los comerciantes ganan (o pierden) dinero de maneras fundamentalmente diferentes. Los creadores de mercado compran y venden Bitcoin con la esperanza de ganar el diferencial entre oferta y demanda. Los comerciantes compran y venden Bitcoin porque tienen una creencia informada o no sobre futuros cambios de precios.

Para obtener el diferencial entre oferta y demanda, los creadores de mercado deben gestionar activamente un inventario tanto de Bitcoin como de Tether. Cuando los flujos comerciales están equilibrados, pueden vender Bitcoin a pedido y volver a comprarlo a pedido, obteniendo ganancias. Sin embargo, si los flujos comerciales se desequilibran demasiado, resultará más difícil para los creadores de mercado renovar su inventario para obtener ganancias. En general, los creadores de mercado aumentarán el precio que cobran por sus servicios (el diferencial entre oferta y demanda), lo que aumenta los costos comerciales (deslizamiento) para los operadores.

Los creadores de mercado y los traders ganan (o pierden) dinero de formas fundamentalmente diferentes

La oferta y la demanda a las que los creadores de mercado están dispuestos a proporcionar liquidez está determinada por el grado en que los operadores informados los seleccionan adversamente. Si los flujos de órdenes se desequilibran porque los comerciantes informados están comprando o vendiendo Bitcoin, ese flujo de órdenes se considera tóxico.

Toxicidad del flujo de pedidos durante la crisis repentina del 6 de mayo

En 2010, tres investigadores de Cornell, en colaboración con Tudor Investment Group, publicaron un Describiendo cómo la caída repentina de 2010, durante la cual el Dow Jones Industrial Average (DJIA) se desplomó brevemente un 9% antes de recuperarse inmediatamente, fue causada por una cantidad extrema de toxicidad en el flujo de pedidos.

El modelo utilizado para identificar el flujo de órdenes tóxicas (VPIN (probabilidad de negociación informada sincronizada con el volumen)) alcanzó máximos históricos en la hora previa a la caída repentina y predijo con éxito lo que todavía se considera un evento misterioso.

El periódico Tudor recibió cierta atención de los medios: Bloomberg artículo Señaló que la VPN podría “ayudar a los reguladores a prevenir accidentes como el del 6 de mayo”. Investigadores del Laboratorio Nacional Lawrence Berkeley demostraron que VPIN predijo bien eventos de alta volatilidad en los mercados de futuros desde enero de 2007 hasta julio de 2012.

en brillante papel posterior, los mismos autores señalan que la alta toxicidad del flujo de pedidos no sólo obliga a los creadores de mercado a salir del mercado; Si los creadores de mercado tienen que deshacerse de sus inventarios con pérdidas, pueden drenar cualquier liquidez restante en lugar de proporcionarla.

En las horas previas a la caída del 6 de mayo, los operadores informados habían estado vendiendo constantemente sus posiciones a los creadores de mercado, quienes enfrentaban pérdidas cada vez mayores. Cuando estos mismos creadores de mercado finalmente se vieron obligados a deshacer sus posiciones, los resultados fueron catastróficos. En palabras de los investigadores: “la toxicidad extrema tiene la capacidad de transformar a los proveedores de liquidez en consumidores de liquidez”.

"La toxicidad extrema tiene la capacidad de transformar a los proveedores de liquidez en consumidores de liquidez" - La microestructura del 'Flash Crash'

VPIN se basa en el modelo PIN, que considera el comercio como un juego entre tres tipos de participantes: comerciantes informados, comerciantes desinformados y creadores de mercado.

El VPIN se aproxima como la diferencia absoluta entre el volumen de compra y venta durante una ventana histórica. En lugar de muestrear por tiempo, el VPIN se calcula utilizando barras de volumen de cantidad fija. Por ejemplo, podrías realizar una muestra cada vez que se intercambien 1000 Bitcoins.

El volumen tiende a aumentar a medida que llega nueva información al mercado y a disminuir cuando no llega. Por tanto, el muestreo por volumen es similar al muestreo por volatilidad (y flujo de información).

Una orden se clasifica como orden de compra si el comprador es un comerciante informado; De manera similar, una orden se clasifica como orden de venta si el vendedor es un comerciante informado. Más información sobre cómo identificar operaciones de compra y venta a continuación.

VPIN es el desequilibrio de volumen promedio durante una ventana histórica de duración n
Calcular VPIN utiliza dos series Pandas de volumen de compra y venta clasificado

La regla Tick clasifica las operaciones de compra y venta informadas identificando al agresor comercial, es decir, la parte que toma el precio. A un comerciante que compra Bitcoin a través de una orden de mercado se le asignará la mejor demanda en el libro de órdenes, por encima de la media de oferta y demanda. Esto lo convierte en el agresor. Si un comerciante envía una orden limitada para comprar Bitcoin por debajo del promedio de oferta y demanda, esa orden puede eventualmente ejecutarse si otro comerciante vende Bitcoin agresivamente a través de una orden de mercado.

La regla Tick identifica al agresor comercial basándose en una simple observación. Las órdenes de compra agresivas tienden a aumentar el precio de un activo, ya que la orden coincide con la demanda más baja del libro de órdenes. De manera similar, las órdenes de venta agresivas tienden a disminuir el precio de un activo después de que se iguala la oferta más alta. El cambio de precio posterior se puede utilizar para identificar al agresor comercial.

La regla Tick (Avances en el aprendizaje automático financiero, Capítulo 19)

Las operaciones que provocan un aumento de precio posterior se etiquetan como 1: una compra. Las operaciones que provocaron una disminución del precio se denominan -1: una venta. Las operaciones que no causan un cambio en el precio (porque no cumplieron completamente con la oferta más alta o la demanda más baja) están etiquetadas con la marca anterior.

Si bien la regla Tick (generalmente) identifica con éxito al lado agresor, algunas investigaciones recientes sugieren que los comerciantes del lado agresor y los comerciantes informados pueden no ser equivalentes en los mercados de alta frecuencia. Por ejemplo, un operador informado podría simplemente enviar múltiples órdenes limitadas a lo largo del libro de órdenes, cancelar aquellas que no se cumplan y seguir apareciendo desinformado según la regla Tick.

La implementación original de VPIN utiliza un enfoque bayesiano llamado Clasificación de volumen a granel (BVC) para aproximar la proporción de volumen de compra y venta informado en cada barra (ya sea en función del tiempo o del volumen). Mi experiencia práctica con BVC ha sido bastante variada. En lugar de usar BVC, decidí optar por otra opción: usar las etiquetas comerciales que especifican si el comprador o el vendedor era un creador de mercado en datos sin procesar de Binance Trade.

Binance publica datos comerciales en vivo a través de una transmisión Websocket, que he estado recopilando en un servidor AWS desde principios de agosto del año pasado; de ahí vienen mis datos. Desde marzo de 2021, también puedes descargar datos históricos haga clic aquí

He calculado el VPIN utilizando barras de dólar móviles con aproximadamente 1600 muestras por día con un tamaño de ventana de 1000. Esto significa que, estrictamente hablando, cada depósito de volumen no tiene exactamente el mismo tamaño. Aun así, las diferencias son mínimas, por lo que me siento cómodo usando la implementación original sin tener que pesar cubos individuales.

A diferencia de la implementación original, el volumen de compra y venta se clasificó mediante etiquetas de nivel comercial que especifican si el comprador era un creador de mercado o no. Además, a diferencia de la implementación original, VPN no es estacionaria.

Los desequilibrios en el flujo de pedidos parecen haber disminuido significativamente durante el año pasado a medida que aumentaron la capitalización de mercado y el volumen de operaciones de Bitcoin. Esto está en línea con investigaciones que muestran que las acciones más grandes tienen menores diferenciales entre oferta y demanda, lo que implica una selección menos adversa.

VPN Calculado desde agosto de 2020 hasta mediados de junio de 2021

El desequilibrio en el flujo de órdenes entre las órdenes de compra y venta del lado agresor que condujeron a la última corrección (19 de mayo de 2021) parece mínimo. La métrica de VPIN relativamente baja implica que la toxicidad no influyó en la corrección.

A veces, los desequilibrios localizados en el flujo de pedidos parecen alcanzar su punto máximo justo antes de una caída dramática en el precio; los mejores ejemplos son los días 12 y 18 de junio. Sin embargo, esto podría ser simplemente yo leyendo el gráfico.

Predicción de etiquetas de triple barrera con VPN

VPN no fue necesariamente diseñada para predecir retornos futuros. En cambio, simplemente describe los desequilibrios promedio del flujo de pedidos ponderados por volumen durante una ventana histórica. El conocimiento de estos desequilibrios no puede necesariamente utilizarse para pronosticar la persistencia, el aumento o la disminución de desequilibrios futuros. Sin embargo, pensé que podría intentarlo.

He utilizado una configuración bastante estándar propuesta por Marcos López de Prado; el siguiente párrafo sonará como un galimatías para aquellos que no estén familiarizados con el aprendizaje automático financiero, así que siéntete libre de omitirlo.

He calculado etiquetas de triple barrera ajustadas por volatilidad para clasificar las muestras como posiciones largas o cortas. El ancho máximo de la etiqueta tiene un límite del 3.5% en cualquier dirección; Los golpes de barrera vertical se clasifican por el retorno absoluto a lo largo de la posición. He calculado los pesos de las muestras en función de la unicidad promedio. El RF se entrena con 100 árboles, las muestras máximas relevantes por árbol, no más de una característica por árbol y una profundidad máxima de 6. Los datos se escalan, se purgan, se embargan (5%) y se validan de forma cruzada en cinco pliegues. . Lea las dos primeras partes de Marcos primer libro si estás interesado en los detalles.

Dado que parece haber una fuerte ruptura en el VPIN a finales del año pasado, decidí utilizar sólo datos de los últimos seis meses y medio; aproximadamente un mes de datos por pliegue. Eso hace un total de ~250,000 muestras.

Como en el artículo original, ajusté la métrica VPIN utilizando una distribución log-normal y entrené el modelo en la CDF de VPIN. Utilicé siete tamaños de ventana diferentes: 50, 100, 250, 500, 1000, 2500 y 5000. Las curvas ROC en los cinco pliegues se representan a continuación.

Las curvas de característica operativa del receptor (ROC) de predicciones de triple barrera larga y corta en cinco pliegues

El modelo claramente tiene un rendimiento inferior al punto de referencia de 0.5 AUC en promedio, mientras que el rendimiento varía según los pliegues. Sin embargo, una curva ROC y la puntuación AUC pueden no ser la mejor manera de evaluar el desempeño de (la CDF de) VPIN.

El problema con una curva ROC en Financial Machine Learning es que no dan una buena idea del rendimiento final. Es completamente posible, e incluso probable, que VPIN no tenga ningún impacto en la formación de precios en condiciones normales de mercado. De hecho, los creadores de mercado esperan fluctuaciones entre el volumen de compra y venta; ese es solo el costo de hacer negocios.

Quiero saber si la toxicidad del flujo de órdenes extremadamente alta o baja durante condiciones extremas del mercado tiene alguna capacidad predictiva en Bitcoin. La respuesta (a continuación) parece ser sí.

Una curva de recuperación de precisión para posiciones largas (etiqueta positiva = 1)

Una curva de recuperación de precisión traza el equilibrio entre precisión y recuperación a través de diferentes umbrales. En este caso, muestra que en umbrales muy altos, es decir, niveles muy bajos de recuperación (0.05 e inferiores), la precisión promedio del modelo en la identificación de posiciones largas en los cinco pliegues se eleva hasta los cincuenta (y tal vez incluso los sesenta). En el umbral de 0.6, en los cinco pliegues, Random Forest identifica correctamente el 75 % de las posiciones largas, aunque el AUC está muy por debajo de 0.5.

Una curva de recuperación de precisión para posiciones cortas (etiqueta positiva = 0)

La curva de recuperación de precisión para posiciones cortas cuenta una historia similar. Aunque el AUC promedio se mantiene por debajo de 0.5 en las cinco curvas, hay un aumento en la precisión en umbrales muy altos.

Esto sugiere que la VPN solo puede tener capacidad predictiva en casos muy raros, tal vez una o dos veces al mes en este conjunto de datos como máximo.

Los mercados generalmente se comportan de manera bastante diferente durante períodos de alta y baja volatilidad. La previsibilidad de algunas características disminuye notablemente durante un shock de volatilidad, mientras que otras características (incluidas las microestructurales del mercado) se vuelven más relevantes.

Las medidas de toxicidad del flujo de órdenes podrían ser particularmente relevantes en un mercado que ya es volátil, donde los creadores de mercado ya han ampliado el diferencial al que proporcionan liquidez. Si, además de lidiar con la alta volatilidad de los precios, los creadores de mercado también están siendo seleccionados negativamente por comerciantes informados, esto podría generar una especie de “doble golpe” (estoy puramente especulando, por supuesto).

De continuar con esta línea de especulación, sería más probable que los creadores de mercado sufrieran pérdidas en un mercado altamente volátil. Esto aumenta la probabilidad de que se deshagan de su inventario (como lo hicieron durante el Flash Crash de 2010), provocando una disminución de los precios.

Un umbral de volatilidad elimina todas las muestras del conjunto de datos donde la volatilidad cae por debajo de un determinado punto de referencia. Por ejemplo, en este conjunto de datos, un umbral de volatilidad de 0.02 excluye aproximadamente tres quintas partes de los datos, pero conduce a mejoras espectaculares en el AUC, la curva de recuperación de precisión larga y la curva de recuperación de precisión corta.

Curva ROC para posiciones largas (1) y cortas (0) con un umbral de volatilidad de 0.02

La puntuación AUC aumenta de 0.49 (peor que un clasificador aleatorio) a un respetable 0.55. La puntuación AUC en todos los pliegues excepto uno está muy por encima del punto de referencia de 0.5.

La curva de recuperación de precisión para posiciones largas (etiqueta positiva = 1)
La curva de recuperación de precisión para posiciones cortas (etiqueta positiva = 2)

Para las curvas de recuperación de precisión, la inclusión de un umbral de volatilidad parece haber elevado drásticamente la precisión en una variedad de umbrales. VPIN parece tener una capacidad predictiva significativamente mayor en mercados que ya son volátiles.

Por supuesto, es posible que haya sobreajustado (de alguna manera) los datos. Un análisis más completo aplicaría este mismo enfoque a otras criptomonedas como Ethereum, Ripple y Cardano para garantizar que VPIN pueda de hecho predecir movimientos de precios y que su capacidad de predicción aumente con la volatilidad.

Los creadores de mercado desempeñan una de las funciones más importantes en una bolsa: proporcionan liquidez. Sin embargo, cuando los comerciantes informados retiran sus órdenes, estos proveedores de liquidez incurren en pérdidas. Entonces se enfrentan a una elección: pueden aumentar el costo de sus servicios o, en casos graves, retirarse completamente del mercado. Al analizar los desequilibrios del flujo de órdenes entre el volumen de compra y venta, podemos modelar las interacciones entre los operadores informados y los creadores de mercado.

La toxicidad del flujo de pedidos no sólo puede ser un buen predictor de la volatilidad a corto plazo — parece que, en algunos casos (muy) raros, incluso puede predecir movimientos de precios mayores.

La capacidad predictiva de las VPN aumenta drásticamente cuando el mercado en cuestión ya es bastante volátil. Sólo puedo especular sobre las razones, pero en realidad veo dos.

La primera es que los creadores de mercado operan con márgenes muy reducidos. En consecuencia, es más probable que incurran en grandes pérdidas debido a una selección adversa en mercados más volátiles.

Además, los diferenciales en los mercados volátiles ya son bastante amplios. La toxicidad del flujo de órdenes, además de la volatilidad, podría aumentar drásticamente los diferenciales (y los costos de deslizamiento para los operadores). El comercio se vuelve muy costoso cuando esto sucede; Supongo que será menos probable que los comerciantes compren debido al alto impacto en los precios, pero aún así se verán obligados a vender si el mercado colapsa.

Fuente: https://medium.com/@lucasastorian/empirical-market-microstructure-f67eff3517e0?source=rss——-8—————–criptomoneda

Sello de tiempo:

Mas de Mediana