Эмпирическая микроструктура рынка

Исходный узел: 937627

от Pexels

Токсичность потока ордеров на спотовом рынке биткойнов

С августа 2020 года на Binance было продано более 800 миллиардов долларов биткойнов, выраженных в USDT. крупнейших Обмен биткойнов. Как и на других рынках, большая часть ликвидности, предоставляемой на Binance, поступает от маркет-мейкеров: компаний, которые готовы покупать или продавать биткойны в надежде, что они получат прибыль от спреда спроса и предложения.

Теория микроструктуры рынка признаетzТаким образом, ценообразование определяется как эндогенными, так и экзогенными факторами. Ликвидность, влияние на рынок, транзакционные издержки (проскальзывание), волатильность и механика книги лимитных ордеров — все это играет существенную роль.

Классическая экономическая теория спроса и предложения предполагает, что любой инвестор, желающий покупать и продавать по равновесной цене, обычно может это сделать. В действительности, сам акт покупки или продажи ценных бумаг меняет рыночную цену; сделки имеют влияние на рынок.

Инвестор, который хочет купить или продать большое количество биткойнов, не будет выполнять весь заказ сразу. Вместо этого они будут делать это постепенно, с течением времени, чтобы покупать по самой низкой цене или продавать по самой высокой цене. Стэн Дракенмиллер, который вместе с Джорджем Соросом разрушил Банк Англии яn 1992 г. — недавно упомянул, что он пытался купить 100 миллионов долларов в биткойнах в 2018 году. Из-за отсутствия ликвидности ему потребовалось две недели, чтобы купить 20 миллионов долларов, после чего он сдался.

Таким образом, влияние сделки на рынок играет значительную роль в решениях инвестора о покупке или продаже ценной бумаги, что, в свою очередь, влияет на цену, по которой торгуется эта ценная бумага.

Все участники рынка выходят на рынок в надежде получить прибыль, однако маркет-мейкеры и трейдеры зарабатывают (или теряют) деньги принципиально разными способами. Маркет-мейкеры покупают и продают биткойны в надежде заработать на спреде спроса и предложения. Трейдеры покупают и продают биткойны, потому что у них есть осознанное или неосведомленное мнение о будущих изменениях цен.

Чтобы получить разницу между ценами спроса и предложения, маркет-мейкеры должны активно управлять запасами как Биткойна, так и Tether. Когда торговые потоки сбалансированы, они могут продать Биткойн по цене аска и выкупить его по цене предложения, получив прибыль. Однако, если торговые потоки становятся слишком несбалансированными, маркет-мейкерам становится сложнее пролонгировать свои запасы с прибылью. Как правило, маркет-мейкеры затем увеличивают цену, которую они взимают за свои услуги (спред между ценой покупки и продажи), что увеличивает торговые издержки (проскальзывание) для трейдеров.

Маркет-мейкеры и трейдеры зарабатывают (или теряют) деньги принципиально разными способами.

Спрос и предложение, по которым маркет-мейкеры готовы предоставить ликвидность, определяются степенью неблагоприятного выбора их информированными трейдерами. Если потоки ордеров становятся несбалансированными из-за того, что информированные трейдеры покупают или продают биткойны, этот поток ордеров считается токсичным.

Токсичность потока заказов во время внезапного краха 6 мая

В 2010 году трое исследователей из Корнелла в сотрудничестве с Tudor Investment Group опубликовали исследование. бумаги описывая, как внезапный крах 2010 года, во время которого промышленный индекс Доу-Джонса (DJIA) ненадолго упал на 9%, а затем сразу же восстановился, был вызван чрезвычайной токсичностью потока заказов.

Модель, используемая для определения токсичного потока ордеров — VPIN (вероятность информированной торговли, синхронизированная по объему) — достигла рекордного максимума за час, предшествовавший внезапному краху, и успешно предсказала то, что до сих пор считается загадочным событием.

Газета Тюдоров привлекла некоторое внимание средств массовой информации: агентство Bloomberg гайд отметил, что VPIN может «помочь регуляторам предотвратить катастрофы, подобные обвалу 6 мая». Исследователи из Национальной лаборатории Лоуренса Беркли показали, что VPIN хорошо прогнозировал события высокой волатильности на фьючерсных рынках с января 2007 года по июль 2012 года.

В блестящем более поздняя статья, те же авторы отмечают, что высокая токсичность потока заказов не просто вынуждает маркет-мейкеров уйти с рынка; если маркет-мейкерам придется сбросить свои запасы с убытком, они могут истощить оставшуюся ликвидность вместо того, чтобы предоставить ее.

В течение нескольких часов, предшествовавших краху 6 мая, информированные трейдеры постоянно продавали свои позиции маркет-мейкерам, которые сталкивались с растущими потерями. Когда те же самые маркет-мейкеры были в конечном итоге вынуждены свернуть свои позиции, результаты оказались катастрофическими. По словам исследователей: «чрезвычайная токсичность способна превратить поставщиков ликвидности в потребителей ликвидности».

«Чрезвычайная токсичность способна превратить поставщиков ликвидности в потребителей ликвидности» — Микроструктура «внезапного краха»

VPIN основан на модели PIN, которая рассматривает торговлю как игру между тремя типами участников: информированными трейдерами, неосведомленными трейдерами и маркет-мейкерами.

VPIN рассчитывается как абсолютная разница между объемом покупки и продажи за исторический период. Вместо выборки по времени VPIN рассчитывается с использованием столбцов объема с фиксированной суммой. Например, вы можете делать выборку один раз при каждом обмене 1000 биткойнов.

Объем имеет тенденцию увеличиваться по мере поступления новой информации на рынок и уменьшаться, когда ее нет. Таким образом, выборка по объему аналогична выборке по волатильности (и потоку информации).

Ордер классифицируется как ордер на покупку, если покупатель является информированным трейдером; аналогичным образом ордер классифицируется как ордер на продажу, если продавец является информированным трейдером. Далее подробнее об определении сделок на покупку и продажу.

VPIN — это средний дисбаланс объема за исторический период длиной n.
В расчете VPIN используются две серии классифицированных объемов покупок и продаж Pandas.

Правило тика классифицирует информированные сделки покупки и продажи путем идентификации торгового агрессора, то есть стороны, принимающей ценообразование. Трейдеру, который покупает биткойны через рыночный ордер, будет сопоставлен лучший спрос в книге заказов — выше среднего значения спроса и предложения. Это делает его агрессором. Если трейдер отправляет лимитный ордер на покупку биткойнов ниже среднего значения спроса и предложения, этот ордер может в конечном итоге исполниться, если другой трейдер агрессивно продаст биткойны через рыночный ордер.

Правило тика идентифицирует торгового агрессора, основываясь на простом наблюдении. Агрессивные ордера на покупку имеют тенденцию увеличивать цену актива, поскольку ордер соответствует наименьшему спросу в книге ордеров. Аналогичным образом, агрессивные ордера на продажу имеют тенденцию снижать цену актива после того, как будет достигнута самая высокая ставка. Последующее изменение цены может быть использовано для выявления торгового агрессора.

Правило тика (Достижения в области финансового машинного обучения, глава 19)

Сделки, вызывающие последующий рост цены, обозначаются цифрой 1 — покупка. Сделки, вызвавшие снижение цены, помечены -1 — продажа. Сделки, которые не вызывают изменения цены (поскольку они не полностью заполнили самую высокую ставку или самую низкую цену спроса), помечаются предыдущей отметкой.

Хотя правило тика (в целом) успешно идентифицирует сторону агрессора, некоторые недавние исследования показывают, что трейдеры со стороны агрессора и информированные трейдеры могут не быть эквивалентными на высокочастотных рынках. Например, информированный трейдер может просто разместить несколько лимитных ордеров в книге ордеров, отменить те, которые не исполняются, и при этом оставаться неинформированным в соответствии с Тиковым правилом.

Исходная реализация VPIN использует байесовский подход, называемый Классификация по объему (BVC) для приблизительного определения доли информированного объема покупок и продаж на каждом баре (в зависимости от времени или объема). Мой практический опыт работы с BVC был довольно неоднозначным. Вместо использования BVC я решил пойти другим вариантом: использовать торговые теги, которые указывают, был ли покупатель или продавец маркет-мейкером в необработанных данных Binance Trade.

Binance публикует данные о торговле в режиме реального времени через поток Websocket, который я собираю на сервере AWS с начала августа прошлого года; вот откуда мои данные. С марта 2021 года вы также можете скачать исторические данные. здесь.

Я рассчитал VPIN, используя скользящие долларовые слитки с примерно 1600 выборками в день и размером окна 1000. Это означает, что каждый сегмент объема, строго говоря, не имеет одинакового размера. Несмотря на это, различия минимальны, поэтому я чувствую себя комфортно, используя исходную реализацию без необходимости взвешивания отдельных сегментов.

В отличие от первоначальной реализации, объемы покупок и продаж классифицировались с использованием тегов уровня сделки, которые указывают, был ли покупатель маркет-мейкером или нет. Кроме того, в отличие от исходной реализации, VPIN не является стационарным.

Дисбаланс потока заказов, по-видимому, значительно уменьшился за последний год, поскольку рыночная капитализация и объем торгов биткойнами увеличились. Это согласуется с исследованиями, показывающими, что более крупные акции имеют более низкие спреды спроса и предложения, что подразумевает менее неблагоприятный отбор.

VPIN рассчитан с августа 2020 г. до середины июня 2021 г.

Дисбаланс потока ордеров между ордерами на покупку и продажу стороны-агрессора, приведший к последней коррекции — 19 мая 2021 года — кажется минимальным. Относительно низкий показатель VPIN означает, что токсичность не сыграла роли в коррекции.

Иногда кажется, что дисбаланс локализованного потока заказов достигает пика непосредственно перед резким снижением цены — лучшими примерами являются 12 и 18 июня. Однако, возможно, это просто я читаю график.

Прогнозирование меток тройного барьера с помощью VPIN

VPIN не обязательно предназначался для прогнозирования будущих доходов. Вместо этого он просто описывает средний дисбаланс потока заказов, взвешенный по объему, за исторический период. Знание об этих дисбалансах не обязательно может быть использовано для прогнозирования сохранения, увеличения или уменьшения будущих дисбалансов. Тем не менее, я подумал, что могу попробовать.

Я использовал довольно стандартную схему, предложенную Маркосом Лопесом де Прадо — следующий абзац покажется бредом для тех, кто не знаком с финансовым машинным обучением, поэтому не стесняйтесь его пропустить.

Я рассчитал метки тройного барьера с поправкой на волатильность, чтобы классифицировать образцы как длинные или короткие позиции. Максимальная ширина этикетки ограничена 3.5 % в любом направлении; Попадания в вертикальный барьер классифицируются по абсолютной доходности на протяжении всей позиции. Я рассчитал вес выборки на основе средней уникальности. РФ обучается на 100 деревьях, соответствующих максимальных выборках на дерево, не более одного признака на дерево и максимальной глубине 6. Данные масштабируются, очищаются, налагаются эмбарго (5%) и перекрестно проверяются в пятикратном порядке. . Прочтите первые две части Маркоса. книга если вам интересны подробности.

Поскольку в конце прошлого года, похоже, произошел резкий сбой в VPIN, я решил использовать данные только за последние шесть с половиной месяцев; так что около месяца данных на складку. В общей сложности это около 250,000 XNUMX образцов.

Как и в оригинальной статье, я подобрал метрику VPIN, используя логарифмически нормальное распределение, и обучил модель CDF VPIN. Я использовал семь разных размеров окон: 50, 100, 250, 500, 1000, 2500 и 5000. Кривые ROC для всех пяти сгибов показаны ниже.

Кривые рабочих характеристик приемника (ROC) для прогнозов с тройным барьером «длинный-короткий» в пятикратном диапазоне

В среднем модель явно уступает эталонному показателю 0.5 AUC, хотя производительность варьируется в зависимости от сгиба. Тем не менее, кривая ROC и показатель AUC, возможно, не лучший способ оценить производительность (CDF) VPIN.

Проблема с кривой ROC в финансовом машинном обучении заключается в том, что она не дает хорошего представления о конечной производительности. Вполне возможно (и даже вероятно), что VPIN не оказывает никакого влияния на ценообразование в нормальных рыночных условиях. Действительно, маркет-мейкеры ожидают колебаний между объемом покупок и продаж; это просто издержки ведения бизнеса.

Я хочу знать, имеет ли чрезвычайно высокая или низкая токсичность потока ордеров в экстремальных рыночных условиях какую-либо предсказательную способность в Биткойне. Ответ (ниже), кажется, да.

Кривая точного отзыва для длинных позиций (положительная метка = 1)

Кривая точного отзыва отображает соотношение между точностью и отзывом при различных пороговых значениях. В данном случае это показывает, что при очень высоких пороговых значениях, то есть очень низких уровнях отзыва (0.05 и ниже), средняя точность модели в определении длинных позиций во всех пяти сгибах возрастает до высоких пятидесятых (и, возможно, даже шестидесятых). При пороге 0.6 по всем пяти кратностям случайный лес правильно определяет 75% длинных позиций, даже несмотря на то, что AUC значительно ниже 0.5.

Кривая точного отзыва для коротких позиций (положительная метка = 0)

Кривая Precision Recall для коротких позиций показывает аналогичную историю. Несмотря на то, что среднее значение AUC остается ниже 0.5 по всем пяти кривым, точность резко возрастает при очень высоких пороговых значениях.

Это говорит о том, что VPIN может иметь прогнозирующую способность только в очень редких случаях — в этом наборе данных максимум один или два раза в месяц.

Рынки обычно ведут себя совершенно по-разному в периоды высокой и низкой волатильности. Предсказуемость некоторых характеристик заметно снижается во время шока волатильности, тогда как другие характеристики (в том числе микроструктурные) становятся более актуальными.

Меры токсичности потока ордеров могут быть особенно актуальны на и без того нестабильном рынке, где маркет-мейкеры уже расширили спред, по которому они предоставляют ликвидность. Если, помимо высокой волатильности цен, маркет-мейкеры также подвергаются неблагоприятному отбору со стороны информированных трейдеров, это может стать своего рода «двойным ударом» (конечно, я здесь чисто предполагаю).

Продолжая эту линию спекуляций, маркет-мейкеры могут с большей вероятностью понести убытки на крайне волатильном рынке. Это увеличивает вероятность того, что они сбросят свои запасы (как это было во время внезапного краха 2010 года), что приведет к снижению цен.

Порог волатильности удаляет из набора данных все образцы, в которых волатильность падает ниже определенного контрольного уровня. Например, в этом наборе данных порог волатильности 0.02 исключает примерно три пятых данных, но приводит к значительному улучшению AUC, длинной точной кривой отзыва и короткой точной кривой отзыва.

Кривая ROC для длинных (1) и коротких (0) позиций с порогом волатильности 0.02.

Показатель AUC повышается с 0.49 (хуже, чем у случайного классификатора) до приличных 0.55. Показатель AUC во всех сгибах, кроме одного, значительно превышает контрольный показатель 0.5.

Кривая точного отзыва для длинных позиций (положительная метка = 1)
Кривая точного отзыва для коротких позиций (положительная метка = 2)

Для кривых Precision Recall включение порога волатильности, похоже, резко повысило точность для различных порогов. Похоже, что VPIN обладает значительно более высокой способностью прогнозировать на рынках, которые и без того нестабильны.

Конечно, возможно, что я (каким-то образом) переопределил данные. При более полном анализе тот же подход можно было бы применить к другим криптовалютам, таким как Ethereum, Ripple и Cardano, чтобы убедиться, что VPIN действительно может прогнозировать движение цен и что его способность прогнозирования возрастает с волатильностью.

Маркет-мейкеры играют одну из самых важных ролей на бирже — они обеспечивают ликвидность. Однако, когда информированные трейдеры отбирают свои ордера, эти поставщики ликвидности несут убытки. Тогда они оказываются перед выбором: они могут повысить стоимость своих услуг или — в тяжелых случаях — полностью уйти с рынка. Анализируя дисбаланс потока ордеров между объемом покупки и продажи, мы можем смоделировать взаимодействие между информированными трейдерами и маркет-мейкерами.

Токсичность потока заказов может быть не только хороший предсказатель краткосрочной волатильности — похоже, что в некоторых (очень) редких случаях он может даже предсказать более крупные движения цен.

Прогнозирующая способность VPIN резко возрастает, когда рассматриваемый рынок уже достаточно волатильен. Я могу только предполагать причины, но на самом деле я вижу две.

Во-первых, маркет-мейкеры работают с минимальной прибылью. Следовательно, они с большей вероятностью понесут большие убытки из-за неблагоприятного отбора на более волатильных рынках.

Более того, спреды на волатильных рынках уже достаточно широки. Токсичность потока ордеров — помимо волатильности — может резко увеличить спреды (и издержки проскальзывания для трейдеров). Когда это происходит, торговля становится очень дорогостоящей; Я предполагаю, что трейдеры с меньшей вероятностью будут покупать из-за воздействия высоких цен, но все равно будут вынуждены продавать, если рынок рушится.

Источник: https://medium.com/@lucasastorian/empiric-market-microstructure-f67eff3517e0?source=rss——-8——————криптовалюта.

Отметка времени:

Больше от Medium