Емпірична мікроструктура ринку

Вихідний вузол: 937627

Від Pexels

Токсичність потоку замовлень на спотовому ринку біткойнів

З серпня 2020 року на Binance було продано понад 800 мільярдів доларів біткойнів, деномінованих у доларах США, — безумовно, найбільших Обмін біткоіни. Як і на інших ринках, більша частина ліквідності, що надається на Binance, надходить від маркет-мейкерів: компаній, які готові як купувати, так і продавати біткойни в надії, що вони отримають прибуток від спреду між покупцями та пропозиціями.

Визнання теорії мікроструктури ринкуzщо ціноутворення визначається як ендогенними факторами, так і екзогенними. Ліквідність, вплив на ринок, транзакційні витрати (ковзання), нестабільність і механіка книги лімітованих ордерів відіграють суттєву роль.

Класична економічна теорія попиту та пропозиції припускає, що будь-який інвестор, який бажає купувати та продавати за ціною рівноваги, зазвичай може це робити. Насправді сам акт купівлі чи продажу цінних паперів змінює ринкову ціну; угоди мають вплив на ринок.

Інвестор, який хоче купити чи продати велику кількість біткойнів, не виконає весь ордер одразу. Замість цього вони будуть робити це поступово, з часом, щоб купувати за найнижчою або продавати за найвищою ціною. Стен Дракенміллер, який разом із Джорджем Соросом розгромив Банк Англії in 1992— недавно згадав, що він пробував купити 100 мільйонів доларів у біткойнах у 2018 році. Через брак ліквідності йому знадобилося два тижні, щоб купити 20 мільйонів доларів, після чого він здався.

Таким чином, вплив торгівлі на ринок відіграє значну роль у прийнятті інвестором рішень про покупку чи продаж цінного паперу, що, у свою чергу, впливає на ціну, за якою торгується цей цінний папір.

Усі учасники ринку виходять на ринок у надії отримати прибуток, але маркет-мейкери та трейдери заробляють (або втрачають) гроші принципово різними способами. Маркет-мейкери як купують, так і продають біткойни в надії заробити спред між покупкою та пропозицією. Трейдери купують і продають біткойни, тому що вони мають усвідомлену чи неусвідомлену думку про майбутні зміни ціни.

Щоб отримати спред між покупками та попитами, маркет-мейкери повинні активно керувати запасами біткойнів і Tether. Коли торговельні потоки збалансовані, вони можуть продавати біткойн за ціною і купувати його за ціною, отримуючи прибуток. Однак, якщо торговельні потоки стають надто незбалансованими, маркет-мейкерам стає складніше збільшувати свої запаси з прибутком. Як правило, маркет-мейкери підвищать ціну, яку вони стягують за свої послуги — спред між покупкою та пропозицією — що збільшує торговельні витрати (ковзання) для трейдерів.

Маркет-мейкери та трейдери заробляють (або втрачають) гроші принципово різними способами

Покупка та попит, за якими маркет-мейкери готові надати ліквідність, визначається ступенем несприятливого вибору поінформованих трейдерів. Якщо потоки замовлень стають незбалансованими через те, що поінформовані трейдери купують або продають біткойни, такий потік замовлень вважається токсичним.

Токсичність потоку замовлення під час спалаху 6 травня

У 2010 році три дослідники з Корнелла у співпраці з Tudor Investment Group опублікували a папір описуючи, як різкий крах 2010 року — під час якого промисловий індекс Доу-Джонса (DJIA) ненадовго впав на 9%, перш ніж негайно відновитися — був спричинений надзвичайною токсичністю потоку замовлень.

Модель, яка використовується для ідентифікації токсичного потоку ордерів — VPIN (імовірність інформованої торгівлі, синхронізованої з об’ємом) — підскочила до історичних максимумів за годину до спалаху та успішно передбачила подію, яка досі вважається таємницею.

Стаття Тюдорів привернула певну увагу ЗМІ: Bloomberg стаття зазначив, що VPIN може «допомогти регуляторам запобігти аваріям, таким як падіння 6 травня». Дослідники з Національної лабораторії імені Лоуренса Берклі показали, що VPIN добре прогнозував події високої волатильності на ф’ючерсних ринках із січня 2007 року до липня 2012 року.

У блискучому пізніше папір, ті ж автори зазначають, що токсичність потоку високого порядку не просто змушує маркетмейкерів залишити ринок; якщо маркет-мейкерам доводиться збитковувати свої запаси, вони можуть вичерпати будь-яку залишкову ліквідність замість того, щоб надавати її.

За кілька годин до краху 6 травня обізнані трейдери постійно продавали свої позиції маркет-мейкерам, які зазнавали зростаючих втрат. Коли ці самі маркетмейкери врешті-решт були змушені послабити свої позиції, результати були катастрофічними. За словами дослідників: «надзвичайна токсичність має здатність перетворювати постачальників ліквідності на споживачів ліквідності».

«Надзвичайна токсичність має здатність перетворювати постачальників ліквідності на споживачів ліквідності» — Мікроструктура «Flash Crash»

VPIN базується на моделі PIN-коду, яка розглядає торгівлю як гру між трьома типами учасників: поінформованими трейдерами, необізнаними трейдерами та маркет-мейкерами.

VPIN наближається як абсолютна різниця між обсягом купівлі та продажу за історичне вікно. Замість вибірки за часом VPIN обчислюється за допомогою стовпчиків обсягу фіксованої суми. Наприклад, ви можете робити вибірку один раз кожного разу, коли обмінюється 1000 біткойнів.

Обсяг, як правило, збільшується, коли на ринок надходить нова інформація, і зменшується, якщо цього не відбувається. Таким чином, вибірка за обсягом схожа на вибірку за мінливістю (і потоком інформації).

Замовлення класифікується як замовлення на покупку, якщо покупець є поінформованим торговцем; так само замовлення класифікується як замовлення на продаж, якщо продавець є поінформованим трейдером. Далі докладніше про ідентифікацію угод купівлі та продажу.

VPIN – це середній дисбаланс обсягу за історичне вікно довжиною n
Calculate VPIN використовує дві серії Pandas Classified Buy and Sell Volume

Правило Tick Rule класифікує обґрунтовані угоди купівлі та продажу шляхом ідентифікації торгового агресора, тобто сторони, яка приймає ціну. Трейдер, який купує біткойни за допомогою ринкового ордера, буде зіставлений із найкращим запитом у книзі замовлень — вище середнього значення пропозиції та пропозиції. Це робить його агресором. Якщо трейдер надсилає лімітний ордер на купівлю біткойна за ціною, нижчою від середнього рівня пропозиції та пропозиції, цей ордер може зрештою бути виконаним, якщо інший трейдер агресивно продаватиме біткойн через ринковий ордер.

Правило Tick визначає торговельного агресора, спираючись на просте спостереження. Агресивні ордери на купівлю, як правило, збільшують ціну активу, оскільки ордер узгоджується з найнижчим запитом у книзі замовлень. Подібним чином агресивні ордери на продаж, як правило, знижують ціну активу після досягнення найвищої ставки. Наступна зміна ціни може бути використана для ідентифікації торгового агресора.

Правило тику (досягнення у фінансовому машинному навчанні, глава 19)

Угоди, які призводять до подальшого зростання ціни, позначаються як 1 — покупка. Угоди, які викликали зниження ціни, позначені -1 — продаж. Угоди, які не призводять до зміни ціни (оскільки вони не повністю заповнили найвищу ставку або найнижчу ціну), позначаються попередньою галочкою.

Хоча правило «Тік» (загалом) успішно визначає сторону агресора, деякі нещодавні дослідження показують, що трейдери зі сторони агресора та поінформовані трейдери можуть не бути еквівалентними на високочастотних ринках. Наприклад, поінформований трейдер може просто подати кілька лімітних ордерів у книзі ордерів, скасувати ті, які не заповнюються, і все одно виглядати необізнаним згідно з правилом тику.

Оригінальна реалізація VPIN використовує байєсівський підхід, який називається Класифікація масового обсягу (BVC) щоб приблизно визначити пропорцію обґрунтованого обсягу купівлі та продажу в кожному барі (на основі часу або обсягу). Мій практичний досвід роботи з BVC був неоднозначним. Замість того, щоб використовувати BVC, я вирішив скористатися іншим варіантом: використовувати торгові теги, які вказують, чи був покупець чи продавець маркет-мейкером у необроблених даних Binance Trade.

Binance публікує реальні торгові дані через потік Websocket, які я збирав на сервері AWS з початку серпня минулого року; звідки мої дані. З березня 2021 року ви також можете завантажити історичні дані тут.

Я розрахував VPIN за допомогою змінних доларових стовпчиків із приблизно 1600 вибірками на день із розміром вікна 1000. Це означає, що кожне відро обсягу, строго кажучи, не має однакового розміру. Незважаючи на це, відмінності мінімальні, тому я відчуваю себе комфортно, використовуючи оригінальну реалізацію без необхідності зважувати окремі відра.

На відміну від оригінальної реалізації, обсяг купівлі та продажу класифіковано за допомогою тегів торгового рівня, які визначають, чи був покупець маркет-мейкером чи ні. Також, на відміну від оригінальної реалізації, VPIN не є стаціонарним.

Здається, що дисбаланс потоків замовлень значно зменшився за останній рік, оскільки ринкова капіталізація та обсяг торгівлі біткойнами зросли. Це узгоджується з дослідженнями, які показують, що великі акції мають нижчий спред між покупкою та пропозицією, що означає менш несприятливий вибір.

VPN-код розраховано з серпня 2020 року до середини червня 2021 року

Дисбаланс потоку замовлень між заявками на покупку та продаж з боку агресора до останнього виправлення — 19 травня 2021 року — виглядає мінімальним. Відносно низький показник VPIN означає, що токсичність не відіграла ролі в корекції.

Іноді здається, що локалізований дисбаланс потоку замовлень досягає піку безпосередньо перед різким зниженням ціни — 12 і 18 червня є найкращими прикладами. Однак це міг просто я читати в діаграмі.

Прогнозування потрійних бар’єрних міток за допомогою VPN

VPIN не обов’язково створювався для прогнозування майбутніх доходів. Замість цього він просто описує середній, зважений за обсягом дисбаланс потоку замовлень протягом історичного вікна. Знання про ці дисбаланси не обов’язково можуть бути використані для прогнозування збереження, збільшення або зменшення майбутніх дисбалансів. Тим не менш, я думав, що можу спробувати.

Я використовував досить стандартну установку, запропоновану Маркосом Лопесом де Прадо — наступний абзац прозвучить як тарабарщина для тих, хто не знайомий із фінансовим машинним навчанням, тому можете пропустити його.

Я розрахував мітки потрійного бар’єру з поправкою на волатильність, щоб класифікувати зразки як довгі або короткі позиції. Максимальна ширина етикетки обмежена 3.5% у будь-якому напрямку; удари по вертикальному бар'єру класифікуються за абсолютною віддачею по довжині позиції. Я розрахував ваги вибірки на основі середньої унікальності. RF навчається зі 100 деревами, відповідними максимальними зразками на дерево, не більше ніж однією ознакою на дерево та максимальною глибиною 6. Дані масштабуються, очищаються, підлягають ембарго (5%) і перехресно перевіряються п’ятьма разами. . Прочитайте перші дві частини Маркоса книга якщо вас цікавлять подробиці.

Оскільки наприкінці минулого року відбулася різка перерва у VPIN, я вирішив використовувати лише дані за останні шість з половиною місяців; тобто приблизно місяць даних на згортку. Це становить приблизно 250,000 XNUMX зразків.

Як і в оригінальній статті, я підібрав метрику VPIN за допомогою логарифмічного нормального розподілу та навчив модель на CDF VPIN. Я використовував сім різних розмірів вікон: 50, 100, 250, 500, 1000, 2500 і 5000. Нижче нанесено криві ROC по всіх п’яти складках.

Криві робочих характеристик приймача (ROC) прогнозів довго-короткого потрійного бар’єру через п’ять крат

Модель явно поступається тесту 0.5 AUC в середньому, тоді як продуктивність різниться в різних випадках. Однак крива ROC і показник AUC можуть бути не найкращим способом оцінки ефективності (CDF) VPIN.

Проблема з кривою ROC у фінансовому машинному навчанні полягає в тому, що вона не дає хорошого уявлення про кінцеву продуктивність. Цілком можливо — і навіть ймовірно — що VPIN не впливає на формування ціни за нормальних ринкових умов. Дійсно, маркетмейкери очікують коливань між обсягом купівлі та продажу; це лише вартість ведення бізнесу.

Я хочу знати, чи має токсичність потоку надзвичайно високого чи низького порядку під час екстремальних ринкових умов якусь прогнозну здатність у біткойнах. Відповідь (нижче), здається, так.

Крива точного відкликання для довгих позицій (позитивна мітка =1)

Крива Precision Recall показує компроміс між Precision і Recall через різні порогові значення. У цьому випадку це показує, що за дуже високих порогів, тобто дуже низьких рівнів запам’ятовування (0.05 і нижче), середня точність моделі в ідентифікації довгих позицій у всіх п’яти складках зростає до п’ятдесяти (і, можливо, навіть шістдесяти). За порогового значення 0.6 у всіх п’яти складках випадковий ліс правильно визначає 75% довгих позицій, навіть якщо AUC значно нижче 0.5.

Крива точного відкликання для коротких позицій (позитивна мітка = 0)

Крива Precision Recall для коротких позицій розповідає подібну історію. Незважаючи на те, що середня AUC залишається нижчою за 0.5 на всіх п’яти кривих, спостерігається сплеск точності при дуже високих порогах.

Це означає, що VPIN може мати передбачувану здатність лише в дуже рідкісних випадках — можливо, щонайбільше один або два рази на місяць у цьому наборі даних.

Ринки зазвичай поводяться по-різному в періоди високої та низької волатильності. Передбачуваність деяких характеристик помітно знижується під час шоку волатильності, тоді як інші характеристики (включаючи мікроструктуру ринку) стають більш актуальними.

Вимірювання токсичності потоку замовлень може бути особливо актуальним на ринку, який і без того є нестабільним, де маркет-мейкери вже розширили спред, на якому вони забезпечують ліквідність. Якщо, окрім високої волатильності цін, маркет-мейкери також зазнають несприятливого відбору поінформованими трейдерами, це може стати свого роду «подвійним ударом» (звичайно, я лише спекулюю).

Щоб продовжити цю лінію спекуляцій, маркет-мейкери можуть з більшою ймовірністю зазнати збитків на дуже нестабільному ринку. Це збільшує ймовірність того, що вони викинуть свій інвентар (як це було під час Flash Crash 2010 року), спричинивши зниження ціни.

Порогове значення волатильності видаляє всі зразки з набору даних, коли волатильність падає нижче певного контрольного значення. Наприклад, у цьому наборі даних поріг мінливості 0.02 виключає приблизно три п’ятих даних, але призводить до різкого покращення AUC, кривої запам’ятовування довгої точності та кривої запам’ятовування короткої точності.

Крива ROC для довгих (1) і коротких (0) позицій з порогом волатильності 0.02

Показник AUC зростає з 0.49 (гірше, ніж у випадковому класифікаторі) до поважних 0.55. Показник AUC у всіх складах, крім одного, значно перевищує контрольний показник 0.5.

Крива точного відкликання для довгих позицій (позитивна мітка = 1)
Крива точного відкликання для коротких позицій (позитивна мітка = 2)

Для кривих Precision Recall включення порогового значення волатильності, здається, різко підвищило точність для різних порогових значень. Здається, VPIN має значно вищу передбачувану здатність на ринках, які вже є нестабільними.

Звичайно, можливо, я (якимось чином) перевиконав дані. Більш повний аналіз застосував би цей самий підхід до інших криптовалют, таких як Ethereum, Ripple і Cardano, щоб переконатися, що VPIN дійсно може передбачати рух цін і що його прогнозна здатність зростає разом із волатильністю.

Маркет-мейкери відіграють одну з найважливіших ролей на біржі — вони забезпечують ліквідність. Однак, коли поінформовані трейдери знімають свої замовлення, ці постачальники ліквідності зазнають збитків. Тоді вони постають перед вибором: вони можуть збільшити вартість своїх послуг або — у важких випадках — повністю піти з ринку. Аналізуючи дисбаланс потоку замовлень між обсягами купівлі та продажу, ми можемо моделювати взаємодію між поінформованими трейдерами та маркет-мейкерами.

Токсичність потоку замовлення може бути не тільки a хороший провісник короткострокової волатильності — здається, що в деяких (дуже) рідкісних випадках він може навіть передбачити більші зміни ціни.

Передбачувана здатність VPN-кодів різко зростає, коли ринок, про який йдеться, вже досить нестабільний. Я можу лише припускати причини, але насправді я бачу дві.

Перший полягає в тому, що маркет-мейкери працюють із надзвичайно низькою маржею. Відповідно, вони, швидше за все, зазнають великих збитків через несприятливий вибір на більш нестабільних ринках.

Крім того, спреди на нестабільних ринках вже досить широкі. Токсичність потоку замовлень — на додаток до волатильності — може різко збільшити спреди (і витрати на прослизання для трейдерів). Коли це відбувається, торгівля стає дуже дорогою; Я припускаю, що трейдери будуть менш схильні купувати через високий вплив ціни, але все одно будуть змушені продавати, якщо ринок обвалиться.

Джерело: https://medium.com/@lucasastorian/empirical-market-microstructure-f67eff3517e0?source=rss——-8—————–cryptocurrency

Часова мітка:

Більше від Medium