경험적 시장 미세 구조

소스 노드 : 937627

~ Pexels

비트코인 현물 시장의 주문 흐름 독성

2020년 800월부터 USDT로 표시된 비트코인의 XNUMX천억 달러 이상이 바이낸스에서 거래되었습니다. 가장 큰 비트코인 교환. 다른 시장에서와 마찬가지로 바이낸스에서 제공되는 대부분의 유동성은 시장 조성자로부터 나옵니다. 시장 조성자는 입찰-매도 스프레드에서 이익을 얻을 수 있기를 바라며 비트코인을 사고 팔려는 회사입니다.

시장 미세구조 이론 인식z가격 형성은 외생적 요인뿐만 아니라 내생적 요인에 의해 결정됩니다. 유동성, 시장 영향, 거래 비용(슬리피지), 변동성 및 지정가 주문서의 메커니즘은 모두 중요한 역할을 합니다.

수요와 공급에 관한 고전적 경제 이론은 균형 가격에서 사고 팔려는 투자자라면 누구나 일반적으로 그렇게 할 수 있다고 가정합니다. 실제로 증권을 사고 파는 행위 자체가 시장 가격을 변화시킵니다. 거래는 시장에 영향을 미칩니다.

많은 양의 비트코인을 사거나 팔고자 하는 투자자는 전체 주문을 한 번에 실행하지 않을 것입니다. 대신, 시간이 지남에 따라 최저 가격에 매수하거나 최고 가격에 매도하기 위해 점진적으로 그렇게 할 것입니다. Stan Druckenmiller — George Soros와 함께 영란은행 파산 in 1992— 최근에 그가 사려고 했다 100년 비트코인으로 2018억 달러. 유동성이 부족한 그는 20천만 달러를 사는 데 XNUMX주가 걸렸고, 그 시점에서 포기했습니다.

따라서 거래의 시장 영향은 투자자가 보안을 사고 파는 결정에 중요한 역할을 하며, 이는 다시 해당 보안이 거래되는 가격에 영향을 미칩니다.

모든 시장 참여자는 이익을 얻기 위해 시장에 진입하지만 시장 조성자와 거래자는 근본적으로 다른 방식으로 돈을 벌거나 잃습니다. 시장 조성자들은 입찰-매도 스프레드를 얻기 위해 비트코인을 사고 팔고 있습니다. 거래자들은 미래의 가격 변동에 대해 정보가 있거나 없는 믿음을 가지고 있기 때문에 비트코인을 사고파는 것입니다.

매수-매도 스프레드를 얻으려면 시장 조성자는 비트코인과 테더의 재고를 적극적으로 관리해야 합니다. 거래 흐름이 균형을 이루면 요청 시 비트코인을 팔고 입찰 시 다시 사서 수익을 올릴 수 있습니다. 그러나 거래 흐름이 너무 불균형해지면 시장 조성자가 재고를 롤오버하여 이익을 내기가 더 어려워집니다. 일반적으로 마켓 메이커는 서비스에 대해 청구하는 가격(매수-매도 스프레드)을 인상하여 트레이더의 거래 비용(슬리피지)을 증가시킵니다.

시장 조성자와 거래자는 근본적으로 다른 방식으로 돈을 벌거나 잃습니다.

시장 조성자가 유동성을 기꺼이 제공하려는 매수 및 매도는 정보가 풍부한 거래자들에 의해 불리하게 선택되는 정도에 따라 결정됩니다. 정보에 입각한 트레이더가 비트코인을 사고팔기 때문에 주문 흐름이 불균형해지면 해당 주문 흐름은 독성이 있는 것으로 간주됩니다.

6월 XNUMX일 플래시 크래시 동안 주문 흐름 독성

2010년에 코넬의 연구원 XNUMX명이 Tudor Investment Group과 공동으로 종이 다우존스산업평균지수(DJIA)가 2010% 급락한 후 즉시 회복되었던 9년 플래시 크래시가 극도의 주문 흐름 독성으로 인해 어떻게 발생했는지 설명합니다.

악성 주문 흐름을 식별하는 데 사용되는 모델인 VPIN(볼륨 동기화 확률 정보 거래)은 플래시 크래시가 발생하기 전 한 시간 만에 사상 최고치로 치솟았고 여전히 미스터리한 이벤트로 간주되는 이벤트를 성공적으로 예측했습니다.

튜더 신문은 언론의 주목을 받았습니다: 블룸버그 기사 VPIN은 "규제 당국이 6월 2007일 급락과 같은 충돌을 방지하는 데 도움이 될 수 있다"고 지적했습니다. Lawrence Berkeley National Laboratory의 연구원들은 VPIN이 2012년 XNUMX월부터 XNUMX년 XNUMX월까지 선물 시장의 높은 변동성 이벤트를 잘 예측했음을 보여주었습니다.

브릴리언트에서 나중에 논문, 같은 저자는 고차 흐름 독성이 시장 조성자를 시장에서 몰아내는 것만이 아니라고 지적합니다. 시장 조성자가 손실을 입고 재고를 버려야 하는 경우 남은 유동성을 제공하는 대신 고갈시킬 수 있습니다.

6월 XNUMX일 폭락 직전 몇 시간 동안 정보에 입각한 트레이더들은 계속해서 시장 조성자에게 자신의 포지션을 매도해 왔으며, 이로 인해 손실이 증가했습니다. 동일한 마켓 메이커가 결국 포지션을 해제해야 했을 때 결과는 참혹했습니다. 연구원의 말에 따르면 "극단적인 독성은 유동성 공급자를 유동성 소비자로 전환할 수 있는 능력이 있습니다."

"극단적인 독성은 유동성 공급자를 유동성 소비자로 전환할 수 있는 능력이 있습니다." — 'Flash Crash'의 미세 구조

VPIN은 정보가 있는 거래자, 정보가 없는 거래자 및 시장 조성자의 세 가지 유형의 참여자 간의 게임으로 거래를 보는 PIN 모델을 기반으로 합니다.

VPIN은 과거 기간 동안 매수와 매도 볼륨의 절대 차이로 근사됩니다. VPIN은 시간별 샘플링 대신 고정 금액 볼륨 막대를 사용하여 계산됩니다. 예를 들어 1000 비트코인이 교환될 때마다 한 번 샘플링할 수 있습니다.

새로운 정보가 시장에 도착하면 볼륨이 증가하고 그렇지 않으면 감소하는 경향이 있습니다. 따라서 부피 기준 샘플링은 변동성(및 정보 흐름) 기준 샘플링과 유사합니다.

구매자가 정보에 입각한 트레이더인 경우 주문은 구매 주문으로 분류됩니다. 유사하게 판매자가 정보에 입각한 트레이더인 경우 주문은 매도 주문으로 분류됩니다. 다음에 구매 및 판매 거래를 식별하는 방법에 대해 자세히 알아보세요.

VPIN은 길이가 n인 기간 동안의 평균 볼륨 불균형입니다.
VPIN 계산은 분류된 구매 및 판매 볼륨의 두 가지 Pandas 시리즈를 사용합니다.

틱 규칙은 거래 침략자, 즉 가격 결정 당사자를 식별하여 정보에 입각한 구매 및 판매 거래를 분류합니다. 시장가 주문을 통해 비트코인을 구매하는 트레이더는 주문서에서 매수-매도 평균보다 높은 최고의 매수호가와 매칭됩니다. 이것은 그를 침략자로 만듭니다. 거래자가 매수-매도 평균 이하에서 비트코인을 구매하기 위해 지정가 주문을 제출하는 경우, 다른 거래자가 시장가 주문을 통해 비트코인을 적극적으로 매도하면 해당 주문이 체결될 수 있습니다.

틱 규칙은 간단한 관찰에 의존하여 거래 침략자를 식별합니다. 공격적인 구매 주문은 주문이 주문서에서 가장 낮은 요청과 일치하기 때문에 자산 가격을 높이는 경향이 있습니다. 마찬가지로, 공격적인 매도 주문은 가장 높은 입찰가가 일치된 후 자산 가격을 낮추는 경향이 있습니다. 후속 가격 변화는 무역 침략자를 식별하는 데 사용될 수 있습니다.

틱 규칙(금융 기계 학습의 발전 19장)

후속 가격 상승을 유발하는 거래는 1 — 구매로 표시됩니다. 가격 하락을 초래한 거래는 -1(매도)로 표시됩니다. 가격 변동을 일으키지 않는 거래(최고 입찰가 또는 최저 입찰가를 완전히 채우지 않았기 때문에)는 이전 틱으로 표시됩니다.

틱 규칙은 (일반적으로) 공격자 측을 성공적으로 식별하지만, 일부 최근 연구에 따르면 공격자 측 거래자와 정보가 풍부한 거래자는 빈도가 높은 시장에서 동일하지 않을 수 있습니다. 예를 들어, 정보가 풍부한 트레이더는 오더북 전체에 걸쳐 여러 지정가 주문을 제출하고, 채워지지 않은 주문을 취소하고, 틱 규칙에 따라 여전히 정보가 없는 것으로 나타날 수 있습니다.

VPIN의 원래 구현은 베이지안 접근 방식을 사용합니다. 벌크 볼륨 분류(BVC) 각 막대에서 정보에 입각한 구매 및 판매 볼륨의 비율을 대략적으로 계산합니다(시간 또는 볼륨 기반). BVC에 대한 나의 실제 경험은 다소 혼합되어 있습니다. BVC를 사용하는 대신 다른 옵션을 사용하기로 결정했습니다. 구매자 또는 판매자가 원시 바이낸스 거래 데이터에서 시장 조성자인지 지정하는 거래 태그를 사용하는 것입니다.

Binance는 작년 2021월 초부터 AWS 서버에서 수집한 Websocket 스트림을 통해 실시간 거래 데이터를 게시합니다. 그것이 내 데이터의 출처입니다. XNUMX년 XNUMX월부터 이전 데이터도 다운로드할 수 있습니다. 여기를 클릭해 문의해주세요.

나는 윈도우 크기가 1600인 하루에 약 1000개의 샘플이 있는 롤링 달러 바를 사용하여 VPIN을 계산했습니다. 이것은 각 볼륨 버킷이 엄밀히 말해서 정확히 같은 크기가 아니라는 것을 의미합니다. 그럼에도 불구하고 차이가 미미하므로 개별 버킷에 가중치를 두지 않고 원래 구현을 사용하는 것이 편합니다.

원래 구현과 달리 구매 및 판매 볼륨은 구매자가 시장 조성자인지 여부를 지정하는 거래 수준 태그를 사용하여 분류되었습니다. 또한 원래 구현과 달리 VPIN은 고정되지 않습니다.

지난 XNUMX년 동안 비트코인의 시가총액과 거래량이 증가함에 따라 주문 흐름 불균형이 크게 감소한 것으로 보입니다. 이는 대형주일수록 매수-매도 스프레드가 낮아 역선택이 적다는 연구 결과와 일치합니다.

2020년 2021월부터 XNUMX년 XNUMX월 중순까지 계산된 VPIN

마지막 조정인 19년 2021월 XNUMX일까지 이어지는 공격자 측 매수 및 매도 주문 간의 주문 흐름 불균형은 최소화된 것으로 보입니다. 상대적으로 낮은 VPIN 메트릭은 독성이 수정에 역할을 하지 않았음을 의미합니다.

때로는 현지화된 주문 흐름 불균형이 가격의 급격한 하락 직전에 정점에 도달하는 것처럼 보입니다. 12월 18일과 XNUMX일이 가장 좋은 예입니다. 그러나 이것은 내가 차트를 읽는 것일 수 있습니다.

VPIN으로 트리플 배리어 라벨 예측

VPIN이 반드시 미래 수익을 예측하도록 설계된 것은 아닙니다. 대신 과거 기간 동안의 평균 거래량 가중 주문 흐름 불균형을 설명할 뿐입니다. 이러한 불균형에 대한 지식은 미래 불균형의 지속성, 증가 또는 감소를 예측하는 데 반드시 사용될 수는 없습니다. 그래도 해볼만 하다고 생각했다.

나는 Marcos López de Prado가 제안한 꽤 표준적인 설정을 사용했습니다. 다음 단락은 금융 기계 학습에 익숙하지 않은 사람들에게는 횡설수설처럼 들릴 것이므로 건너뛰어도 됩니다.

샘플을 롱 또는 숏 포지션으로 분류하기 위해 변동성 조정 트리플 배리어 라벨을 계산했습니다. 최대 레이블 너비는 어느 방향으로든 3.5%로 제한됩니다. 수직 장벽 히트는 포지션 길이에 대한 절대 수익으로 분류됩니다. 평균 고유성을 기준으로 샘플 가중치를 계산했습니다. RF는 100개의 트리, 트리당 관련 최대 샘플, 트리당 하나의 기능, 최대 깊이 6으로 훈련됩니다. 데이터는 크기 조정, 제거, 금지(5%) 및 XNUMX겹에 걸쳐 교차 검증됩니다. . Marcos'의 처음 두 부분을 읽으십시오. 당신이 세부 사항에 관심이 있다면.

작년 말에 VPIN이 급격히 중단된 것 같아서 지난 250,000개월 반 동안의 데이터만 사용하기로 결정했습니다. 접기 당 약 한 달의 데이터입니다. 그러면 총 ~XNUMX개의 샘플이 생성됩니다.

원본 논문에서와 같이 대수 정규 분포를 사용하여 VPIN 메트릭을 피팅하고 VPIN의 CDF에서 모델을 교육했습니다. 50, 100, 250, 500, 1000, 2500, 5000의 XNUMX가지 창 크기를 사용했습니다. 다섯 겹 모두에 걸친 ROC 곡선이 아래에 그려져 있습니다.

XNUMX개 폴드에 걸친 롱-숏 트리플 배리어 예측의 수신자 작동 특성(ROC) 곡선

이 모델은 평균적으로 0.5 AUC 벤치마크보다 분명히 성능이 낮은 반면 성능은 폴드에 따라 다릅니다. 그러나 ROC 곡선과 AUC 점수는 VPIN(의 CDF) 성능을 평가하는 최선의 방법이 아닐 수 있습니다.

금융 기계 학습에서 ROC 곡선의 문제는 후반 성능에 대한 좋은 아이디어를 제공하지 않는다는 것입니다. VPIN이 정상적인 시장 조건에서 가격 형성에 영향을 미치지 않는다는 것은 전적으로 가능하고 심지어 가능합니다. 실제로 시장 조성자는 매수와 매도량 사이의 변동을 예상합니다. 그것은 단지 사업을 하는 데 드는 비용입니다.

극단적인 시장 상황에서 극도로 높거나 낮은 순서 흐름 독성이 비트코인에서 예측 능력을 가지고 있는지 알고 싶습니다. 답변(아래)은 '예'인 것 같습니다.

롱 포지션에 대한 정밀 리콜 곡선(양수 레이블 =1)

Precision Recall 곡선은 다양한 임계값에 걸쳐 Precision과 Recall 사이의 장단점을 나타냅니다. 이 경우 매우 높은 임계값, 즉 매우 낮은 수준의 재현율(0.05 이하)에서 0.6개 폴드 전체에 걸쳐 긴 위치를 식별하는 모델의 평균 정밀도가 높은 75(또는 0.5)까지 상승한다는 것을 보여줍니다. XNUMX 임계값에서 XNUMX개의 폴드 전체에 걸쳐 Random Forest는 AUC가 XNUMX보다 훨씬 낮음에도 불구하고 롱 포지션의 XNUMX%를 정확하게 식별합니다.

매도 포지션에 대한 정밀 리콜 곡선(양수 레이블 = 0)

숏 포지션에 대한 Precision Recall 곡선은 비슷한 이야기를 합니다. 평균 AUC가 0.5개 곡선 모두에서 XNUMX 미만으로 유지되더라도 매우 높은 임계값에서 정밀도가 급증합니다.

이것은 VPIN이 매우 드문 경우에만 예측 능력을 가질 수 있음을 시사합니다. 이 데이터 세트에서는 기껏해야 한 달에 한두 번일 수 있습니다.

시장은 일반적으로 변동성이 높은 기간과 낮은 기간 동안 매우 다르게 행동합니다. 일부 기능의 예측 가능성은 변동성 충격 동안 현저하게 감소하는 반면 다른 기능(시장 미시 구조 포함)은 더 관련성이 높아집니다.

주문 흐름 독성 측정은 시장 조성자가 이미 유동성을 제공하는 스프레드를 확대한 이미 변동성이 큰 시장과 특히 관련이 있을 수 있습니다. 높은 가격 변동성을 다루는 것 외에도 시장 조성자가 정보에 입각한 거래자들에 의해 불리하게 선택되고 있다면 이것은 일종의 "이중고통"을 형성할 수 있습니다(물론 여기서는 순전히 추측입니다).

이러한 추측을 계속하기 위해 시장 조성자는 변동성이 큰 시장에서 손실을 입을 가능성이 더 높을 수 있습니다. 이로 인해 재고를 버릴 확률이 높아져(2010년 Flash Crash 동안 그랬던 것처럼) 가격이 하락했습니다.

변동성 임계값은 변동성이 특정 벤치마크 아래로 떨어지는 데이터 세트에서 모든 샘플을 제거합니다. 예를 들어 이 데이터 세트에서 변동성 임계값 0.02는 데이터의 약 XNUMX/XNUMX을 제외하지만 AUC, Long Precision Recall Curve 및 Short Precision Recall Curve에서 극적인 개선을 가져옵니다.

변동성 임계값이 1인 롱(0) 및 숏(0.02) 포지션의 ROC 곡선

AUC 점수는 0.49(무작위 분류기보다 나쁨)에서 상당한 0.55로 상승합니다. 하나를 제외한 모든 접기의 AUC 점수는 0.5 벤치마크보다 훨씬 높습니다.

롱 포지션에 대한 정밀 리콜 곡선(양수 레이블 = 1)
매도 포지션에 대한 정밀 리콜 곡선(양수 레이블 = 2)

Precision Recall 곡선의 경우 변동성 임계값을 포함하면 다양한 임계값에서 Precision이 극적으로 높아진 것으로 보입니다. VPIN은 이미 변동성이 큰 시장에서 훨씬 더 높은 예측 능력을 가지고 있는 것 같습니다.

물론 내가 (어떤 식으로든) 데이터를 과적합했을 가능성도 있습니다. 보다 완전한 분석은 Ethereum, Ripple 및 Cardano와 같은 다른 Cryptocurrencies에 동일한 접근 방식을 적용하여 VPIN이 실제로 가격 변동을 예측할 수 있고 예측 용량이 변동성에 따라 증가하는지 확인합니다.

마켓 메이커는 거래소에서 가장 중요한 역할 중 하나인 유동성을 제공합니다. 그러나 정보가 풍부한 거래자가 주문을 선택하면 이러한 유동성 공급자는 손실을 입습니다. 그런 다음 선택에 직면하게 됩니다. 서비스 비용을 늘리거나 심각한 경우 시장에서 완전히 철수할 수 있습니다. 매수와 매도량 사이의 주문 흐름 불균형을 분석함으로써 우리는 정보에 입각한 트레이더와 마켓 메이커 간의 상호 작용을 모델링할 수 있습니다.

주문 흐름 독성은 단기 변동성에 대한 좋은 예측 변수 — 일부 (매우) 드문 경우에는 더 큰 가격 변동을 예측할 수도 있습니다.

VPIN의 예측 능력은 문제의 시장이 이미 상당히 불안정할 때 급격히 증가합니다. 그 이유에 대해서만 추측할 수 있지만 실제로는 두 가지가 보입니다.

첫 번째는 마켓 메이커가 매우 적은 마진으로 운영된다는 것입니다. 결과적으로 변동성이 큰 시장에서 역선택으로 인해 큰 손실을 입을 가능성이 더 큽니다.

게다가 변동성이 큰 시장의 스프레드는 이미 상당히 넓습니다. 변동성 외에도 주문 흐름 독성은 스프레드(및 트레이더의 슬리피지 비용)를 크게 증가시킬 수 있습니다. 이런 일이 발생하면 거래 비용이 매우 많이 듭니다. 높은 가격 영향으로 인해 트레이더가 매수할 가능성이 적지만 시장이 무너지면 여전히 매도해야 한다고 가정합니다.

출처: https://medium.com/@lucasastorian/empirical-market-microstructure-f67eff3517e0?source=rss——-8—————–cryptocurrency

타임 스탬프 :

더보기 중급