Cấu trúc vi mô của thị trường thực nghiệm

Nút nguồn: 937627

Từ Pexels

Tính độc hại của dòng lệnh trên thị trường Bitcoin giao ngay

Kể từ tháng 2020 năm 800, hơn XNUMX tỷ đô la Bitcoin có mệnh giá USDT đã được giao dịch trên Binance – cho đến nay lớn nhất Trao đổi bitcoin. Giống như ở các thị trường khác, phần lớn thanh khoản được cung cấp trên Binance đến từ các nhà tạo lập thị trường: các công ty sẵn sàng mua hoặc bán Bitcoin với hy vọng họ sẽ kiếm được lợi nhuận từ chênh lệch giá chào bán.

Nhận thức lý thuyết cấu trúc vi mô thị trườngzrằng sự hình thành giá được xác định bởi các yếu tố nội sinh, cũng như các yếu tố ngoại sinh. Tính thanh khoản, tác động của thị trường, chi phí giao dịch (trượt giá), sự biến động và cơ chế của sổ lệnh giới hạn đều đóng một vai trò quan trọng.

Lý thuyết kinh tế cổ điển về cung và cầu giả định rằng bất kỳ nhà đầu tư nào sẵn sàng mua và bán ở mức giá cân bằng nói chung đều có thể làm như vậy. Trên thực tế, chính hành động mua hoặc bán chứng khoán sẽ làm thay đổi giá thị trường; giao dịch có tác động tới thị trường.

Nhà đầu tư muốn mua hoặc bán một lượng lớn Bitcoin sẽ không thực hiện toàn bộ đơn hàng cùng một lúc. Thay vào đó, họ sẽ làm như vậy dần dần, theo thời gian, để mua ở mức giá thấp nhất hoặc bán ở mức giá cao nhất. Stan Druckenmiller - người cùng với George Soros, đã phá vỡ Ngân hàng Anh tôin 1992— gần đây đã đề cập rằng ông cố gắng mua 100 triệu đô la Bitcoin vào năm 2018. Thiếu thanh khoản, anh ấy phải mất hai tuần để mua 20 triệu đô la, lúc đó anh ấy đã từ bỏ.

Do đó, tác động thị trường của một giao dịch đóng một vai trò quan trọng trong quyết định mua hoặc bán chứng khoán của nhà đầu tư, từ đó ảnh hưởng đến mức giá mà chứng khoán đó được giao dịch.

Tất cả những người tham gia thị trường đều tham gia vào thị trường với hy vọng kiếm được lợi nhuận, tuy nhiên các nhà tạo lập thị trường và nhà giao dịch lại kiếm (hoặc mất) tiền theo những cách cơ bản khác nhau. Các nhà tạo lập thị trường đều mua và bán Bitcoin với hy vọng kiếm được chênh lệch giá chào mua. Các nhà giao dịch mua và bán Bitcoin vì họ có niềm tin sáng suốt hoặc không hiểu biết về những thay đổi giá trong tương lai.

Để kiếm được chênh lệch giá thầu-yêu cầu, các nhà tạo lập thị trường phải tích cực quản lý lượng hàng tồn kho của cả Bitcoin và Tether. Khi luồng giao dịch được cân bằng, họ có thể bán Bitcoin theo yêu cầu và mua lại theo giá thầu, tạo ra lợi nhuận. Tuy nhiên, nếu các luồng giao dịch trở nên quá mất cân bằng, các nhà tạo lập thị trường sẽ gặp khó khăn hơn trong việc luân chuyển hàng tồn kho của họ để kiếm lời. Nói chung, các nhà tạo lập thị trường sau đó sẽ tăng mức giá mà họ tính cho dịch vụ của mình - chênh lệch giá chào mua - làm tăng chi phí giao dịch (trượt giá) cho các nhà giao dịch.

Các nhà tạo lập thị trường và nhà giao dịch kiếm (hoặc mất) tiền theo những cách cơ bản khác nhau

Giá thầu và yêu cầu mà các nhà tạo lập thị trường sẵn sàng cung cấp thanh khoản được xác định bởi mức độ mà chúng được lựa chọn bất lợi bởi các nhà giao dịch có hiểu biết. Nếu luồng đơn hàng trở nên mất cân bằng do các nhà giao dịch có hiểu biết đang mua hoặc bán Bitcoin thì luồng đơn hàng đó được coi là độc hại.

Độc tính dòng chảy đặt hàng trong Sự cố chớp nhoáng ngày 6 tháng XNUMX

Năm 2010, ba nhà nghiên cứu từ Cornell phối hợp với Tập đoàn đầu tư Tudor đã xuất bản một báo cáo giấy mô tả sự cố chớp nhoáng năm 2010 - trong đó Chỉ số Trung bình Công nghiệp Dow Jones (DJIA) giảm 9% trong thời gian ngắn trước khi phục hồi ngay lập tức - là do dòng lệnh quá độc hại.

Mô hình được sử dụng để xác định luồng lệnh độc hại — VPIN (xác suất giao dịch được đồng bộ hóa theo khối lượng) — đã tăng vọt lên mức cao nhất mọi thời đại trong giờ dẫn đến sự cố chớp nhoáng và dự đoán thành công điều vẫn được coi là một sự kiện bí ẩn.

Bài báo của Tudor đã nhận được sự chú ý của giới truyền thông: Bloomberg bài viết chỉ ra rằng VPIN có thể “giúp các cơ quan quản lý ngăn chặn các sự cố như vụ lao dốc ngày 6 tháng 2007”. Các nhà nghiên cứu tại Phòng thí nghiệm quốc gia Lawrence Berkeley cho thấy VPIN đã dự đoán tốt các sự kiện biến động cao trên thị trường tương lai từ tháng 2012 năm XNUMX đến tháng XNUMX năm XNUMX.

rực rỡ bài báo sau, các tác giả tương tự chỉ ra rằng độc tính của dòng lệnh cao không chỉ buộc các nhà tạo lập thị trường rời khỏi thị trường; nếu các nhà tạo lập thị trường phải bán lỗ hàng tồn kho của mình, họ có thể rút hết thanh khoản còn lại thay vì cung cấp nó.

Trong những giờ trước vụ sụp đổ ngày 6 tháng XNUMX, các nhà giao dịch có hiểu biết đã liên tục bán vị thế của mình cho các nhà tạo lập thị trường, những người phải đối mặt với tổn thất ngày càng tăng. Khi chính những nhà tạo lập thị trường này cuối cùng bị buộc phải hủy bỏ vị thế của mình, kết quả thật thảm khốc. Theo lời của các nhà nghiên cứu: “độc tính cực cao có khả năng biến nhà cung cấp thanh khoản thành người tiêu dùng thanh khoản”.

“Độc tính cực cao có khả năng biến nhà cung cấp thanh khoản thành người tiêu dùng thanh khoản” — Cấu trúc vi mô của 'Sự cố flash'

VPIN dựa trên mô hình PIN, xem giao dịch như một trò chơi giữa ba loại người tham gia: nhà giao dịch có hiểu biết, nhà giao dịch không có hiểu biết và nhà tạo lập thị trường.

VPIN được tính gần đúng bằng chênh lệch tuyệt đối giữa khối lượng mua và bán trong một khoảng thời gian lịch sử. Thay vì lấy mẫu theo thời gian, VPIN được tính bằng các thanh âm lượng có số lượng cố định. Ví dụ: bạn có thể lấy mẫu một lần mỗi lần trao đổi 1000 Bitcoin.

Khối lượng có xu hướng tăng khi có thông tin mới xuất hiện trên thị trường và giảm khi không có thông tin nào. Do đó, lấy mẫu theo thể tích cũng giống như lấy mẫu theo độ biến động (và luồng thông tin).

Lệnh được phân loại là lệnh mua nếu người mua là nhà giao dịch có hiểu biết; tương tự, một lệnh được phân loại là lệnh bán nếu người bán là một nhà giao dịch có hiểu biết. Thông tin thêm về xác định giao dịch mua và bán tiếp theo.

VPIN là Mất cân bằng khối lượng trung bình trong khoảng thời gian lịch sử có độ dài n
Tính toán VPIN sử dụng hai chuỗi Pandas về khối lượng mua và bán phân loại

Quy tắc đánh dấu phân loại các giao dịch mua và bán có hiểu biết bằng cách xác định bên xâm lược giao dịch, tức là bên định giá. Một nhà giao dịch mua Bitcoin thông qua lệnh thị trường sẽ được khớp với yêu cầu tốt nhất trong sổ đặt hàng - trên mức trung bình giá thầu. Điều này khiến anh ta trở thành kẻ hung hăng. Nếu một nhà giao dịch gửi Lệnh giới hạn để mua Bitcoin dưới mức trung bình giá thầu, lệnh đó cuối cùng có thể được thực hiện nếu một nhà giao dịch khác tích cực bán Bitcoin thông qua lệnh thị trường.

Quy tắc đánh dấu xác định kẻ xâm lược thương mại bằng cách dựa vào một quan sát đơn giản. Các lệnh mua tích cực có xu hướng làm tăng giá của một tài sản vì lệnh này được khớp với giá chào bán thấp nhất trong sổ lệnh. Tương tự, các lệnh bán tích cực có xu hướng giảm giá tài sản sau khi giá thầu cao nhất được khớp. Sự thay đổi giá tiếp theo có thể được sử dụng để xác định kẻ xâm lược thương mại.

Quy tắc đánh dấu (Những tiến bộ trong học máy tài chính Chương 19)

Các giao dịch gây ra sự tăng giá tiếp theo được gắn nhãn là 1 - mua. Các giao dịch làm giảm giá được gắn nhãn -1 - bán. Các giao dịch không gây ra thay đổi về giá (vì chúng không hoàn toàn đáp ứng giá thầu cao nhất hoặc yêu cầu thấp nhất) được gắn nhãn bằng dấu tích trước đó.

Mặc dù Quy tắc đánh dấu (nói chung) xác định thành công bên xâm lược, một số nghiên cứu gần đây cho thấy rằng những người giao dịch bên xâm lược và những nhà giao dịch hiểu biết có thể không tương đương nhau trong các thị trường có tần suất cao. Ví dụ: một nhà giao dịch có hiểu biết có thể chỉ cần gửi nhiều lệnh giới hạn trong sổ lệnh, hủy những lệnh không được thực hiện và vẫn có vẻ như không được cung cấp thông tin theo Quy tắc đánh dấu.

Việc triển khai VPN ban đầu sử dụng phương pháp Bayesian được gọi là Phân loại khối lượng lớn (BVC) để ước tính tỷ lệ khối lượng mua và bán được thông báo trong mỗi thanh (dựa trên thời gian hoặc khối lượng). Kinh nghiệm thực tế của tôi với BVC khá hỗn tạp. Thay vì sử dụng BVC, tôi quyết định chọn một tùy chọn khác: sử dụng thẻ giao dịch để xác định xem người mua hay người bán là nhà tạo lập thị trường trong dữ liệu Binance Trade thô.

Binance xuất bản dữ liệu giao dịch trực tiếp thông qua luồng Websocket mà tôi đã thu thập trên máy chủ AWS từ đầu tháng 2021 năm ngoái; đó là nơi dữ liệu của tôi đến từ. Kể từ tháng XNUMX năm XNUMX, bạn cũng có thể tải xuống dữ liệu lịch sử tại đây.

Tôi đã tính toán VPIN bằng cách sử dụng Thanh đô la cuộn với khoảng 1600 mẫu mỗi ngày với kích thước cửa sổ là 1000. Điều này có nghĩa là mỗi nhóm khối lượng không hoàn toàn có cùng kích thước. Mặc dù vậy, sự khác biệt là rất nhỏ nên tôi cảm thấy thoải mái khi sử dụng cách triển khai ban đầu mà không cần phải cân nhắc từng nhóm.

Không giống như cách triển khai ban đầu, khối lượng mua và bán đã được phân loại bằng cách sử dụng thẻ cấp độ giao dịch để xác định xem người mua có phải là nhà tạo lập thị trường hay không. Ngoài ra, không giống như cách triển khai ban đầu, VPN không cố định.

Sự mất cân bằng dòng lệnh dường như đã giảm đáng kể trong năm qua khi vốn hóa thị trường và khối lượng giao dịch của Bitcoin tăng lên. Điều này phù hợp với nghiên cứu cho thấy rằng các cổ phiếu lớn hơn có chênh lệch giá chào mua thấp hơn, hàm ý ít lựa chọn bất lợi hơn.

VPIN Tính từ tháng 2020 năm 2021 đến giữa tháng XNUMX năm XNUMX

Sự mất cân bằng dòng lệnh giữa các lệnh mua và bán của bên xâm lược dẫn đến đợt điều chỉnh cuối cùng - ngày 19 tháng 2021 năm XNUMX— dường như ở mức tối thiểu. Số liệu VPIN tương đối thấp ngụ ý rằng độc tính không đóng vai trò trong việc điều chỉnh.

Đôi khi, sự mất cân bằng dòng đơn đặt hàng cục bộ dường như lên đến đỉnh điểm ngay trước khi giá giảm mạnh - ngày 12 và 18 tháng XNUMX là ví dụ điển hình nhất. Tuy nhiên, đây chỉ có thể là tôi đang đọc biểu đồ.

Dự đoán Nhãn ba rào cản bằng VPN

VPN không nhất thiết được thiết kế để dự đoán lợi nhuận trong tương lai. Thay vào đó, nó chỉ mô tả sự mất cân bằng trung bình, theo khối lượng đặt hàng trong một khoảng thời gian lịch sử. Kiến thức về những sự mất cân bằng này không nhất thiết có thể được sử dụng để dự báo sự tồn tại, tăng hoặc giảm của sự mất cân bằng trong tương lai. Tuy nhiên, tôi nghĩ tôi có thể thử.

Tôi đã sử dụng một thiết lập khá chuẩn do Marcos López de Prado đề xuất - đoạn sau đây nghe có vẻ vô nghĩa đối với những người không quen với Học máy tài chính, vì vậy vui lòng bỏ qua nó.

Tôi đã tính toán Nhãn ba rào cản được điều chỉnh độ biến động để phân loại các mẫu thành vị trí Mua hoặc Bán. Chiều rộng nhãn tối đa được giới hạn ở mức 3.5% theo cả hai hướng; các lần truy cập rào cản dọc được phân loại theo lợi nhuận tuyệt đối trong suốt thời gian của vị thế. Tôi đã tính toán trọng lượng mẫu dựa trên tính duy nhất trung bình. RF được đào tạo với 100 cây, số mẫu tối đa có liên quan trên mỗi cây, không quá một đặc điểm trên mỗi cây và độ sâu tối đa là 6. Dữ liệu được chia tỷ lệ, thanh lọc, cấm vận (5%) và xác thực chéo qua năm lần . Đọc hai phần đầu tiên của Marcos' cuốn sách nếu bạn quan tâm đến các chi tiết.

Vì VPIN dường như có sự đột phá mạnh vào cuối năm ngoái nên tôi quyết định chỉ sử dụng dữ liệu từ sáu tháng rưỡi qua; vậy là khoảng một tháng dữ liệu cho mỗi lần. Điều đó tạo nên tổng số ~ 250,000 mẫu.

Như trong bài báo gốc, tôi đã trang bị số liệu VPIN bằng cách sử dụng phân phối log-chuẩn và huấn luyện mô hình trên CDF của VPIN. Tôi đã sử dụng bảy kích thước cửa sổ khác nhau: 50, 100, 250, 500, 1000, 2500 và 5000. Các đường cong ROC trên tất cả năm nếp gấp được vẽ bên dưới.

Các đường cong Đặc tính hoạt động của máy thu (ROC) của các dự đoán ba rào cản dài ngắn trên năm lần

Mô hình này rõ ràng hoạt động kém hơn mức trung bình 0.5 AUC chuẩn, trong khi hiệu suất thay đổi theo từng màn hình. Tuy nhiên, đường cong ROC và điểm AUC có thể không phải là cách tốt nhất để đánh giá hiệu suất của (CDF của) VPIN.

Vấn đề với đường cong ROC trong Học máy tài chính là chúng không đưa ra ý tưởng hay về hiệu suất cuối cùng. Hoàn toàn có thể - và thậm chí có thể xảy ra - rằng VPIN không có tác động đến việc hình thành giá trong điều kiện thị trường bình thường. Thật vậy, các nhà tạo lập thị trường mong đợi sự biến động giữa khối lượng mua và bán; đó chỉ là chi phí kinh doanh.

Tôi muốn biết liệu độc tính dòng lệnh cực cao hay thấp trong điều kiện thị trường khắc nghiệt có bất kỳ khả năng dự đoán nào về Bitcoin hay không. Câu trả lời (bên dưới) có vẻ là có.

Đường cong thu hồi chính xác cho các vị thế mua (Nhãn dương =1)

Đường cong Thu hồi chính xác biểu thị sự cân bằng giữa Độ chính xác và Thu hồi chính xác qua các ngưỡng khác nhau. Trong trường hợp này, nó cho thấy rằng ở các ngưỡng rất cao, tức là mức thu hồi rất thấp (0.05 trở xuống), độ chính xác trung bình của mô hình trong việc xác định các vị trí mua trên cả năm nếp gấp tăng lên đến mức cao nhất là 0.6 (và thậm chí có thể là 75). Ở Ngưỡng 0.5, trên tất cả năm lần, Rừng ngẫu nhiên xác định chính xác XNUMX% vị trí Mua, mặc dù AUC thấp hơn nhiều so với XNUMX.

Đường cong thu hồi chính xác cho các vị thế bán (Nhãn dương = 0)

Đường cong Thu hồi Chính xác cho các vị thế bán cũng kể một câu chuyện tương tự. Mặc dù AUC trung bình vẫn ở mức dưới 0.5 trên cả năm đường cong nhưng độ chính xác vẫn tăng đột biến ở các ngưỡng rất cao.

Điều này cho thấy rằng VPIN có thể chỉ có khả năng dự đoán trong những trường hợp rất hiếm - nhiều nhất có thể một hoặc hai lần một tháng trong tập dữ liệu này.

Thị trường nhìn chung hoạt động khá khác nhau trong thời kỳ biến động cao và thấp. Khả năng dự đoán của một số đặc điểm giảm rõ rệt khi xảy ra cú sốc biến động, trong khi các đặc điểm khác (bao gồm cả đặc điểm Cấu trúc vi mô thị trường) trở nên phù hợp hơn.

Các biện pháp về Độc tính của dòng lệnh có thể đặc biệt phù hợp trong một thị trường vốn đã biến động, nơi các nhà tạo lập thị trường đã mở rộng mức chênh lệch mà họ cung cấp thanh khoản. Nếu, ngoài việc giải quyết tình trạng biến động giá cao, các nhà tạo lập thị trường còn bị các nhà giao dịch có hiểu biết lựa chọn bất lợi, thì điều này có thể tạo thành một loại “cú đúp” (tất nhiên ở đây tôi hoàn toàn đang suy đoán).

Để tiếp tục dòng suy đoán này, các nhà tạo lập thị trường có nhiều khả năng chịu lỗ trong một thị trường có nhiều biến động. Điều này làm tăng khả năng họ đổ hàng tồn kho của mình (như họ đã làm trong Flash Crash năm 2010), khiến giá giảm.

Ngưỡng biến động sẽ loại bỏ tất cả các mẫu khỏi tập dữ liệu có độ biến động giảm xuống dưới một điểm chuẩn nhất định. Ví dụ: trong tập dữ liệu này, ngưỡng biến động 0.02 loại trừ khoảng XNUMX/XNUMX dữ liệu nhưng dẫn đến những cải thiện đáng kể về AUC, Đường cong thu hồi chính xác dài và Đường cong thu hồi chính xác ngắn.

Đường cong ROC cho cả vị trí Long (1) và Short (0) với Ngưỡng biến động 0.02

Điểm AUC tăng từ 0.49 (tệ hơn so với phân loại ngẫu nhiên) lên mức 0.55 đáng nể. Điểm AUC trong tất cả các trường hợp ngoại trừ một trường hợp đều cao hơn nhiều so với điểm chuẩn 0.5.

Đường cong thu hồi chính xác cho các vị thế mua (Nhãn dương = 1)
Đường cong thu hồi chính xác cho các vị thế bán (Nhãn dương = 2)

Đối với các đường cong Thu hồi Chính xác, việc bao gồm ngưỡng biến động dường như đã nâng cao Độ chính xác đáng kể trên nhiều Ngưỡng khác nhau. VPIN dường như có khả năng dự đoán cao hơn đáng kể ở những thị trường vốn đã biến động.

Tất nhiên có thể là tôi đã (theo một cách nào đó) điều chỉnh quá mức dữ liệu. Một phân tích đầy đủ hơn sẽ áp dụng cách tiếp cận tương tự này cho các loại tiền điện tử khác như Ethereum, Ripple và Cardano để đảm bảo rằng VPIN trên thực tế có thể dự đoán biến động giá và khả năng dự đoán của nó tăng lên theo biến động.

Các nhà tạo lập thị trường đóng một trong những vai trò quan trọng nhất trên sàn giao dịch - họ cung cấp tính thanh khoản. Tuy nhiên, khi các nhà giao dịch được thông báo nhận lệnh, các nhà cung cấp thanh khoản này sẽ phải chịu lỗ. Sau đó, họ phải đối mặt với một sự lựa chọn: họ có thể tăng chi phí dịch vụ của mình hoặc - trong những trường hợp nghiêm trọng - rút lui hoàn toàn khỏi thị trường. Bằng cách phân tích sự mất cân bằng của dòng lệnh giữa khối lượng mua và bán, chúng ta có thể mô hình hóa sự tương tác giữa các nhà giao dịch có hiểu biết và các nhà tạo lập thị trường.

Độc tính dòng chảy có thể không chỉ là một dự báo tốt về biến động ngắn hạn — có vẻ như trong một số trường hợp (rất) hiếm, nó thậm chí có thể dự đoán những biến động giá lớn hơn.

Khả năng dự đoán của VPIN tăng mạnh khi thị trường được đề cập đã khá biến động. Tôi chỉ có thể suy đoán lý do, nhưng thực sự, tôi thấy có hai lý do.

Đầu tiên là các nhà tạo lập thị trường hoạt động với tỷ suất lợi nhuận rất mỏng. Do đó, họ có nhiều khả năng chịu tổn thất lớn do lựa chọn bất lợi ở những thị trường biến động hơn.

Hơn nữa, chênh lệch giá trên các thị trường đầy biến động đã khá rộng. Độc tính của dòng lệnh - ngoài sự biến động - có thể làm tăng mức chênh lệch (và chi phí trượt giá cho nhà giao dịch) một cách đáng kể. Giao dịch trở nên rất tốn kém khi điều này xảy ra; Tôi cho rằng nhà đầu tư sẽ ít mua vào hơn vì tác động giá cao nhưng vẫn buộc phải bán nếu thị trường sụp đổ.

Nguồn: https://medium.com/@lucasastorian/empirical-market-microstructure-f67eff3517e0?source=rss——-8—————–tiền điện tử

Dấu thời gian:

Thêm từ Trung bình