백테스트 리포트가 나온 날, 우리는 거의 샴페인을 터뜨릴 준비가 되어 있었다.

62% 승률, -14% 최대 드로다운, 샤프 비율 1.8. 3개월의 과거 데이터, BTC/USDT에 대한 볼린저 밴드 전략은 교과서의 “너는 진작 써야 했어” 수준으로 보였다.

그런 다음 우리는 그것을 실제 트레이딩에 투입했다.

결과: 첫 달은 백테스트 예상 이익의 70%를 잃었다.

코드가 깨진 것도 아니었고, 논리는 정확히 같았다. 그냥… 제대로 작동하지 않았다. 그 감정은 설명하기 어렵다. 마치 시뮬레이터에서 운전을 배우다가 실제 도로에 나가서 포장도로가 울퉁불퉁하고, 누군가 갑자기 차선을 침범하고, 신호등이 컴퓨터 비전으로는 읽을 수 없는 것을 발견하는 느낌 같다.

내가 이야기하고 싶은 건 “볼린저 밴드 사용법” 아니다. 그런 튜토리얼은 어디에나 있고, 유튜브 검색하면 수백 개가 나온다. 내가 공유하고 싶은 건 이번 테스트 라운드를 마친 후 BB 도구에 대한 우리의 실제 이해다.


BB의 암호화폐 시장에서의 구조적 딜레마

볼린저 밴드는 평균 회귀를 중심으로 설계되었다: 가격이 너무 멀어지면 돌아온다. 하단 밴드에서 매수하고, 상단 밴드에서 매도한다. 합리적으로 들린다.

하지만 BTC는 “순종적으로 평균으로 돌아오는” 자산이 아니다. 최소한 추세 시장에서는 아니다.

전통 금융 시장에서 대형주의 평균 회귀는 어느 정도 타당성이 있다. 기관 시장 조성자와 차익거래 메커니즘이 극단적인 편차를 억제하기 때문이다. 하지만 암호화폐 시장에서는 소매 비중이 높고 감정 증폭이 강해서, 일단 추세가 시작되면 BTC는 2~3개월 동안 볼린저 상단 밴드를 따라 움직일 수 있으며 뒤돌아보지도 않는다. 그리고 그 시간 동안 당신의 시스템이 “상단 밴드에서 숏하기"라면, 매번의 접촉은 손실이다.

기술적으로 말하면: BB는 가격 분포가 정규분포에 근사한다고 가정하지만, BTC는 두꺼운 꼬리를 가지고 있으며 극단적인 움직임이 정규분포가 예측하는 것보다 훨씬 자주 발생한다. 결과적으로, 트레이딩을 멈춰야 할 때 시스템은 계속 신호를 트리거한다.

이게 BB의 잘못이라기보다는, 부적절한 시장 조건에서 사용하는 문제다.


세 가지 시장 상태, 완전히 다른 세 가지 이야기

우리는 지난 2년간의 BTC 데이터를 세 부분으로 나누어 테스트했다: 상승 추세(2023년 말2024년 3월), 하락 추세(2024년 Q3Q4 조정 기간), 박스권 진동(2025년 Q1의 여러 횡보 기간).

박스권 기간에는 BB가 가장 편하다. 평균 회귀 논리가 유지되고, 신호가 깨끗하며, 승률은 58%-65% 사이에 있고, 최대 드로다운은 -10% 이하로 관리된다. 이것이 설계된 시장 조건이다.

하락 추세 구간에서는 승률이 40% 아래로 바로 떨어진다. 하지만 흥미롭게도, 숏 신호만 취하고 모든 롱 접촉을 무시하면 이 구간은 실제로 좋게 작동한다. 문제는 원래의 BB 시스템은 방향 필터가 없다는 것이다. 숏과 롱을 모두 한다. 그리고 약세장에서는 롱으로 반등하려는 시도마다 손절된다.

상승 추세 구간은 최악이다. 33% 승률, -28% 최대 드로다운. 그렇다. 무작위 추측보다도 나쁘다.

이 숫자는 우리를 한동안 침묵하게 했다. 왜냐하면 2024년 상승 구간은 “잘 백테스트되는 BB 전략"으로 진입하는 많은 사람들과 정확히 겹쳤기 때문이다. 그 기간에는 전략이 기대와 완전히 다르게 작동하는 이유를 궁금해하는 많은 사람들이 있었을 것이다.


백테스트 이익을 먹어치우는 세 가지 구멍

수치 격차는 이야기의 절반만 알려준다. 실제 실행에는 백테스트가 단순히 시뮬레이션할 수 없는 몇 가지 문제가 있다.

첫 번째는 슬리피지다. BTC 변동성이 높아지면 지정가 주문과 실제 체결 사이의 차이는 0.3%-0.8%가 될 수 있다. 작게 들리지만, 당신의 전략의 예상 거래당 이윤 공간이 원래 1%-2%에 불과하다면, 이 격차는 직접적으로 당신의 이익의 절반을 먹어치울 수 있다. 백테스트는 종가 체결을 사용한다. 현실은 그렇지 않다.

두 번째는 감정 증폭이다. BTC의 많은 큰 움직임은 감정 주도적이며, 감정적인 장세는 한 가지 특징이 있다: 짧은 시간에 볼린저 밴드폭이 폭발할 수 있다. “과매수” 영역이어야 하는 것이 패닉이나 FOMO 구매로 오랫동안 계속 확대될 수 있다. 기술 지표는 기본적으로 이런 종류의 장세에서 지연된다.

세 번째, 가장 위험한 것은 추세 붕괴 후의 거짓 회귀다. 가격이 잠시 중간 밴드 근처로 돌아오고, 시스템은 추세가 끝났다고 생각해서 포지션을 다시 구축하고, 그러면 두 번째 붕괴가 움직임을 계속한다. 이런 종류의 “거짓 회귀 신호"는 추세 장세에서는 매우 빈번하지만 박스권 과거 데이터에서는 거의 나타나지 않으므로, 백테스트는 단순히 이를 포착할 수 없다.


시장 상태 감지 추가가 진짜 개선다

우리의 나중 버전의 핵심 변경은 단 하나다: BB 신호를 실행하기 전에 먼저 현재 시장이 어떤 상태인지 판단하라.

구체적인 방식은 ADX(평균방향지수)와 볼린저 밴드폭의 과거 백분위수를 평가하는 데 사용한다. ADX가 특정 임계값 이상이고 밴드폭이 지난 3개월의 상위 25% 범위에 있을 때, 이를 “추세 장세 조건"으로 표시한다. 이 시간에는 BB의 평균 회귀 논리가 꺼지거나 추세 방향의 접촉 신호만 유지된다. 밴드폭이 축소되고 ADX가 낮을 때, 그때가 BB가 완전히 작동해야 할 때다.

이 변경은 복잡하지 않지만 성과 차이는 엄청나다. 같은 2년 테스트 데이터에서 시장 상태 필터링을 추가한 후, 상승 구간의 최대 드로다운이 -28%에서 -13%로 떨어졌고, 전체 승률은 50.2%에서 59.7%로 올랐다.

비용은 거래 수량이 약 40% 감소하는 것인데, 시스템이 “이것은 BB가 작동해야 할 환경이 아니다"라고 말하는 시간이 많기 때문이다.

이 비용은 가치가 있다. 트레이딩을 하지 않는 것 자체가 전략 선택이기 때문이다.


나는 BB가 나쁜 도구라고 말하는 게 아니다. 올바른 환경에서는 정말로 효과적이다. 문제는 대부분의 사람들이 그것을 얻을 때가 가장 공격적인 추세 기간 동안 강좌를 사고 튜토리얼을 보고, 박스권 장세를 위해 설계된 도구를 추세 장세로 가져가서 전략이 작동하지 않는다고 말한다는 것이다.

진짜 문제는 도구가 아니다. 도구의 사용 조건을 명확히 하지 않는 것이다.

“백테스트 결과가 좋다"는 그 자체로는 괜찮다. 하지만 “어떤 시장 상태에서 작동했는지” 조건을 명시하지 않으면, 그 백테스트 리포트는 단지 예쁜 그림일 뿐이다.