Шрифт:
Если мы хотим определить приведенное параметрическое оптимальное f, нам придется преобразовать эти торговые прибыли и убытки в процентные повышения и понижения (основываясь на уравнениях с (2.10а) по (2.10в)). Затем мы преобразуем эти процентные прибыли и убытки, умножив их на текущую цену базового инструмента. Например, P&L № 1 составляет 0,18. Допустим, что цена входа в эту сделку была 100,50. Таким образом, процентное повышение по этой сделке будет 0,18/100,50 = 0,001791044776. Теперь предположим, что текущая цена базового инструмента составляет 112,00. Умножив 0,001791044776 на 112,00, мы получаем приведенное P&L = 0,2005970149. Чтобы получить полные приведенные данные, необходимо проделать эту процедуру для всех 232 торговых прибылей и убытков.
Независимо от того, будем мы проводить расчеты, используя приведенные данные, или нет (в этой главе мы не будем использовать приведенные данные), мы все равно должны рассчитать среднее (арифметическое) и стандартное отклонение совокупности этих 232 торговых прибылей и убытков. В нашем случае это 0,330129 и 1,743232 соответственно (если бы мы проводили операции на приведенной основе, нам бы понадобилось определять среднее и стандартное отклонение по приведенным торговым P&L). Теперь мы можем использовать уравнение (3.16), чтобы преобразовать каждую отдельную торговую прибыль и убыток в стандартные единицы.
(3.16) Z=(X-U)/S,
где U = среднее значение данных;
S = стандартное отклонение данных;
Х = наблюдаемая точка данных.
Для сделки № 1 преобразуем прибыль 0,18 в стандартные единицы:
Z= (0,18-0,330129)/1,743232 =-0,150129/1,743232 =-0,08612106708
Таким же образом следующие три сделки -1,11; 0,42 и -0,83 преобразовываются в -0,8261258398; 0,05155423948 и -0,6655046488 стандартных единицы. После того, как мы преобразуем все торговые прибыли и убытки в стандартные единицы, можно собрать в ячейки теперь уже нормированные данные. Вспомните, что при наличии ячеек теряется часть информации о распределении (в нашем случае о распределении отдельных сделок), но характер распределения остается тем же. Допустим, мы помещаем эти 232 сделки в 10 ячеек. Количество ячеек выбрано произвольно — мы могли бы выбрать 9 или 50 ячеек.
Рисунок 3-16 232 сделки в 10 ячейках от -2 до +2 сигмы и нормальное распределение
Когда мы размещаем данные в ячейки, то должны выбрать интервал значений, в котором расположены ячейки. Мы выберем интервал от -2 до +2 сигмы. Это означает, что у нас будет 10 одинаковых ячеек между -2 стандартными единицами и +2 стандартными единицами. Так как между -2 и +2 4 стандартных единицы и мы делим этот диапазон на 10 равных частей, то получаем 4 / 10 = 0,4 стандартных единицы в качестве размера или «ширины» каждой ячейки. Поэтому наша первая ячейка будет содержать те сделки, которые были в диапазоне от -2 до -1,6 стандартных единиц, следующая ячейка будет содержать сделки от-1,6 до-1,2, затем от -1,2 до -0,8, и так далее, пока последняя ячейка не вместит сделки между 1,6 и 2 стандартными единицами. В нашем случае те сделки, которые менее –2 стандартных единиц или больше +2 стандартных единиц, не будут размещены в ячейки, и мы их проигнорируем. Если бы мы пожелали, то включили бы их в крайние ячейки, разместив точки данных менее -2 в ячейку от -2 до -1,6, и таким же образом поступили бы в отношении тех точек данных, которые больше 2. Конечно, мы могли бы выбрать более широкий диапазон, но эти сделки находятся за пределами выбранных ячеек, и мы их не учитываем. Другими словами, мы не рассматриваем сделки, P&L в которых меньше, чем 0,330129 - (1,743232 * 2) = = -3,1563, или больше, чем 0,330129 + (1,743232 * 2) = 3,816593. Мы сейчас создали распределение торговых P&L системы. Распределение содержит 10 точек данных, так как мы решили работать с 10 ячейками. Каждая точка данных отражает число сделок, которые попадают в эту ячейку Каждая сделка не может попасть более чем в 1 ячейку и если сделка находится за пределами 2 стандартных единиц с любой стороны среднего (P&L < -3,156335 или > 3,816593), тогда она не будет представлена в этом распределении. Рисунок 3-16 показывает распределение, которое мы только что рассчитали. Может показаться, что распределение P&L торговой системы должно всегда быть смещено вправо за счет больших выигрышей. Наше распределение 232 торговых P&L представляет систему, которая в основном приносит небольшие прибыли. Многие трейдеры имеют ошибочное мнение, что распределение P&L должно быть смещено вправо для всех торговых систем. Это не всегда верно, что и подтверждает рисунок 3-16. Разные рыночные системы имеют различные распределения, и вам не следует ожидать, что все они будут одинаковыми. Также на рисунке 3-16 показано нормальное распределение для 232 торговых P&L, если бы они были нормально распределены. Это было сделано для того, чтобы вы могли графически сравнить торговые P&L для полученного и нормального распределения. Сначала нормальное распределение рассчитывается для границ каждой ячейки. Для самой левой ячейки это Z =-2 и Z=-1,6. Теперь подставим полученные значения Z в уравнение (3.21), чтобы рассчитать вероятность. В нашем примере это соответствует 0,02275 для Z = -2 и 0,05479932 для Z = -1,6. Затем возьмем абсолютное значение разности этих двух значений, которое в нашем примере будет ABS(0,02275 - 0,05479932) = = 0,03204932. Затем умножим полученный ответ на количество точек данных, то есть на 232 (мы все еще должны использовать 232 сделки, хотя некоторые исключаются, так как находятся вне диапазона выбранных ячеек). Таким образом, если бы данные были нормально распределены и размещены в 10 ячеек равной ширины между -2 и +2 сигма, тогда самая левая ячейка содержала бы 0,03204932 * 232 = 7,43544224 элемента. Если сделать расчет для каждой из 10 ячеек, мы получим нормальную кривую, показанную на рисунке 3-16.
Поиск оптимального f пo нормальному распределению
Сейчас мы разработаем метод поиска оптимального f по нормально распределенным данным. Как и формула Келли, это способ относится к параметрическим методам. Однако он намного мощнее, так как формула Келли отражает только два возможных результата события, а этот метод позволяет получить полный спектр результатов (при условии, что результаты нормально распределены). Удобство нормально распределенных результатов (кроме того факта, что в реальности они часто являются пределом многих других распределений) состоит в том, что их можно описать двумя параметрами. Формулы Келли дадут вам оптимальное f для бернуллиевых результатов, если известны два параметра: отношение выигрыша к проигрышу и вероятность выигрыша. Метод расчета оптимального f, о котором мы сейчас расскажем, также требует только два параметра — среднее значение и стандартное отклонение результатов. Вспомним, что нормальное распределение является непрерывным распределением. Для того, чтобы использовать этот метод, необходимо дискретное распределение. Далее вспомним, что нормальное распределение является неограниченным распределением. Первые два шага, которые мы должны сделать для нахождения оптимального f по нормально распределенным данным, — это определить, (1) на сколько сигма от среднего значения мы усекаем распределение и (2) на сколько равноотстоящих точек данных мы разделим интервал между двумя крайними точками, найденными в (1). Например, мы знаем, что 99,73% всех точек данных находятся между плюс и минус 3 сигма от среднего, поэтому можно использовать 3 сигма в качестве параметра для (1). Другими словами, мы рассматриваем нормальное распределение только между минус 3 сигма и плюс 3 сигма от среднего значения. Таким образом, мы охватываем 99,73% всей активности в пределах нормального распределения. Вообще, для этого параметра лучше использовать значение от 3 до 5 сигма. Что касается числа равноотстоящих точек данных (шаг 2), мы будем использовать число, как минимум, в десять раз большее количества стандартных отклонений, которое используется в (1). Если мы выберем 3 сигма для (1), тогда возьмем, по крайней мере, 30 равноотстоящих точек данных для (2). Это означает, что на горизонтальной оси следует отметить отрезок от минус 3 сигма до плюс 3 сигма и нанести на нем 30 равноотстоящих точек. Так как между минус 3 сигма и плюс 3 сигма находится 6 сигма и нам надо разместить на этом отрезке 30 равноотстоящих точек, мы должны разделить 6 на 30 - 1, или 29. Это даст нам 0,2068965517. Первой точкой данных будет минус 3. Затем мы будем добавлять 0,2068965517 к каждой предыдущей точке, пока не достигнем плюс 3. И так нанесем 30 равноотстоящих точек данных между минус 3 и плюс 3. Нашей второй точкой данных будет -3 + 0,2068965517 =-2,793103448, третьей точкой данных будет 2,79310344 + 0,2068965517 = -2,586206896, и так далее. Таким образом, мы зададим 30 точек на горизонтальной оси. Чем больше точек данных вы используете, тем лучше будет разрешение нормальной кривой. Использование количества точек в десять раз больше числа стандартных отклонений не является строгим правилом определения минимального числа точек данных. Нормальное распределение является непрерывным распределением. Однако мы должны сделать его дискретным, чтобы по нему найти оптимальное f. Чем большее число равноотстоящих точек данных мы используем, тем ближе наша дискретная модель будет к реальному непрерывному распределению. Почему не следует использовать слишком большое число точек данных? Чем больше точек данных вы будете использовать в нормальной кривой, тем больше времени понадобится для поиска оптимального f. Даже если вы будете использовать компьютер для поиска оптимального f, при большом количестве точек данных расчет займет достаточно много времени. Более того, каждая дополнительная точка данных увеличивает разрешение в меньшей степени, чем предыдущая точка. Мы будем называть описанные выше два вводных параметра ограничивающими параметрами (bounding parameters). Третий и четвертый шаги позволят определить среднюю арифметическую сделку и стандартное отклонение для рыночной системы, с которой вы работаете. Если у вас нет механической системы, можно получить эти числа из брокерских отчетов. Один из реальных плюсов рассматриваемого метода состоит в том, что для его использования не обязательно работать по механической системе, вам даже не нужны брокерские отчеты или торговые результаты в бумажной форме. Метод можно использовать, рассчитав два вводных параметра: среднюю арифметическую сделку (в пунктах или долларах) и стандартное отклонение сделок (в пунктах или долларах, в зависимости от того, что вы используете для средней арифметической сделки). Если стандартное отклонение сложно рассчитать, тогда просто попытайтесь понять, насколько, в среднем, сделка будет отличаться от средней сделки. Рассчитав среднее абсолютное отклонение, вы можете использовать уравнение (3.18) для преобразования оценочного среднего абсолютного отклонения в оценочное стандартное отклонение:
(3.18) S=M* 1/0,7978845609
=М* 1,253314137,
где S = стандартное отклонение;
М = среднее абсолютное отклонение.
Эти два параметра, среднее арифметическое средней сделки и стандартное отклонение сделок, мы будем называть действительными вводными параметрами. Теперь нам надо взять все равноотстоящие точки данных из шага (2) и найти их соответствующие ценовые значения, основываясь на среднем арифметическом значении и стандартном отклонении. Вспомним, что наши равноотстоящие точки данных выражены в стандартных единицах. Теперь для каждой из этих равноотстоящих точек данных мы найдем соответствующую цену:
(3.27) D = U + (S * Е),
где D = ценовое значение, соответствующее значению стандартной единицы;
Е = значение стандартной единицы;
S = стандартное отклонение;
U= среднее арифметическое.
После того как мы определили все ценовые значения, соответствующие каждой точке данных, мы можем сказать, что сконструировали распределение, к которому, как ожидается, будут стремиться точки данных.
Однако данный метод позволяет сделать намного больше. Мы можем включить два дополнительных параметра, которые позволят нам рассмотреть типы сценариев «что если». Эти параметры, которые мы назовем параметрами «что если», позволяют увидеть влияние изменения нашей средней сделки, или изменения дисперсии (стандартного отклонения) сделок.
Первый из этих параметров, называемый сжатием (shrink), затрагивает среднюю сделку. Сжатие — это просто множитель нашей средней сделки. Вспомните, что когда мы находим оптимальное f, то попутно получаем другие величины, которые являются полезными побочными продуктами оптимального f. Такие расчеты включают среднее геометрическое, TWR и среднюю геометрическую сделку. Сжатие является величиной, на которую мы умножаем среднюю сделку еще до того, как осуществляем поиск оптимального f. Следовательно, сжатие позволяет нам рассчитать оптимальное f для того случая, когда средняя сделка затронута сжатием, а также рассчитать новые побочные продукты. Предположим, вы торгуете в системе, которая в последнее время работала очень эффективно. Вы знаете, что рано или поздно система прекратит работать так же успешно, поэтому хотите знать, что произойдет, если средняя сделка будет уменьшена наполовину. Используя значение сжатия 0,5 (так как сжатие является множителем, то средняя сделка, умноженная на 0,5, будет равна половине средней сделки), вы можете найти оптимальное f, когда средняя сделка уменьшается наполовину. Вы сможете увидеть, как такие изменения затрагивают геометрическую среднюю сделку и другие величины. Используя значение сжатия 2, вы также сможете увидеть последствия удвоения средней сделки. Другими словами, параметр сжатия может также использоваться для увеличения вашей средней сделки. Более того, он позволяет вам взять неприбыльную систему (то есть систему со средней сделкой меньше нуля) и, используя отрицательное значение сжатия, посмотреть, что произойдет, если эта система станет прибыльной. Допустим, у вас есть система, которая показывает среднюю сделку -100 долларов. Если вы будете использовать значение сжатия -0,5, то получите оптимальное f для этого распределения со средней сделкой 50 долларов, так как -100 * * -0,5 = 50. Если бы мы использовали фактор сжатия -2, то получили бы распределение со средней сделкой 200 долларов. Следует крайне аккуратно использовать параметры «что если», так как они легко могут привести к неправильным результатам. Уже было упомянуто, что вы можете превратить систему с отрицательной арифметической средней сделкой в прибыльную систему. Это может привести к проблемам, если, например, в будущем, у вас по-прежнему будет отрицательное ожидание. Другой параметр «что если» называется растяжением (stretch), но он не противоположен сжатию, как можно было бы подумать. Растяжение является множителем стандартного отклонения. Вы можете использовать этот параметр для определения влияния разброса на f и его побочные продукты. Растяжение всегда должно быть положительным числом, в то время как сжатие может быть положительным или отрицательным (пока средняя сделка, умноженная на сжатие, имеет положительное значение). Если вы хотите увидеть, что произойдет, когда ваше стандартное отклонение удвоится, просто используйте значение 2 для растяжения. Чтобы увидеть, что произойдет, если разброс уменьшится, используйте значение меньше 1.При использовании этого метода вы заметите, что, когда растяжение стремится к нулю, значения побочных продуктов увеличиваются, и, в результате, вы получаете более оптимистичную оценку будущего, и наоборот. Сжатие работает противоположным образом, так как при сжатии, стремящемся к нулю, мы получаем более пессимистичные оценки будущего, и наоборот. После того как мы зададим значения, которые будем использовать для растяжения и сжатия (сейчас и для одного, и для другого мы будем использовать единицу, то есть оставим действительные параметры без изменения), можно изменить уравнение (3.27):