Вход/Регистрация
Математика управления капиталом. Методы анализа риска для трейдеров и портфельных менеджеров
вернуться

РАЛЬФ ВИНС РАЛЬФ

Шрифт:

Нормальное распределение

Часто нормальное распределение называют распределением Гаусса, или Муавра, в честь тех, кто, как считается, открыл его — Карл Фридрих Гаусс (1777-1855) и, веком ранее, что не так достоверно, Авраам де Муавр (1667-1754). Нормальное распределение считается наиболее ценным распределением, благо­даря тому, что точно моделирует многие явления. Давайте рассмотрим приспособление, более известное как доска Галтона (ри­сунок 3-5). Это вертикально установленная доска в форме равнобедренного треу­гольника. В доске расположены колышки, один в верхнем ряду, два во втором, и так далее. Каждый последующий ряд имеет на один колышек больше. Колышки в сечении треугольные, так что, когда падает шарик, у него есть вероятность 50/50 пойти вправо или влево. В основании доски находится серия желобов для подсче­та попаданий каждого броска.

Рисунок 3-5 Доска Галтона

Шарики, падающие через доску Галтона и достигающие желобов, начинают фор­мировать нормальное распределение. Чем «глубже» доска (то есть чем больше ря­дов она имеет) и чем больше шариков бросается, тем ближе конечный результат будет напоминать нормальное распределение.

Нормальное распределение интересно еще и потому, что оно является пре­дельной формой многих других типов распределений. Например, если Х распре­делено биномиально, а N стремится к бесконечности, то Х стремится к нор­мальному распределению. Более того, нормальное распределение также является предельной формой многих других ценных распределений вероятности, таких как Пуассона, Стьюдента (или t-распределения). Другими словами, когда коли­чество данных (N), используемое в этих распределениях, увеличивается, они все более напоминают нормальное распределение.

Центральная предельная теорема

Одно из наиболее важных применений нормального распределения относится к распределению средних значений. Средние значения выборок заданного разме­ра, взятые таким образом, что каждый элемент выборки отобран независимо от других, дадут распределение, которое близко к нормальному Это чрезвычайно важный факт, так как он означает, что вы можете получить параметры действи­тельно случайного процесса из средних значений, рассчитанных на основе выбо­рочных данных.

Рисунок 3-6 Экспоненциальное распределение и нормальное распределение

Таким образом, мы можем сформулировать, что если N случайных выборок извлека­ются из совокупности всех данных, тогда суммы (или средние значения) выборок бу­дут приблизительно нормально распределяться независимо от распределения сово­купности, из которой взяты эти выборки. Близость к нормальному распределению увеличивается, когда N (число выборок) возрастает. В качестве примера рассмот­рим распределение чисел от 1 до 100. Это равномерное распределение, где все эле­менты (в данном случае числа) встречаются только раз. Например, число 82 встречается один раз, так же как и 19, и так далее. Возьмем выборку из пяти эле­ментов и среднее значение этих пяти элементов (мы можем также взять их сумму). Теперь поместим полученные пять элементов обратно, возьмем другую выборку и рассчитаем среднее. Если мы будем продолжать этот процесс дальше, то увидим, что полученные средние нормально распределяются, даже если совокупность, из которой они взяты, распределена равномерно.

Все вышесказанное верно независимо от того, как распределена совокупность данных! Центральная предельная теорема позволяет нам обращаться с распреде­лением средних значений выборок, как с нормальным, без необходимости знать распределение совокупности. Это чрезвычайно удобный факт для многих облас­тей исследований. Если совокупность нормально распределена, то распределение средних значений выборок будет точно (а не приблизительно) нормальным. Кроме того, скорость, с которой распределение средних значений выборок прибли­жается к нормальному при повышении N, зависит от того, насколько близко со­вокупность находится к нормальному распределению. Общее практическое пра­вило следующее: если совокупность имеет унимодальное (одновершинное) распре­деление (любой тип распределения, где есть концентрация частоты вокруг одной моды и уменьшение частот с любой стороны моды, например, выпуклость) или равномерно распределяется, то можно использовать N = 20 (это считается доста­точным) и N = 10 (это считается достаточным с большой вероятностью). Однако если совокупность распределена экспоненциально (рисунок 3-6), тогда может потребоваться и N = 100.

Центральная предельная теорема, этот поразительно простой и красивый факт, подтверждает важность нормального распределения.

Работа с нормальным распределением

При использовании нормального распределения часто требуется найти долю площади под кривой распределения в данной точке на кривой. На математичес­ком языке это называется интегралом функции, задающей кривую. Таким же об­разом функция, которая задает кривую, является производной площади под кри­вой. Если у нас есть функция N(X), которая представляет процент площади под кривой в точке X, мы можем говорить, что производная этой функции N'(X) явля­ется функцией самой кривой в точке X.

Мы начнем с формулы самой кривой N' (X). Данная функция выглядит следу­ющим образом:

где U = среднее значение данных;

S =стандартное отклонение данных;

Х = наблюдаемая точка данных;

ЕХР = экспоненциальная функция.

Эта формула даст нам значение для оси Y, или высоту кривой, при любом данном значении X.

Часто мы будем говорить о точке на кривой, ссылаясь на ее координату X, и бу­дем смотреть, на сколько стандартных отклонений она удалена от среднего. Таким образом, точка данных, которая удалена на одно стандартное отклонение от средне­го, считается смещенной на одну стандартную единицу (standard units) от среднего.

Рисунок 3- 7 Функция плотности нормального распределения вероятности

Более того, часто имеет смысл из всех точек данных вычесть среднее. При этом центр распределения сместится в начало координат. В этом случае точка данных, которая смещена на одно стандартное отклонение вправо от среднего, имеет зна­чение 1 на оси X.

Если мы вычтем среднее из точек данных, а затем разделим полученные значе­ния на стандартное отклонение точек данных, то преобразуем распределение в нормированное нормальное (standardized normal). Это нормальное распределение со средним, равным 0, и дисперсией, равной 1. Теперь N'(Z) даст нам значение на оси Y (высота кривой) для любого значения Z:

  • Читать дальше
  • 1
  • ...
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37
  • 38
  • ...

Ебукер (ebooker) – онлайн-библиотека на русском языке. Книги доступны онлайн, без утомительной регистрации. Огромный выбор и удобный дизайн, позволяющий читать без проблем. Добавляйте сайт в закладки! Все произведения загружаются пользователями: если считаете, что ваши авторские права нарушены – используйте форму обратной связи.

Полезные ссылки

  • Моя полка

Контакты

  • chitat.ebooker@gmail.com

Подпишитесь на рассылку: