Вход/Регистрация
Сигнал и шум. Почему одни прогнозы сбываются, а другие - нет
вернуться

Сильвер Нейт

Шрифт:

Когда мы не знаем об истинной связи или не хотим об этом знать, у нас появляется множество причин, по которым мы будем склоняться к оверфиттингу. Одна из них состоит в том, что модель с оверфиттингом будет лучше соответствовать результатам большинства статистических тестов, используемых прогнозистами. Например, довольно часто встречается тест, который оценивает разброс данных в модели. Судя по его результатам, модель с оверфиттингом (см. рис. 5.5в) позволяет объяснить 85 % дисперсии. И благодаря этому она выглядит «лучше», чем модель с хорошей степенью подгонки (см. рис. 5.5б), объясняющая лишь 56 %. Однако, по сути, модель с оверфиттингом обеспечивает такие высокие результаты за счет своеобразного обмана – она скорее принимает во внимание шум, а не сигнал. То есть на самом деле она обладает меньшей степенью достоверности при объяснении событий в реальном мире {355} .

355

Например, если вы примените кривую с оверфиттингом для данных за пределами выборки, обозначенных кругами на рис. 5.4, то сможете объяснить всего лишь около 40 % расхождений. Это существенное отклонение между данными в пределах выборки и за ее пределами представляет собой одну из основных характеристик модели с оверфиттингом.

Рис. 5.5 в. Модель с оверфиттингом

Несмотря на всю очевидность приведенного выше объяснения, многие прогнозисты полностью игнорируют эту проблему. Значительное количество статистических методов, имеющихся в распоряжении исследователей, позволяет им вести себя подобно ребенку, пытающемуся увидеть в формах облаков изображения зверей (это занятие, безусловно, очень интересное, но совершенно ненаучное) [80] . Математик Джон фон Нейман говорил об этой проблеме так: «Кривую с четырьмя параметрами я могу подогнать под слона, а с пятью – я заставлю слона махать хоботом» {356} .

80

Если вы введете в компьютер случайную последовательность единиц и нулей, обозначающих орлы и решки при бросании монетки, а затем проведете тестирование статистических параметров для выявления закономерностей и построения модели, то в какой-то момент вам может показаться, что вы способны предсказать 60–70 % или даже 100 % результатов бросков (при включении достаточного количества переменных). Разумеется, это ошибка. В долгосрочной перспективе модель позволит предсказывать ровно 50 % бросков монеты, не больше и не меньше. – Прим. авт.

356

Freeman Dyson, «Turning Points: A Meeting with Enrico Fermi», Nature 427 (January 22, 2004). http://www.nature.com/nature/journal/v427/n6972/full/427297a.html.

Оверфиттинг представляет собой двойную проблему: он помогает нашей модели лучше выглядеть на бумаге, однако в действительности показывать худшие результаты. И из-за второй проблемы модель с оверфиттингом, применяемая для создания реальных прогнозов, в какой-то момент сильно нас подведет. А первая проблема будет создавать для нашей модели слишком впечатляющий образ (опять же до поры). Она будет считаться очень точной и заслуживающей доверия, подлинным шагом вперед по сравнению с прежними техниками. Это даст возможность опубликовать ее в научных изданиях, вытеснив с рынка другие модели, показывающие более честную картину. Но если модель включает в себя шум, у нее есть немалый потенциал для того, чтобы повредить научным результатам.

Как вы, возможно, уже догадались, модель прогнозирования землетрясений Кейлиса-Борока обладала огромным оверфиттингом. В ней использовался невероятно сложный набор уравнений, примененных к данным с большой долей шумов. За это пришлось заплатить свою цену – из 23 прогнозов, сделанных на ее основе, лишь три оказались верными. Дэвид Боумэн признал, что в созданной им модели имелись аналогичные проблемы, и вовремя перестал над ней работать.

Должен сразу сказать, что эти ошибки, как правило, представляют собой вполне искренние заблуждения. Если воспользоваться названием другой книги, то они отражают нашу склонность быть одураченными случайностью [81] . Особенности нашей модели могут казаться нам вполне объяснимыми и допустимыми. Мы даже можем, в полной мере этого не осознавая, работать в обратном направлении и создавать убедительно звучащие теории, позволяющие рационализировать нашу точку зрения и тем самым дурачить и самих себя, и своих друзей с коллегами. Майкл Бабяк, много писавший об этой проблеме {357} , характеризует дилемму следующим образом: «В научной работе мы стараемся выстроить баланс между любопытством и скепсисом».

81

Имеется в виду книга Н. Н. Талеба «Одураченные случайностью» (Fooled by Randomness: The Hidden Role of Chance in Life and in the Markets) о том, как случайные события многие ошибочно считают или преподносят как закономерность или умение. Эту книгу журнал Fortune назвал одной из 75 самых умных книг всех времен.

357

Michael A. Babyak, «What You See May Not Be What You Get: A Brief, Nontechnical Introduction to Overfitting in Regression-Type Models», Psychosomatic Medicine 66 (February 19, 2004). http://www.ncbi.nlm.nih.gov/pubmed/15184705.

И любопытство часто берет над нами верх.

Применялась ли в Японии модель с оверфиттингом?

Наша склонность ошибочно принимать шум за сигнал способна время от времени приводить к вполне печальным последствиям в реальной жизни. Япония, несмотря на высокую степень сейсмической активности в регионе, оказалась практически неготовой к разрушительному землетрясению 2011 г. Ядерный реактор в Фукусиме был способен выдержать землетрясения магнитудой до 8,6 балла {358} , но никак не 9,1 балла. Археологические находки позволяют предположить, что в прежние времена высота цунами могла достигать 40 м {359} (что и произошло после землетрясения 2011 г.), однако эти случаи были, по всей видимости, забыты или проигнорированы.

358

M. Ragheb, «Fukushima Earthquake and Tsunami Station Blackout Accident». http://www.ewp.rpi.edu/hartford/~ernesto/F2011/EP/MaterialsforStudents/Petty/Ragheb2011.PDF.

359

Martin Fackler, «Tsunami Warnings, Written in Stone», New York Times, April 20, 2011. http://www.nytimes.com/2011/04/21/world/asia/21stones.html?pagewanted=all.

Землетрясения магнитудой 9,1 балла происходят в мире в высшей степени редко – никто не может предсказать такое сильное землетрясение с точностью до десятилетия, не говоря уже о конкретной дате. Однако если говорить о Японии, то некоторые ученые и специалисты по широкомасштабному планированию предпочли полностью проигнорировать такую возможность, что может свидетельствовать о присутствии оверфиттинга.

На рис. 5.6a представлено соотношение частоты повторения исторически достоверных землетрясений и их магнитуд с эпицентром в Японии {360} . При построении графика учитывались все данные, за исключением землетрясения магнитудой 9,1 балла, произошедшего 11 марта. Как видно из рисунка, они образуют практически линейную группу; именно такое соотношение и следует из расчетов по методу Гутенберга и Рихтера. Однако при значении магнитуды около 7,5 балла на графике возникает перегиб. С 1964 г. в регионе не было землетрясений магнитудой более 8 баллов, и поэтому изменение наклона кривой кажется вполне оправданным.

360

В области размером в 1° широты на 1° долготы, в центре которой находится точка с координатами 38,32° северной широты и 142,37° восточной долготы.

Рис. 5.6а. Соотношение между средней годовой частотой землетрясений и их магнитудами; Япония (регион Тохоку), период с 1 января 1964 г. по 10 марта 2011 г.

Каким же образом соединять точки? Если вы решите следовать методу Гутенберга – Рихтера, игнорируя перегиб на графике, то у вас получится прямая линия, как приведено на рис. 5.6б. Но можно использовать и метод, который сейсмологи называют характеристическим соответствием (characteristic fit) (рис. 5.6в). Этот метод предполагает, что исторически достоверные данные о частоте повторения землетрясений в этой области могут в полной мере использоваться для создания объективной картины. В конкретном случае это может означать, что вы посчитали перегиб в имеющихся исторических данных реальным. Иными словами, предположили наличие какой-то веской причины, по которой землетрясения магнитудой выше 7,6 балла в этом регионе маловероятны.

Рис. 5.6б. Соотношение между средней годовой частотой землетрясений и их магнитудами; метод Гутенберга – Рихтера; Япония (регион Тохоку), период с 1 января 1964 г. по 10 марта 2011 г.

Рис. 5.6 в. Соотношение между средней годовой частотой землетрясений и их магнитудами; метод характеристического соответствия; Япония (регион Тохоку), период с 1 января 1964 г. по 10 марта 2011 г.

  • Читать дальше
  • 1
  • ...
  • 58
  • 59
  • 60
  • 61
  • 62
  • 63
  • 64
  • 65
  • 66
  • 67
  • 68
  • ...

Ебукер (ebooker) – онлайн-библиотека на русском языке. Книги доступны онлайн, без утомительной регистрации. Огромный выбор и удобный дизайн, позволяющий читать без проблем. Добавляйте сайт в закладки! Все произведения загружаются пользователями: если считаете, что ваши авторские права нарушены – используйте форму обратной связи.

Полезные ссылки

  • Моя полка

Контакты

  • chitat.ebooker@gmail.com

Подпишитесь на рассылку: