Шрифт:
Как понять, что ваш прогноз неверен
Один из самых важных тестов любого прогноза – и я бы даже сказал, что самый важный {280} , – носит название калибровки. Насколько часто сбывались ваши прогнозы о том, что вероятность выпадения осадков составляет 40 %? Если в долгосрочной перспективе дождь действительно шел примерно в 40 % случаев, это значит, что ваши прогнозы хорошо откалиброваны. Если на самом деле дождь шел в 20 или 60 % случаев, о хорошей калибровке говорить не приходится.
280
Хотя калибровка представляет собой очень важный способ оценки прогноза, она не сможет сказать вам всего. Например, в долгосрочной перспективе в любом случайно выбранном регионе США дождь идет в среднем 20 % дней. Поэтому вы можете создать хорошо откалиброванный прогноз, просто взяв за данность, что вероятность выпадения осадков – 20 %. Однако для создания подобного прогноза не нужны никакие навыки – вы просто следуете законам климатологии. Обратным свойством калибровки выступает «дискриминация» или «разрешение», то есть показатель изменчивости прогнозов от одного случая к другому. Синоптик, часто предсказывающий нулевую или 100 %-ную вероятность дождя, покажет более высокие результаты с точки зрения дискриминации, чем человек, пытающийся нащупать какое-то значение посередине. Хорошая оценка прогнозов учитывает и первое, и второе – как индивидуально, так и в составе статистических показателей типа показателя Бриера, пытающегося учесть оба этих свойства одновременно. Причина, по которой я считаю калибровку лучшим методом прогноза, достаточно прагматична – большинство экспертов в области прогнозирования не имеет никаких проблем с использованием дискриминации. Более того, они даже ей злоупотребляют – иными словами, их прогнозы слишком самонадеянны.
Во многих областях добиться хорошей калибровки непросто. Для ее применения требуется, чтобы вы думали в понятиях вероятности, а это не очень хорошо получается у большинства из нас (включая и большинство «экспертов»-прогнозистов). По сути, такой подход предполагает борьбу с чрезмерной уверенностью в себе, которая в немалых дозах присутствует у большинства прогнозистов. Помимо этого, оценка предполагает изучение большого объема данных, то есть сотен созданных прогнозов [70] .
70
Выявить плохо откалиброванный прогноз можно значительно быстрее. Если бы вы сказали, что некое событие имеет 100 %-ный шанс сбыться, однако этого не происходит (или, наоборот, мы наблюдаем то событие, вероятность которого, по вашему мнению, лишь 0 %), нам не нужно никаких дополнительных данных, чтобы понять, что прогноз оказался неверным. – Прим. авт.
Метеорологи вполне соответствуют этому стандарту. Они ежедневно прогнозируют температуру и вероятность дождя и других осадков в сотнях городов. В течение любого года они создают десятки тысяч прогнозов.
Подобная высокая частота прогнозов невероятно полезна не только в тех случаях, когда мы хотим оценить прогноз, но также и для самих прогнозистов – они будут получать заметную обратную связь, если делают что-то не так, а следовательно, и изменить свой курс. Например, некоторым компьютерным моделям свойственно проявлять небольшое искажение {281} – они прогнозируют дождь чаще, чем тот идет на самом деле. Однако как только вам становится известно об этом искажении, вы можете его скорректировать. Аналогичным образом вы можете довольно быстро понять, что ваши прогнозы чересчур оптимистичны.
281
«Performance Characteristics and Biases of the Operational Forecast Models», National Weather Service Weather Forecast Office, Louisville, KY; National Weather Service, National Oceanic and Atmospheric Association; May 23, 2004. http://www.crh.noaa.gov/lmk/soo/docu/models.php.
Оказалось, что прогнозы Национальной службы погоды на удивление хорошо откалиброваны {282} (рис. 4.7). Когда в ее прогнозе говорится, что вероятность дождя составляет 20 %, он действительно идет в 20 % случаев. Эта служба хорошо воспользовалась обратной связью, и ее прогнозы достаточно точны и честны.
Рис. 4.7. Оценка калибровки прогнозов Национальной службы погоды – расхождение между прогнозируемым и реальным выпадением осадков
282
Sarah Lichtenstein, Baruch Fischhoff, and Lawrence D. Phillips, «Calibration of Probabilities: The State of the Art to 1980», Decision Research, Perceptronics, for Office of Naval Research, 1986. http://www.dtic.mil/cgi-bin/GetTRDoc?AD=ADA101986.
Метеорологи Weather Channel немного лукавят, но при определенных условиях. Например, исторически сложилось так, что, когда они говорят о том, что вероятность дождя – 20 %, в реальности в эти дни дождь идет лишь в 5 % случаев {283} . Это делается сознательно, и Weather Channel даже согласен это признать. Все дело в экономических стимулах.
Люди замечают один тип ошибки – неспособность предсказать дождь – значительно чаще, чем другой – ложную тревогу. Если дождь начинается, когда не должен, они проклинают синоптиков за то, что им приходится отменять пикник, а неожиданный солнечный день воспринимается ими как приятный сюрприз. С научной точки зрения это не очень хорошо, однако как призналась мне доктор Роуз из Weather Channel: «Если бы прогноз был объективным и обладал нулевым искажением с точки зрения частоты и осадков, у нас возникли бы немалые проблемы».
283
J. Eric Bickel and Seong Dae Kim, «Verification of the Weather Channel Probability of Precipitation Forecasts», American Meteorological Society 136 (December 2008): pp. 4867–4881. http://faculty.engr.utexas.edu/bickel/Papers/TWC_Calibration.pdf.
При этом Weather Channel – достаточно консервативная организация (многие зрители даже ошибочно принимают ее за правительственную), и чаще всего она умело соответствует этой роли. Прогнозируемый ею «сдвиг в сторону осадков» ограничен небольшим преувеличением вероятности дождя даже в случае, когда его возникновение почти нереально – например, они говорят о 20 %-ной вероятности, когда ее реальное значение составляет 5 или 10 %. Таким образом она пытается обезопасить себя на всякий неблагоприятный случай. Во всех остальных случаях ее прогнозы хорошо откалиброваны (рис. 4.8). Когда ее сотрудники говорят, например, о 70 %-ной вероятности дождя, этим данным можно верить.
Рис. 4.8. Оценка калибровки прогнозов Weather Channel – расхождение между прогнозируемым и реальным выпадением осадков
Но когда речь заходит о прогнозах погоды на местных телевизионных каналах, можно и голову потерять. Здесь искажение начинает проявляться в полную силу, и правильность и честность страдают сильнее всего.
Канзас-Сити можно считать отличным рынком для прогнозов погоды – тут бывает и палящее жаркое лето, и холодные зимы, торнадо и засухи, а кроме этого, он достаточно велик, и в нем ведется трансляция всех основных кабельных каналов. Житель города по имени Дж. Д. Эгглстон начал отслеживать содержание прогнозов погоды на местных каналах, желая помочь своей дочери-пятикласснице с выполнением домашнего задания. Он посчитал этот анализ крайне интересным делом и занимался им в течение семи месяцев, публикуя результаты своего исследования в блоге Freakonomics {284} .
284
J. D. Eggleston, «How Valid Are TV Weather Forecasts?» Freakonomics.com, Apr. 21, 2008. http://www.freakonomics.com/2008/04/21/how-valid-are-tv-weather-forecasts/comment-page-6/#comments.
Телевизионные синоптики обычно не уделяют особого внимания правильности. Напротив, их прогнозы были значительно хуже, чем прогнозы Национальной службы погоды, которые они могли бы бесплатно брать с сайта и транслировать в своих программах. Помимо всего прочего, они были ужасно откалиброваны. Согласно исследованию Эгглстона, в тех случаях, когда метеоролог из Канзас-Сити говорил о том, вероятность дождя составляет 100 %, обещанный дождь так и не начинался в трети случаев (рис. 4.9).