Шрифт:
Согласно первым отзывам, читателям понравилось школьное приложение. Информация, которую мы получили в ходе обратной связи, носила и носит, в основном, позитивный характер (или, по крайней мере, конструктивный!), а количество просмотров страниц – зашкаливает просто выше крыши. В качестве бонуса стоит отметить то, что эти данные будут оставаться представляющими интерес целый год, так что хотя мы и ожидаем падения числа «хитов» на школьных сюжетах по мере того, как они будут исчезать с главной страницы, наш прошлый опыт показывает, что читатели возвращались к этому приложению в течение всего года.
Вот несколько ключевых идей, которые мы извлекли из этого проекта:
Графический отдел – ваш друг. У них хорошо получается делать сложную информацию удобоваримой и доступной для понимания.
Просите помощь ньюсрума, помощь всей редакции. Это уже второй проект, для которого мы проводим исследования и интервью в рамках всего ньюсрума, это отличный способ собрать мнения думающих людей, которые, как и наша аудитория, очень сильно различаются по своим исходным данным, по уровню и типу образования, и т.п., и обычно далеко не «на ты» с компьютером.
Показывайте вашу работу! Большую часть ответной реакции для нас составили запросы на данные, а не на приложение. Мы сделали большую часть данных публично доступными через прикладной программный интерфейс, и вскоре мы выпустим материал, который изначально вообще не планировали включать в проект.
— Брайан Бойер, Chicago Tribune
Выставление счетов в больницах
Рис 44. Kwashiorkor(California Watch)
Журналисты, занимающиеся расследовательской журналистикой в CaliforniaWatch, получили сведения о том, что крупная сеть больниц в Калифорнии, возможно, систематически обманывает федеральную программу Medicare, которая оплачивает медицинское лечение американцев в возрасте 65 лет и старше. Конкретно в том случае, о котором шла речь, говорилось о предполагаемой схеме под названием «завышение, проставление преувеличенных кодов», что означало, что в федеральную программу сообщалось, что у пациентов более серьезные случаи, и нужно более серьезное лечение, требующее более высокой материальной компенсации, чем это было на самом деле. Но главным источником этой информации был профсоюз, который боролся с руководством этой сети клиник, и команда CaliforniaWatch знала, что для того, чтобы сюжет вызывал доверие, необходимо независимое подтверждение информации из иных источников.
К счастью, у департамента здравоохранения Калифорнии были публично доступные записи, которые давали очень подробную информацию о каждом случае лечения во всех государственных больницах. Выборка из 128 случаев содержала 25 вариантов кодов диагноза из руководства под названием «Международная статистическая классификация болезней и проблем, связанных со здоровьем», известного также как ICD–9, который издает Всемирная организация здравоохранения (ВОЗ). И хотя пациентов в этих данных не указывали по имени, можно было узнать много косвенных данных, в том числе возраст пациента, как оплачивалось лечение и в какой конкретно больнице его или ее лечили. Журналисты поняли, что имея эти записи, они могут узнать, сообщали ли больницы, принадлежащие к вышеозначенной сети больниц, о случаях определенных заболеваний или диагнозах, значительно чаще, чем другие лечебные учреждения.
Объемы данных были большими; примерно по 4 миллиона записей в год, а журналисты хотели изучить и проанализировать временной период в 6 лет, чтобы увидеть, как ситуация менялась со временем (если менялась). Они затребовали данные у федеральной службы; данные поступили на СD, которые потом были легко скопированы в настольный компьютер. Журналист, который делал фактический анализ данных, воспользовался для работы с информацией системой под названием SASSAS – это очень мощный инструмент, позволяющий анализировать миллионы записей), он используется многими правительственными учреждениями, включая калифорнийский департамент здравоохранения, но этот инструмент дорог – такого же рода анализ можно было бы сделать при помощи любого другого инструмента по работе с базами данных, типа Microsoft Access или бесплатного MySQL.
Имея на руках данные, и программы, написанные для их изучения, мы могли легко начать искать похожие случаи. Например, в качестве одного из выдвинутых обвинений фигурировало то, что больницы сети сообщали о случаях выявления разной степени недоедания или неполноценного питания гораздо чаще, чем другие больницы. Используя SAS, специалист, занимавшийся анализом данных, извлек таблицы сравнения частоты встречаемости, которые показали, что в среднем в год каждая из калифорнийских больниц неотложной помощи и интенсивной терапии сообщала о более чем трехстах случаях недоедания или истощения. Таблицы частоты встречаемости были импортированы в Microsoft Excel для более пристального изучения записей по каждой из больниц; тут очень помогло умение Excel отсортировывать, фильтровать и считать исходные данные, что позволило легко обработать все данные.
Особенно бросались в глаза сообщения о состоянии пациентов, известном как квашиоркор (маразматический квашиоркор или детская пеллагра), синдром белковой недостаточности, который встречается практически исключительно у голодающих детей младшего возраста в охваченных проблемой голода развивающихся странах. А больницы из указанной сети сообщали о случаях диагностирования квашиоркора у пожилых калифорнийцев примерно в 70 раз чаще, чем в среднем все больницы штата.
По другим случаям мы использовали аналогичную технику анализа для изучения случаев сообщения о диагнозахтипа общей гнойной инфекции, энцефалопатии, злокачественной гипертензии и нарушения работы автономных нервных волокон. И в рамках еще одного анализа мы изучили обвинения в том, что больницы сети переводили необычайно высокий процент пациентов, обслуживавшихся по Medicare, из палат отделения интенсивной терапии в стационары – учитывая, что источники финансирования таких пациентов для больницы были более надежными, чем источники финансирования других больных, лежавших в интенсивной терапии.