Шрифт:
Задним числом, учитывая, что меня все равно уже надули, добившись, чтобы я впустил их в дом, можно подумать, что было разумнее просто ответить на этот вопрос. Но я хочу, чтобы меня понимали всякий раз, когда я открываю рот (меня ужасает перспектива ослепить людей наукой), а этот вопрос не из тех, на которые можно ответить в двух словах. Вначале нужно разъяснить значение слова “информация” как специального термина. Далее разъяснить, как он связан с эволюцией, что тоже довольно сложно — не то чтобы трудно, но требует времени. Однако вместо того, чтобы погружаться в дальнейшие рассуждения на тему “кто виноват” и споры о том, что на самом деле случилось во время этого интервью, я сейчас попытаюсь исправить дело конструктивным способом, ответив на тот самый вопрос об информации достаточно развернуто — насколько это позволяет объем обычной статьи.
Определение слова “информация” как специального термина впервые дал американский инженер Клод Шеннон в 1948 году. В компании “Белл телефон” Шеннон занимался проблемой измерения количества информации как предмета экономического потребления. Посылать сообщения по телефонным проводам довольно дорого. Значительная часть того, что передается в этих сообщениях, не содержит информации — эта часть избыточна. Можно сэкономить деньги, записав сообщение и избавившись от этой избыточности. “Избыточность” — это еще один специальный термин, который Шеннон определил как нечто обратное информации. Оба его определения математического свойства, но интуитивный смысл того, что Шеннон имел в виду, можно передать словами [119] . Избыточность — это та часть любого сообщения, которая неинформативна потому, что она уже известна получателю (и ничуть его не удивит), либо потому, что она повторяет другие части того же сообщения. В предложении “Ровер — собака породы пудель” слова “собака” и “породы” избыточны, потому что слово “пудель” уже говорит нам, что Ровер — собака соответствующей породы. Из телеграммы эти слова можно было бы убрать для экономии, тем самым увеличив информативность сообщения. Сообщение “Приб ДжФК пт веч пжлст встр БЭ кнкрд” несет ту же информацию, что и более длинное, но более избыточное “Я прибываю в аэропорт им. Джона Ф. Кеннеди в пятницу вечером; пожалуйста, встречайте ‘Конкорд [120] компании ‘Бритиш эйрвеэйз5”. Очевидно, что послать краткий вариант, записанный в телеграфном стиле, будет дешевле (хотя получателю, возможно, и придется изрядно потрудиться, чтобы его расшифровать — у избыточности есть свои достоинства, если забыть об экономичности) . Шеннон хотел найти математический способ передать идею, что любое сообщение можно разбить на информацию, избыточность (которую можно — и экономически выгодно — исключать из сообщения, потому что получатель может при желании ее восстановить) и шумы (просто случайная белиберда).
119
Очень важно, чтобы вы не осуждали Шеннона за мой словесный и интуитивный спо
120
Артур Кларк сказал: “Есть что-то неописуемо зловещее в механизме, который не делает ничего — абсолютно ничего, — кроме того, что сам себя выключает”.
Сообщение “В Оксфорде на этой неделе ежедневно шел дождь” несет сравнительно мало информации, потому что получателя оно не удивит. С другой стороны, количество информации в сообщении “В пустыне Сахара на этой неделе ежедневно шел дождь” намного больше и вполне стоит того, чтобы подороже заплатить за его пересылку. Шеннон хотел как-то передать этот смысл количества информации как “меры удивительности”. Он связан с другим смыслом (как “того, что не продублировано в других частях сообщения”), потому что повторы теряют свою способность удивлять. Заметьте, что шенноновское определение количества информации не зависит от того, истинна ли она. Придуманная им мера информации была остроумна и интуитивно соответствовала задаче. Давайте, предложил он, оценим количество незнания или неопределенности знаний получателя до получения сообщения, а затем сравним его с количеством оставшегося незнания после получения сообщения. Сокращение количества незнания и будет количеством переданной информации. Шенноновская единица измерения информации — бит (bit), от binary digit (двоичная цифра). Один бит определяется как количество информации, необходимое, чтобы первоначальная неопределенность сократилась вдвое, как бы велика она ни была (читатели-математики заметят, что бит, таким образом, относится к логарифмическим единицам измерения).
На практике вначале нужно найти способ измерения априорной неопределенности — той, что сокращается, когда поступает информация. Для некоторых разновидностей простых сообщений это легко сделать с помощью вероятностей. Будущий отец с нетерпением наблюдает через окошко за рождением своего ребенка. Ему не видно почти ничего, поэтому одна из медсестер согласилась показать ему розовую карточку, если родится девочка, или голубую, если родится мальчик. Сколько информации передается, когда сестра показывает счастливому отцу, скажем, розовую карточку? Ответ — один бит (априорная неопределенность сократилась вдвое). Отец знает, что родился какой-то ребенок, поэтому неопределенность его знаний сводится к двум возможностям (мальчик или девочка), которые для целей этого обсуждения можно считать равновероятными. Розовая карточка вдвое сокращает априорную неопределенность от двух возможностей до одной (девочка). Если бы никакой розовой карточки не было, а из родильной комнаты вышел бы врач, пожал бы новоиспеченному отцу руку и сказал: “Поздравляю, старина, я очень рад, что мне выпала честь первым вам сообщить, — у вас родилась дочь”, то количество информации, переданной этим сообщением в семнадцать слов, составило бы по-прежнему один бит.
Компьютерная информация содержится в последовательностях нолей и единиц. Есть только два возможных варианта, поэтому 0 или 1 в каждом положении содержит один бит информации. Объем памяти компьютера или емкость диска или ленты часто измеряется в битах и представляет собой суммарное число нолей или единиц, которые это устройство может содержать. Для некоторых целей более удобной единицей измерения служит байт (восемь бит), килобайт (тысяча байт), мегабайт (миллион байт) или гигабайт (тысяча миллионов байт) [121] . Заметьте, что эти числа относятся к суммарной имеющейся емкости. Это максимальное количество информации, которую можно записать на данное устройство. Реальное количество записанной информации — это нечто иное. К примеру, емкость моего жесткого диска — 4,2 гигабайт. Из них в настоящий момент около 1,4 гигабайт реально использованы для хранения данных. Но даже это не настоящее количество информации (в шенноновском смысле слова) на моем диске. Настоящее количество информации меньше, потому что ту же информацию можно записать экономнее. Некоторое представление о настоящем количестве информации можно получить, воспользовавшись одной из замечательных программ-архиваторов вроде Stuffit. Эта программа ищет избыточность в последовательности нолей и единиц и ощутимо сокращает эту последовательность путем перекодировки, очищая ее от внутренней предсказуемости. Максимального сжатия информации можно было бы добиться (на практике это, по-видимому, невозможно), если бы каждая единица или ноль удивляли бы нас в равной степени. Прежде чем передавать большие объемы информации через интернет, ее обычно архивируют, сокращая ее избыточность [122] .
121
Эти круглые цифры — десятичные приближения. В компьютерном мире стандартные метрические приставки кило-, гига- и т. п. заимствованы для обозначения ближайшей удобной степени двойки. Поэтому килобайт — это не тысяча байт, а 210, или 1024 байт, а мегабайт — не миллион байт, а 220, или 1 048 576 байт. Если бы эволюция дала нам не десять, а восемь или шестнадцать пальцев, компьютер, быть может, изобрели бы столетием раньше. Теоретически мы могли бы теперь решить учить всех детей восьмеричной, а не десятеричной арифметике. Мне бы очень хотелось, чтобы так и попробовали сделать, но, рассуждая реалистически, я понимаю, что огромные краткосрочные затраты на этот переход перевесили бы его несомненную долгосрочную выгоду. Начать с того, что нам всем пришлось бы вновь учить таблицу умножения.
122
Одно из успешных приложений этого аспекта теории информации — идея Хораса Барлоу, что сенсорные системы устроены так, чтобы очищать свои сообщения от солидных объемов избыточности, прежде чем передавать их в мозг. Один из способов это сделать состоит в том, чтобы передавать сигналы об изменениях в окружающем мире (математики назвали бы это дифференцированием), вместо того чтобы докладывать постоянно о текущем его состоянии (что отличалось бы высокой избыточностью, потому что оно не меняется быстро и беспорядочно). Эта идея Барлоу обсуждается в моей книге “Расплетая радугу”: Dawkins, R. Unweaving the Rainbow. London, Penguin, 1998; Boston, Houghton Mifflin, 1998, pp. 257-266.
Все это хорошо с точки зрения экономики. Но с другой стороны, сохранять некоторую избыточность в сообщениях, ради исправления ошибок, тоже неплохая идея. Если в сообщении, совершенно лишенном избыточности, произошла ошибка, восстановить его исходный смысл уже никак невозможно. В машинные коды часто преднамеренно включают избыточные “биты контроля четности”, помогающие находить ошибки. У ДНК тоже есть различные механизмы исправления ошибок, основанные на избыточности. Когда я перейду к разговору о геномах, я вернусь к разнице между упомянутыми тремя понятиями: суммарной информационной емкости, реально использованной информационной емкости и настоящим количеством информации.
Открытие Шеннона состояло в том, что информацию любого рода, независимо от ее смысла, ее истинности или ложности, ее физического носителя, можно измерять в битах и переводить на любой другой носитель. Великий биолог Джон Б. С. Холдейн использовал теорию Шеннона, чтобы подсчитать число бит информации, передаваемое рабочей пчелой своим соседям по улью, когда она “танцует”, сообщая о местоположении источника пищи (около трех бит, чтобы сообщить направление на этот источник, и еще три бита, чтобы сообщить расстояние до него). В тех же самых единицах, как я недавно подсчитал, мне понадобилось бы сто двадцать мегабит машинной памяти моего лэптопа, чтобы записать торжественные вступительные аккорды симфонической поэмы Рихарда Штрауса “Так говорил Заратустра” (“тема из ‘Космической одиссеи 2001 года’”), которые я хотел проиграть в середине одной лекции об эволюции. Экономический метод Шеннона также позволяет сосчитать, сколько модемного времени потребуется, чтобы послать полный текст книги издателю в другую страну. Спустя пятьдесят лет после открытия Шеннона его идея информации как предмета потребления, такого же измеримого и взаимопревраща-емого, как деньги или энергия, окончательно вступила в свои права.
ДНК переносит информацию очень по-компьютерному, и емкость генома тоже можно, если захочется, измерять в битах. В ДНК используется не двоичный код, а четверичный. В то время как в компьютере единица информации — это 1 или 0, в ДНК это Т, А, С или G. Сколько информации будет передано от меня к вам, если я сообщу вам, что в определенном месте последовательности ДНК стоит Г? Начнем с измерения априорной неопределенности. Сколько открыто возможностей до поступления сообщения “Г”? Четыре. Сколько возможностей остается после его поступления? Одна. Стало быть, можно подумать, что было передано четыре бита информации, но на самом деле их только два. И вот почему (исходя из того, что все четыре буквы встречаются с равной вероятностью, как четыре масти в колоде карт). Вспомним, что шенноновская мера касается наиболее экономного способа передачи сообщения. Представьте ее себе как число вопросов, предполагающих ответ “да” или “нет”, которые понадобилось бы задать, чтобы свести исходную неопределенность из четырех возможностей к определенности, если предположить, что вопросы будут сформулированы самым экономным способом. “Идет ли эта таинственная буква по алфавиту перед D)?” [123] Нет. Это сводит неопределенность к вариантам Т и G, и теперь нам понадобится только один дополнительный вопрос, чтобы узнать разгадку. Итак, в соответствии с этим методом измерения, информационная емкость каждой “буквы” ДНК составляет два бита.
123
Химик скорее спросил бы: “Это производное пиримидина?” — но в моем примере такой вопрос мог бы сбить с толку. Лишь случайно получилось так, что четыре буквы алфавита ДНК оказались распределены поровну между двумя группами химических соединений, производными пурина и пиримидина.