Вход/Регистрация
Репортаж с ничейной земли. Рассказы об информации
вернуться

Седов Е. А.

Шрифт:

– А почему его считают избытком?

– Это тоже нетрудно понять. В каналах связи все буквы заменяются числами. А числа переводятся на двоичный код. Поэтому буква я будет выглядеть, как 100 ООО.

– А почему именно так?

– Разве вы не знакомы с двоичным кодом?

– Я знаком, но мне бы хотелось, чтобы наша беседа была понятна читателям.

– Хорошо, постараюсь выражаться яснее.

Буква я последняя в нашем алфавите. Ее порядковый номер - 32. 32 - это 2б, что в двоичной системе счисления обозначается как 100 000. Но это не сто тысяч! Это именно число 32, но записано оно только двумя цифрами - 0 и 1, и чтобы передать букву я, приходится потратить 6 импульсов: единицу и пять нулей7.

Когда импульсы следуют друг за другом, каждый из них несет одно из двух сообщений: 0 или 1, «да» или «нет». Значит, каждый импульс дает информацию 1 бит. И каждая буква текста при -учете законов чередования дает около 1 бита. Отсюда возникает вопрос: нельзя ли создать такой код, в котором импульсов будет не больше, чем букв?

Сортировка словесного груза

С этим новым вопросом пришлось повозиться еще несколько дней. Им занимались все члены отряда. Мы обнаружили, что существует множество различных способов, позволяющих избавить сообщения от излишеств. Мы начали с самых простых. В одном из текстов нам встретилась фраза:

Чтобы добиться спортивных успехов, необходимо непрерывно совершенствоваться, учиться у ведущих мастеров спорта, трудиться над повышением собственного мастерства, систематически тренироваться и закаляться.

Раньше мы не нашли бы в подобной фразе ничего необычного. Но теперь мы во всем находим излишки и потому прежде всего обращаем внимание на то обстоятельство, что сочетание ться повторяется в этой фразе целых шесть раз.

Если заменить все ться одним условным значком, подобно тому как это делают в стенографии, то 6 таких значков заменят целых 24 буквы, а сообщение станет короче на 18 букв. Метод этот изучается теорией информации и называется «укрупнением сигнала».

А вот пример, который встречался нам раньше. Сообщение о том, что Ботвинник играет черными, содержит в себе всего 1 бит. Но фраза Ботвинник играет черными содержит 22 буквы - целых 110 бит. Следовательно, 109 бит - это чистый избыток!

Как избавиться от «лишнего груза»?

А очень просто. Надо пользоваться специальным кодом: 0 - Ботвинник играет черными; 1 - черными играет партнер. И избытка как не бывало: вся информация уместилась теперь в одном импульсе, потому что импульс дает как раз 1 бит.

Но понять смысл таких сообщений сможет не каждый. Надо заранее знать о том, что возможны лишь два различных исхода, и каждый имеет свою вероятность: P1 - вероятность того, что Ботвинник играет черными; P2 - вероятность того, что черными играет партнер. Зная заранее, что P2 = P1 = 50 процентам, мы посылаем сигналы 0 или 1, и они дают нам как раз то количество информации, которое мы ожидаем, - 1 бит.

Для того чтобы пользоваться этим условным кодом, мы должны предварительно получить информацию о том, что он будет обозначать. Нам должно быть известно заранее, что речь пойдет о шахматном матче, а не о принятии резолюции на Ассамблее ООН. Мы должны знать, что в матче участвуют, скажем, Таль и Ботвинник, а не кто-то другой. Но все эти сведения мы должны получить однажды, а дальнейшие сообщения, вроде: Ботвинник играет черными; черными играет Таль, уточняют лишь, кто из них будет играть черными в очередной встрече, то есть дают всего 1 бит. Поэтому с точки зрения теории информации нет никакого смысла на протяжении всего матча 24 раза подряд повторять подобные фразы - ведь можно значительно уменьшить избыточность, применив специальный код.

Кстати, именно так и поступают работники телеграфа при передаче поздравительных праздничных телеграмм. Почему эти телеграммы стоят дешевле обычных? Потому что в них то и дело повторяются фразы: Поздравляю с Новым годом; Желаю успехов, здоровья, счастья... А работники связи делают просто: вместо слов поздравлений и пожеланий посылают один условный значок. Но все же указанный способ имеет лишь частное применение: он пригоден в тех случаях, когда сообщения повторяются несколько раз. А нельзя ли найти более общие методы, избавляющие от излишеств любой передаваемый текст? Оказывается, такой способ уже нашли. Специальные устройства сортируют «словесные грузы». Грузы эти сортируются не по весу, не по качеству, не по объему, а по вероятности появления букв.

Чтобы передать текст по каналу связи, надо применить какой-нибудь код. Если бы нам предложили выбрать способ кодирования, мы, очевидно, поступили бы просто: поскольку все буквы для нас равноценны, мы выписали бы подряд весь алфавит и присвоили буквам порядковые номера. Затем условились бы, что каждому номеру соответствует какая-то высота импульса: чем больше порядковый номер буквы, тем больше соответствующий импульс.

Казалось бы, именно так и следует поступить. Но если оценить этот код с точки зрения избыточности сообщений, он окажется очень невыгодным. Почему? Потому что он был составлен без учета вероятности букв. Возьмем, например, букву т. В алфавите она занимает 20-е место. Значит, если а передается каким-то маленьким импульсом, то т будет передано импульсом, в 20 раз большим. Чем больше импульс, тем больше энергии расходуется при передаче. Буква т встречается в тексте почти так же часто, как а8.

Если бы мы обозначили букву т маленьким импульсом, то сэкономили бы много энергии. Чтобы уменьшить избыточность, надо применить такой код, чтобы буквам с самой большой вероятностью соответствовал самый маленький импульс.

Если известны заранее вероятности всех букв русского текста, электронная трубка может избавить нас от дальнейших хлопот. Можно поручить ей «сортировку» любого текста.

Так же как в любой телевизионной трубке электроны, излучаемые катодом, фокусируются в узкий пучок. Проходя через щель, образованную двумя пластинами, он падает на экран. Если на верхнюю пластину подать положительный импульс, луч отклонится вверх. Мы включили это устройство в канал передачи словесного текста, каждой букве которого соответствует импульс определенной величины.

  • Читать дальше
  • 1
  • ...
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • ...

Ебукер (ebooker) – онлайн-библиотека на русском языке. Книги доступны онлайн, без утомительной регистрации. Огромный выбор и удобный дизайн, позволяющий читать без проблем. Добавляйте сайт в закладки! Все произведения загружаются пользователями: если считаете, что ваши авторские права нарушены – используйте форму обратной связи.

Полезные ссылки

  • Моя полка

Контакты

  • chitat.ebooker@gmail.com

Подпишитесь на рассылку: