Шрифт:
Поэтому определение «электронная книга», должно звучать так: «Текст (возможно иллюстрированный), в цифровом формате, специально подготовленный для чтения».
Чтобы оценить преимущества и недостатки того или иного формата, необходимо сформулировать свод требований к электронным книгам.
Читабельность. Легкость и удобство чтения текста. Поскольку это обеспечивают программные и аппаратные средства для чтения, от самого формата требуются несколько иные качества, а именно два нижеследующих:
Полиграфичность. Возможность отформатировать текст, выделить заголовки, вставить иллюстрации, содержание и. т.д. То есть, приблизиться к бумажным изданиям.
Масштабируемость. Возможность читать e-book при разных разрешениях экрана и размерах рабочего окна.
Кроссплатформенность. Электронная книга в идеале должна одинаково легко читаться на различных устройствах — от специализированной «читалки» до персонального компьютера.
Конвертируемость. Очень важный параметр, учитывая постоянно меняющиеся стандарты, операционные системы и «железо».
Гипертекст. Тоже весьма существенный для e-book параметр. Возможность мгновенно перейти в нужное место книги, щелкнув по ссылке.
Возможность редактирования. Не обязательно, но желательно. Учитывая «какчество» текстов в онлайн-библиотеках. Хотя, для «лицензионных» книг, эта фича, быть может, и не актуальна. Там достаточно возможностей делать закладки и пометки на полях, которые предоставляет софт для чтения.
Профессиональный издатель обязательно бы добавил в этот список возможность установки DRM, [1.2] но я лично считаю (и большинство читателей, без сомнения, согласятся со мной) что этот элемент совершенно излишний. Если дать волю издателям, они и на бумажные книги начнут ставить защиту, например, покрывать страницы гильоширной [1.3] сеткой, чтобы затруднить распознавание текста программой OCR…
1.2
Digital Rights Management, буквально, управление цифровыми правами, говоря проще — защита от несанкционированного копирования.
1.3
Гильоширная сетка, гильоши — специальные трудновоспроизводимые узоры, наносимые на деньги, документы, ценные бумаги, для защиты их от подделки.
С этими требованиями мы и пройдемся по существующим форматам.
Текст — он и в Африке текст. Простая последовательность восьмибитных (как правило) значений, каждое из которых соответствует либо символу, либо управляющему коду. Отличается лишь кодировкой и способом перевода строки.
Полиграфичность. Низкая. Набор средств разметки у текста весьма невелик. Форматирование абзацев, отступы и выделение заглавными буквами — вот, пожалуй, и все.
Масштабируемость. Все зависит, от того, как сформатирован текст. Если он аккуратно отформатирован по абзацам с выравниванием, то очень низкая. Если же разбиения на строки нет — «один абзац — одна строка» — тогда масштабируемость высокая.
Кроссплатформенность. Практически абсолютная.
Конвертируемость. Практически абсолютная.
Гипертекст. Нет.
Возможность редактирования. Абсолютная.
Формат txt активно использовался на заре электроных библиотек, при создании всевозможных сборников книг («Библиотека в кармане», «HarryFan Text Collection», и прочие). Сейчас книги в формате txt можно найти, пожалуй, лишь в библиотеке Максима Мошкова, (да и то перед подачей их пользователю они преобразуются в HTML) и в некоторых небольших библиотеках.
Этот формат был специально разработан компанией Micro$oft в 1987 году для переноса текста с разметкой из одной программы в другую. В таком качестве он используется и по сей день. RTF понимают практически все современные текстовые редакторы и издательские системы.
Полиграфичность. Выше среднего.
Масштабируемость. Почти абсолютная.
Кроссплатформенность. Очень высокая.
Конвертируемость. Очень высокая.
Гипертекст. Нет.
Возможность редактирования. Абсолютная.
RTF до сих пор широко используется в русскоязычных онлайн-библиотеках. Главным образом, именно из-за его хорошей совместимости с различным программным обеспечением.
Формат DOC — это внутренний формат Micro$oft Word и предназначен для хранения текстовых документов, подготовленных в этой программе. Распространенность Micro$oft Office и Micro$oft Word как его части, обусловила широкое распространение формата DOC.
Полиграфичность. Высокая.
Масштабируемость. Высокая.
Кроссплатформенность. Ниже среднего.
Конвертируемость. Высокая.