Шрифт:
Это вечные проблемы, от способа решения которых зависит общая функциональность ИС.
Решение сформулированных проблем предполагает создание развитой инфраструктуры для представления и обмена метаданными (данными о ресурсах), без которой невозможно формирование единого информационного пространства (9). Это можно рассматривать как первый шаг к интеграции и интероперабельности информационных систем. Под интероперабельностью любой ИС, в том числе и электронной библиотеки, понимается степень ее способности взаимодействовать с другими ИС, в том числе и с человеком. Но если в последнем случае основная нагрузка на обеспечение взаимопонимания ложится на человека, который в состоянии обработать даже очень плохо организованную информацию, то для обеспечения эффективного взаимодействия между автоматическими ИС требуются специальные технологические методы и общие соглашения (5).
В основе интеграции РИС лежит интеграция метаданных, основанная на стандартах формата для представления метаданных, одновременно с унификацией нормативно-справочной информации (профиля информационных систем) (7).
Под интеграцией данных с точки зрения пользователя следует понимать:
• возможность свободно группировать любые имеющиеся разнородные данные по любому признаку в произвольные реальные и / или виртуальные коллекции;
• возможность организовывать по всем массивам данных прозрачный для конечного потребителя сквозной поиск информации.
Реализация механизмов интеграции данных немыслима без их стандартизации: данные одного типа должны описываться и предоставляться единым образом в соответствии с нормативными документами. В частности, в стандартизованном виде должны предоставляться следующие типы информационных ресурсов:
• географические информационные ресурсы (картографические материалы, спутниковые снимки, данные полевых наблюдений и т.п.), а также соответствующие базы метаданных;
• фактографические базы данных и метаданных;
• библиографические базы данных и электронные каталоги;
• полнотекстовые базы данных и электронные библиотеки;
• авторитетные базы данных (описывающие субъекты информационного взаимодействия: персоны, организации и т.п.);
• другие ресурсы (аудио- и видеозаписи, электронные презентации и др.), снабженные стандартизованными метаданными.
Исходя из вышеперечисленных особенностей, на наш взгляд, РИС должна содержать следующие отдельные функциональные компоненты (5):
• систему идентификации информационных ресурсов;
• систему идентификации, аутентификации и авторизации пользователей;
• систему управления метаданными;
• систему управления информационными ресурсами, в том числе полнотекстовыми;
• систему сбора статистики;
• систему мониторинга доступности сервисов и ресурсов.
Реализация этих подсистем должна основываться на открытых спецификациях, связанных с международными стандартами. В распределенной среде должны быть задействованы механизмы синхронизации данных, например на основе репликаций. При этом в качестве протоколов сетевого взаимодействия должны выступать стандартные протоколы, например OAI, Z39.50, SRW/SRU, LDAP и др. (1; 3; 4; 8) (см. рис. 1).
Рис. 1. Сетевое взаимодействие подсистем РИС
Практическая реализация сервисов SRW/SRU даст существенно новое качество информационной системы – возможность включения ее ресурсов в глобальные поисковые системы на более высоком уровне, нежели уровень внешней индексации статических веб-страниц другими системами. Иные возможные типы поиска связаны с поиском по заданным шаблонам и поиском с привлечением онтологии. Последний является более интеллектуальным типом поиска. Для его реализации требуется дополнительная информация о предметной области, включающая определения терминов, сущностей и связей. Следует отметить, что представление этой дополнительной информации должно соответствовать глобальным договоренностям и международным стандартам. Иначе поиск с привлечением словарей, тезаурусов и онтологии всегда будет ограничен текущей системой, а интероперабельность не будет реализована.
В настоящее время существуют достаточно мощные информационные системы, в той или иной степени удовлетворяющие потребности научных работников в информации. Однако основной недостаток большинства систем – ограниченность возможностей обеспечения интеграции ресурсов как внутри каждой из систем, так и вовне. Отметим, что основу разработки ИС составляют, прежде всего, стандарты и международные рекомендации, формирующие профиль ИС. Под ним понимается набор из одного или нескольких базовых нормативно-технических документов (стандартов и спецификаций), ориентированных на решение определенной задачи (реализацию заданной функции либо группы функций приложения или среды) с указанием при необходимости выбранных классов, подмножеств, опций базовых стандартов, требуемых для выполнения конкретной функции. Наиболее важным являются профили метаданных циркулирующей в системе информации. Выбор профиля должен основываться на выполнении следующих требований:
• включать в себя основные типы информации, требующейся для поддержки научной работы;
• быть открытыми, т.е. обеспечивать доступ к соответствующей информации по этим описаниям;
• быть расширяемыми, т.е. обеспечивать возможность детализации описаний;
• обеспечивать возможности интеграции информации;
• обеспечивать возможности уникальной идентификации информации;
• обеспечивать возможности размещения и поиска информации в распределенной среде;
• быть ориентированными на современные и перспективные технологии описания и использования информации;