Загуменов Александр Петрович
Шрифт:
Пункт главного меню Miscellaneous → News (Разное → Новости) и кнопка News предназначены для доступа к сайту производителя программы. По выполнении команды откроется окно CyberSpyder Link Test – Update Check (Проверка на наличие обновлений) – рис. 2.111.
Если у вас есть возможность соединения с Internet, щелкните по кнопке Check (Проверить), чтобы получить последние новости о программе и сайте. Команда Miscellaneous → Winsock (Разное → Сокеты Windows) и кнопка Winsock предназначены для вывода информации об установленной в компьютере версии Winsock. Winsock (Windows\' Sockets) – это программа, обеспечивающая передачу данных по сети; обычно она записана в файле winsock.dll, который находится в папке C:\Windows\System. Однако некоторые сетевые программы используют другие способы передачи информации.
Пункты главного меню Windows (Окна) предназначены для стандартного управления расположением окон в рабочей области программы.
Настройка
При открытии существующей базы данных или создании новой открывается окно CyberSpyder Link Test – Setup of [test name], состоящее из шести вкладок:
• Start URLs (Стартовые адреса) – для ввода начальных адресов тестирования (рис. 2.112);
Рис. 2.112. Вкладка Start URLs окна CyberSpyder Link Test – Setup of [Имя теста]
• Skip URLs (Пропустить адреса) – для указания адресов, которые следует пропустить при тестировании;
• ID/PW URLs (Адреса с идентификацией) – для указания адресов с защитой посредством идентификаторов и паролей;
• Test Options (Параметры теста) – для настройки некоторых опций, касающихся особенностей проведения теста: например, для ввода времени ожидания соединения и отклика, числа повторных запросов, информации о прокси-сервере, если он используется (рис. 2.113);
• Netiquette (Сетевой этикет) – для ввода информации, предназначенной для серверных роботов (рис. 2.114);
• Reports (Отчеты) – для настройки основных отчетов, начиная от выбора каталога для их сохранения и заканчивая применением разнообразных фильтров (рис. 2.115).
Для задания адресов на вкладках Start URLs, Skip URLs и ID/PW URLs служит кнопка New (Новый), для исправления – кнопка Edit (Правка) и для удаления – Delete (Удалить). При вводе нового адреса и при правке имеющегося на вкладках Start URLs или ID/PW URLs откроется дополнительное окно CyberSpyder Link Test – URL Edit or Entry (Правка или ввод адреса). В этом окне можно указать не только адрес, но и идентификатор пользователя (ID), а также пароль (Password) (рис. 2.116). В поле Enter URL (Введите адрес) необходимо перед написанием адреса задать протокол (например, http:// или ftp://).
Первоначальная настройка производится при выполнении нового теста, а в дальнейшем для выполненных и открытых тестов параметры загружаются из базы данных и могут быть в любое время изменены.
В нижней части окна CyberSpyder Link Test – Setup of [test name] расположены три кнопки. Они имеют следующее назначение:
• Cancel (Отменить) – закрыть базу данных и окно без каких-либо действий и записи изменений;
• Tab Defaults (По умолчанию для вкладки) – восстановить на открытой вкладке значения параметров, подразумеваемые по умолчанию;
• OK – проверить введенные значения на полноту и соответствие и, если все в порядке, сохранить информацию в базе данных. При возникновении каких-либо осложнений программа выводит на экран сообщение об ошибке, как показано на рис. 2.117 и 2.118. Нажав кнопку OK в окне с сообщением, вы попадете на вкладку, где обнаружена погрешность: в первом случае это Start URLs (не указан протокол), во втором – Netiquette (не указан адрес электронной почты).
Если же все настройки выполнены корректно, окно CyberSpyder Link Test Setup of [test name] закроется, и откроется окно-индикатор тестирования. Тестирование
Ход проверки показан в окне, представленном на рис. 2.119.
Информация в окне постоянно изменяется, отражая динамику тестирования и его текущее состояние. Окно-индикатор содержит три раздела:
• Current URL (Нынешний адрес) – указан адрес, который в данное время проверяется;
• Processing Status (Статус выполнения) – показана операция, которая выполняется в данный момент, отражено состояние теста и время, прошедшее с его начала.
• URL Counters (Счетчики адресов) – приведены итоговые показания счетчиков для различных элементов теста.
Раздел Current URL включает в себя пять полей:
• Service (Служба) – имеется в виду протокол для адреса. В настоящее время программа поддерживает только протокол HTTP;
• Host (Главный компьютер) – имя главного компьютера (узла), которое, как правило, обозначают аббревиатурой URL. Поле может быть и не заполнено, если вместо имени узла представлен адрес IP;
• Host IP (IP-адрес узла) – IP-адрес главного компьютера (узла). Если не удастся его узнать, поле останется пустым;
• Port (Порт) – порт, через который идет проверка;
• URL (URL-адрес) – отображается адрес, тестируемый в настоящее время.
Раздел Processing Status (Статус выполнения) содержит четыре поля. В поле Current Operation (Текущая операция) программа указывает действие, которое выполняется в настоящий момент времени:
• Waiting to Start (Ожидание начала) – ожидание начала тестирования;
• Continue (Продолжить) – продолжение прерванного теста;
• Preparing to run test (Подготовка к запуску теста) – первоначальный отбор информации, необходимой для запуска теста;
• Preparing to run test – ensuring tables are clear (Подготовка к запуску теста – очистка служебных таблиц) – часть первоначальной установки, используемая для настройки нового теста;
• Preparing to run test – recording startup info (Подготовка к запуску теста – запись первоначальной информации) – извлечение необходимой базовой информации и накопление ее в памяти;
• Setting up for a Retest – please wait (Настройка повторного запуска – подождите немного) – подготовка к повторному тестированию сайта. Включает удаление или переустановку значений некоторых таблиц;
• Loading info for Incomplete Test restart (Загрузка информации для повторного запуска незавершенного теста) – восстановление информации, полученной до того, как тест был прерван;
• Stopped (Остановлен) – тест остановлен;
• Get next URL to test (Получение очередного адреса для тестирования) – поиск нетестировавшегося адреса в таблице структуры сайта;
• See if tested (Проверка, не тестировался ли) – проверка наличия результатов тестирования конкретного адреса;
• Parsing URL (Синтаксический анализ адреса) – синтаксический анализ компонентов URL-адреса: узла, порта, пути, файла;
• Get/Create Unique URL record (Получить/Создать запись для уникального адреса) – извлечение уникальной записи для данного уникального URL-адреса или, при отсутствии таковой, – ее создание;
• Checking on name anchor (Проверка на наличие поименованной ссылки) – проверяется наличие в коде HTML-страницы атрибута NAME (наименования) в тэге A (конструкция вида <A href="#" NAME = "…" > … </A>);
• See if we have the host IP (Проверка на наличие IP-адреса узла) – поиск в таблицах IP-адреса узла;
• Do DNS lookup for Host address (Поиск адреса узла по DNS) – определение IP-адреса узла по его DNS;
• Create Host/IP reference record (Создание справочной записи об узле/ Ссылка на IP-адрес) – сохранение в таблице найденного IP-адреса узла, с тем чтобы впоследствии не потребовалось снова определять его по сети;
• Check host for «robots.txt» (Проверка наличия файла robots.txt на узле) – выясняется, имеет ли узел файл robots.txt (проверка выполняется один раз для каждого узла);
• Short pause to reduce server load (Краткая пауза для уменьшения нагрузки на сервер) – при ограничении по скорости, программа будет работать с небольшими паузами, чтобы не превысить его;
• Testing the URL (Тестирование адреса) – отбор информации, необходимой для тестирования URL-адреса.
Поле Timer (Таймер) используется для отсчета времени при попытке подключения к сайту или при ожидании ответа.
В поле Retries (Попытки) отражается число попыток выполнения операций, которые могут быть повторены. Вначале устанавливается нулевое значение, которое увеличивается на единицу при каждой новой попытке.
При сканировании и нахождении программой HTML-документа заголовок поля No Document in Process (Не обрабатывается никакой документ) изменяется на Process Document: … Bytes Received (Обработка документа: получено … байт), а показания счетчика в данном поле увеличиваются по мере загрузки документа. Когда загрузка завершена, заголовок поля изменяется на Process Document: . Bytes Left (Обработка документа: осталось. байт), а значение счетчика уменьшаются по мере просмотра документа и анализа имеющихся в нем ссылок.
Поле Elapsed Time (Прошедшее время) служит для отсчета времени, прошедшего с начала тестирования. Если открыт завершенный тест, то здесь показывается общее время, затраченное на тестирование; если незаконченный – время, прошедшее от начала тестирования до его прекращения. Время отображается в формате hh: mm, где hh – часы, а mm – минуты.
Поле Status (Состояние) предназначено для фиксации текущего состояния теста и может принимать следующие значения:
• New Test (Новый тест) – создана новая тестовая база данных или открыта уже имеющаяся, но тест еще не запускался;
• Incomplete Test (Незавершенный тест) – открыта база данных частично выполненного теста;
• Starting (Запуск) – программа выполняет операции по подготовке к тестированию;
• Running (Выполнение) – идет тестирование;
• Waiting to Stop (Ожидание до остановки) – такое сообщение возникает при нажатии на кнопку Stop (Стоп), в то время, когда реально тестирование еще не прервано. Задержка обусловлена необходимостью завершить текущую операцию, чтобы сохранить состояние теста;
• Stopped (Остановлено) – полная остановка тестирования. Теперь, если требуется, тест можно закрыть, и продолжить его выполнение позднее. Эта ситуация безопасна, так как промежуточные результаты сохраняются;
• Finished (Закончено) – завершение теста;
• Completed (Завершено) – такое сообщение появляется при повторном открытии завершенного теста.
Раздел URL Counters состоит из счетчиков, показывающих:
• Left (Осталось) – количество адресов, которые должны быть еще проверены. При анализе ссылок из нового HTML-документа показания данного счетчика уменьшаются по мере проверки ссылок;
• Checked (Проверено) – число проверенных адресов;
• Unique (Уникальные) – число уникальных URL-адресов. В дополнение к адресам документов проверяемых сайтов (указанных на вкладке Start URLs в окне CyberSpyder Link Test – Setup of [test name]) данный счетчик фиксирует ссылки на документы, находящиеся на других сайтах, – внешние ссылки. В связи с этим по завершении проверки показания данного счетчика могут быть выше, чем показания Checked;
• Skipped (Пропущено) – отражает число пропущенных адресов, то есть тех, которые не тестировались. Сюда входят не только адреса, введенные при настройке тестовой базы в окне CyberSpyder Link Test – Setup of [test name] на вкладке Skip URLs (Пропустить URL-адреса), показанной на рис. 2.120, но и те, которые получены с помощью файла исключений для роботов robots.txt;