Загуменов Александр Петрович
Шрифт:
4. В навигационной панели щелкните по надписи What to Scan (Что сканировать).
5. На одноименной вкладке выберите способ доступа к файлам: либо Local area network (Локальное сетевое окружение), если исследование проводится на одном компьютере или в локальной сети (рис. 2.159), либо FTP site (FTP-сайт), если будут загружаться файлы с удаленного сервера (тогда вкладка примет вид, представленный на рис. 2.160). В первом случае щелкните по кнопке Browse (Обзор) и выберите каталог начала сканирования. Во втором – заполните поля:
• Host (Сервер) – имеется в виду его логическое имя;
• Port (Порт);
• User name (Имя пользователя);
• Password (Пароль);
• Starting directory (Стартовый каталог).
Здесь же можно отметить флажок Save password (Сохранить пароль), чтобы не вводить пароль каждый раз заново.
6. Щелкните по кнопке OK или Apply (Применить), чтобы сохранить настройки проекта.
7. Выполните команду Scan → Start (Сканирование → Начать) или щелкните по кнопке
Scan (Сканировать).
Обработка выполняется над файлами, расположенными в стартовом каталоге, и продолжается во всех вложенных каталогах. После завершения сканирования можно будет вставлять, исправлять или удалять метатэги.
Рекомендуется ограничить количество документов в активном проекте 1000, иначе заметно увеличится время, необходимое для модификации информации.
Обратите внимание, что при работе с удаленным сервером (когда выбран способ доступа к файлам – FTP site) отключены определенные функции программы, а именно:
• не сканируются документы Microsoft Office;
• нельзя просматривать HTML-страницы в браузере;
• невозможно загрузить файлы в каталог;
• имя каталога следует всегда начинать со слеша, например: /myWebsite;
• команда View → Show Image Preview Area (Вид → Показывать область предпросмотра изображений) недоступна.
Свойства проектаСвойствами проекта задается способ сканирования и действия, выполняемые в его процессе:
• автоматическое заполнение ключевых слов;
• сканируемые типы файлов;
• вид записи тэгов внутри элемента <HEAD> … </HEAD>.
В процессе обработки программа может автоматически извлечь ключевые слова, а также атрибуты ALT изображений. Высота и ширина картинок также определяются в течение просмотра, но эти атрибуты нельзя заполнить автоматически – для их вставки следует воспользоваться командой Autofill (Автозаполнение).
Надлежащий выбор ключевых слов критичен для ранжирования документов поисковыми машинами: он позволяет точно индексировать web-страницы. WebQA Tag просматривает документы, с помощью встроенного Экстрактора анализирует их содержание и предлагает ключевые слова. Вы можете принять их все или сократить список по своему усмотрению.
Атрибут ALT тэга вставки изображений применяется для их описания словами. Это особенно полезно для браузеров, которые не выводят графику или у которых эта возможность отключена. Кроме того, они помогают пользователям с дефектами зрения, использующих устройства чтения. По этой причине, атрибуты Высокого звука гарантируют, что Вы поддерживаете{обслуживаете} согласие промышленности для достижимости.
Программу можно и следует использовать для редактирования атрибутов ALT, WIDTH и HEIGHT всех тэгов IMG в HTML-документах, а также атрибута SRC, чтобы изменить имя исходного файла изображения.
Если анализ тэга IMG заблокирован, сканирование выполняется быстрее, так как в этом случае просматривается лишь контейнер <HEAD> … </HEAD>.
Отметим попутно, что атрибуты WIDTH и HEIGHT никоим образом не увеличивают объем загружаемого модуля; они служат только для задания размеров области, которая будет зарезервирована для изображений при загрузке страницы.
Типы документовВкладка Document Types (Типы документов) окна Properties – см. рис. 2.161 – позволяет выбирать расширения файлов (другими словами, типы документов), которые разрешено открывать. WebQA Tag автоматически выбирает правильное средство просмотра для таких документов.
Механизм синтаксического анализа программы не исследует файлы с расширениями .rtf или .txt, но анализирует файлы .jsp и .asp, а также некоторые другие сетевые форматы.
Заданные по умолчанию расширения:
• в разделе HTML documents (HTML-документы): .htm, .html, .shtm и .shtml;
• в разделе Microsoft Office documents (Документы Microsoft Office): .doc (для документов Microsoft Word), .xls (для документов Microsoft Excel) и .ppt (для документов Microsoft PowerPoint);
• в разделе Adobe Acrobat (PDF) documents (Документы Adobe Acrobat): .pdf.
Анализ документов в любом из перечисленных разделов можно отключить, для чего предназначены следующие флажки (перечислены в том же порядке следования разделов):
• Scan all these types of HTML documents (Сканировать все эти типы HTML-документов);
• Scan all these types of Microsoft Office documents (Сканировать все эти типы документов Microsoft Office);
• Scan all Adobe Acrobat documents (Сканировать все документы Adobe Acrobat).
Кроме того, в разделе HTML documents возможно отключение обработки тэгов изображений, для чего предназначена опция Also scan for image tags (<IMG=…>) (Сканировать также тэги изображений), а в разделе Adobe Acrobat (PDF) documents – извлечение ключевых слов: Enable Adobe Acrobat keywords extraction (Разрешить извлечение ключевых слов Adobe Acrobat). Обратите внимание, что установка последней опции может значительно замедлить сканирование.
С помощью кнопок Add (Добавить) и Delete (Удалить) вы можете расширить или, наоборот, сузить диапазон исследуемых типов файлов.
Список ключевых словВкладка Keywords List (Список ключевых слов) окна Properties (рис. 2.162) позволяет управлять вставкой ключевых слов в документы, для чего предназначены два списка, формируемые в разделах: Imported keywords list (Импортированный список ключевых слов) и Keywords noise list (Список шума). Первый служит для добавления ключевых слов в генерируемый программой перечень, а второй, наоборот, для запрета использования определенных слов и фраз в качестве ключевых. Список шума применяется ко всем документам в текущем проекте.
Слова в списки можно добавлять вручную (кнопка Add) или импортировать извне (кнопка Import). Для удаления слов из списков служит кнопка Delete. Кнопка Export (Экспорт) применяется для сохранения сформированных списков в файлах.
В списках можно использовать разделитель элементов. Заданный по умолчанию – запятая.
Список шума составляется без учета регистра, все слова в нем строчные.
Исключения Вкладка Exclusions (Исключения) окна Properties (рис. 2.163) служит для указания, если требуется, папок, которые будут исключены из просмотра. Такая настройка полезна, если каталоги очень большие, или известно, что в них не содержатся файлы, требующие обследования. Так, вы можете исключить каталоги ASP или каталоги FrontPage, которые начинаются с символа подчеркивания.Рис. 2.163. Окно Properties, вкладка Exclusions
Для выбора каталогов предназначена кнопка Browse, для добавления их в список – кнопка Add , для замены выбранной строки в списке – кнопка Replace (Заменить) и для удаления – Delete. Элементы заголовка
Как известно, метаданные размещаются в контейнере <HEAD>. </HEAD> каждого HTML-файла. Поскольку они содержат всю описательную информацию о документе, поисковые системы делают особый акцент на обработке этих сведений. Открыв очередной файл, WebQA Tag считывает содержимое его заголовочной части в память. Всякий раз, когда программа встречает метатэг, она проверяет его имя, сверяет с имеющимися списками и, если он был изменен, записывает новое значение. Если метатэг был удален из списков, он не будет внесен в файл.
Сначала WebQA Tag удаляет все тэги TITLE и META, а также имеющиеся пустые строки. Тэги форматируются в точности по выполненным настройкам, а затем вставляются непосредственно за открывающим тэгом <HEAD> документа. Такой подход обеспечивает наглядность метаданных при открытии файла в текстовом редакторе. Для организации указанных операций предназначена вкладка HTML Head Write (Запись HTML-тэга HEAD) – см. рис. 2.164.
Здесь можно определить варианты форматирования тэгов при записи. Систематизация записываемых элементов упрощает дальнейшее обслуживание HTML-страниц. Раздел Tag Case (Регистр тэгов) позволяет установить внутренний стандарт написания тэгов и атрибутов, хотя браузеры не чувствительны к регистру букв тэгов. Допустимы три варианта:
• The existing case (Существующий регистр) – останется прежнее написание;
• All lower case – строчными буквами, например: <meta name="Author" … >;
• All upper case (e.g.,) – прописными: <META NAME="Author" … >.
В разделе Character references (Таблицы символов) можно выбрать форму представления символов в HTML-документе:
• I want to preserve the characters (Сохранить символы);
• In character references (Из таблиц символов) – для использования в коде HTML специальных наборов символов, которые начинаются со знака «&» (амперсанд) и заканчиваются знаком «;» (точка с запятой), а служат для отображения в браузере определенных знаков и символов. Например, комбинация символов > используется для обозначения знака «>» (больше чем);
• In numeric decimal value (В числовом десятичном коде) – например: é;
• In numeric hexadecimal value (В числовом шестнадцатеричном коде) – например: à.
Отметим, что функционально числовые коды соответствуют комбинациям из таблиц символов, отличие – лишь в форме представления.
Раздел Head write organization (Порядок записи заголовка) служит для дополнительной настройки расположения метатэгов и позволяет воспользоваться следующими возможностями:
• Sort metatags alphabetically (Сортировать метатэги в алфавитном порядке);
• Write the «Content-Type» metatag first (Записывать метатэг «Content-Type» первым);
• Use closing slash on metatags (Использовать в метатэгах закрывающий слэш) – например: «/>»;
• Allow this number of characters per line before the text wrap to the next line (Допустимое число символов в строке, после достижения которого переходить на следующую строку) – если задано 0, то строка не разбивается.
Создание и изменение метатэговПосле завершения сканирования каталога на локальном компьютере или FTP-сайта все найденные метатэги отображаются в виде сетки (рис. 2.165), где вы можете определить, какие файлы требуют модификации.
Для добавления метатэга в какой-либо HTML-документ выполните следующие операции:
1. Перейдите в Сетке на вкладку, соответствующую выбранному типу файла (в данном случае – Web Pages).
2. Выберите ячейку, которую собираетесь редактировать. Если ячейка текстовая (например, для тэга "Content-Type"), введите содержание метатэга в области редактирования (в верхней части Сетки). В другом случае – как, например, для тэга Robots – щелкните по ячейке, чтобы открылось соответствующее диалоговое окно – в данном примере List of Values (Список значений) с перечнем вариантов – и выберите нужный параметр (см. рис. 2.166). Строки Сетки можно сортировать по значениям в ячейках, для чего следует дважды щелкнуть по наименованию колонки.
3. Для сохранения сделанных изменений выполните команду File → Save Project (Файл → Сохранить проект) или щелкните по кнопке
Save the current project (Сохранить текущий проект).
То же самое можно выполнить с помощью Мастера тэгов. Для этого действуйте так:
1. Находясь в какой-либо ячейке Сетки, щелкните правой кнопкой мыши и выберите в контекстном меню пункт Wizard (Мастер) или выполните команду Tools → Metatag Wizard (Инструменты → Мастер метатэгов).
2. Откроется первое окно Мастера, представленное на рис. 2.167. В его поля Title, Description и Keywords загружены главные метатэги документа. Отредактируйте их, если требуется. Щелкните по кнопке Далее.