Вход/Регистрация
Программирование. Принципы и практика использования C++ Исправленное издание
вернуться

Страуструп Бьерн

Шрифт:

Это выражение распознает тему сообщения электронной почты с необязательными символами FW: или Re:, за которыми может не стоять ни одного символа или может стоять несколько символов. Рассмотрим пример.

Subject: FW: Hello, world!

Subject: Re:

Subject: Norwegian Blue

но не

SUBJECT: Re: Parrots

Subject FW: No subject!

Пустая альтернатива не допускается.

(|def)

// ошибка

Однако мы можем указать несколько альтернатив сразу.

(bs|Bs|bS|BS)

23.8.6. Наборы символов и диапазоны

Специальные символы представляют собой обозначение наиболее распространенных классов символов: цифр (\d); букв, цифр и знака подчеркивания (\w) и др. (см. раздел 23.7.2). Однако часто бывает полезно определить свой собственный специальный символ. Сделать это очень легко. Рассмотрим пример.

В спецификации класса символов дефис (–) используется для указания диапазона, например, [1–3] (1, 2 или 3) и [w–z] (w, x, y или z). Пожалуйста, будьте аккуратны при использовании таких диапазонов: не все языки содержат одинаковые буквы, и порядки их следования в алфавитах разных языков могут отличаться. Если вам необходим диапазон, не являющийся частичным диапазоном букв и цифр, принятых в английском языке, то обратитесь к документации.

Следует подчеркнуть, что мы используем специальные символы, такие как \w (означающий “любой словообразующий символ”), в спецификации класса символов. Как же нам вставить обратную косую черту (\) в класс символов? Как обычно, превращаем ее в управляющий символ: \\.

Если первым символом в спецификации класса символов является символ
^
, это означает отрицание
^
. Например:

< image l:href="#"/>

В последнем регулярном выражении символ ^ стоит не на первом месте после квадратной скобки ([), значит, это простой символ, а не оператор отрицания. Регулярные выражения могут быть очень хитроумными.

Реализация библиотеки

regex
также содержит набор именованных классов символов, используемых для сравнения. Например, если хотите сравнивать буквенноцифровые символы (т.е. буквы или цифры: a–z, или A–Z, или 0–9), то это можно сделать с помощью регулярного выражения
[[:alnum:]]
. Здесь слово alnum представляет собой имя совокупности символов (набор буквенно-цифровых символов). Шаблон для непустой строки буквенно-цифровых символов, заключенной в квадратные скобки, может выглядеть так:
"[[:alnum:]]+
". Для того чтобы поместить это регулярное выражение в строковый литерал, мы должны сделать кавычки управляющими символами.

string s = "\"[[:alnum:]]+\"";

Более того, чтобы поместить строковый литерал в объект класса

regex
, мы должны сделать управляющими символами не только кавычки, но и саму обратную косую черту и использовать для инициализации круглые скобки, так как конструктор класса
regex
является явным:

regex s("\\\"[[:alnum:]]+\\\"");

Использование регулярных выражений вынуждает вводить множество обозначений. Перечислим стандартные классы символов.

Реализация библиотеки

regex
может содержать и другие классы символов, но если вы решили использовать именованный класс, не указанный в этом списке, убедитесь, что он не ухудшает переносимость программы.

23.8.7. Ошибки в регулярных выражениях

Что произойдет, если мы зададим неправильное регулярное выражение? Рассмотрим пример.

regex pat1("(|ghi)"); // пропущенный оператор альтернативы

regex pat2("[c–a]"); // не диапазон

Когда мы присваиваем шаблон объекту класса

regex
, он подвергается проверке. Если механизм сравнения регулярных выражений не может работать из-за того, что регулярное выражение неправильное или слишком сложное, генерируется исключение
bad_expression
.

Рассмотрим небольшую программу, позволяющую исследовать механизм сравнения регулярных выражений.

#include <boost/regex.hpp>

  • Читать дальше
  • 1
  • ...
  • 371
  • 372
  • 373
  • 374
  • 375
  • 376
  • 377
  • 378
  • 379
  • 380
  • 381
  • ...

Ебукер (ebooker) – онлайн-библиотека на русском языке. Книги доступны онлайн, без утомительной регистрации. Огромный выбор и удобный дизайн, позволяющий читать без проблем. Добавляйте сайт в закладки! Все произведения загружаются пользователями: если считаете, что ваши авторские права нарушены – используйте форму обратной связи.

Полезные ссылки

  • Моя полка

Контакты

  • chitat.ebooker@gmail.com

Подпишитесь на рассылку: