Чтение книги Программирование. Принципы и практика использования C++ Исправленное издание страница 185

Программирование. Принципы и практика использования C++ Исправленное издание

вернуться

Страуструп Бьерн

Шрифт:

empty-line/>

Это удобно, когда мы хотим устранить различия между символами, набранными в разных регистрах. Например, если пользователь ввел слова

Right

right

rigHT

, то, скорее всего, он имел в виду одно и то же (например, слово

rigHT

чаще всего является результатом нечаянного нажатия клавиши <Caps Lock>). Применив функцию

tolower

к каждому символу в каждой из строк, мы можем получить одно и то же значение:

right

. Эту операцию можно выполнить с любым объектом класса

string

void tolower(string& s) // вводит строку s в нижнем регистре

{

for (int i=0; i<s.length; ++i) s[i] = tolower(s[i]);

}

Для того чтобы действительно изменить объект класса

string

, используем передачу аргумента по ссылке (см. раздел 8.5.5). Если бы мы хотели сохранить старую строку без изменения, то могли бы написать функцию, создающую ее копию в нижнем регистре. Мы предпочитаем функцию

tolower

, а не

toupper

, поскольку она лучше работает с текстами на некоторых естественных языках, например немецком, в которых не каждый символ в нижнем регистре имеет эквивалент в верхнем регистре.

11.7. Использование нестандартных разделителей

В этом разделе мы рассмотрим гипотетические примеры использования потоков i

ostream

для решения реальных задач. При вводе строк слова по умолчанию разделяются пробелами или другими специальными символами (whitespace). К сожалению, поток

istream

не имеет средств, позволяющих определять, какие символы должны играть роль разделителей, или непосредственно изменять способ, с помощью которого оператор

считывает строки. Итак, что делать, если мы хотим дать другое определение разделителю? Рассмотрим пример из раздела 4.6.3, в котором мы считывали слова и сравнивали их друг с другом. Между этими словами стояли разделители, поэтому если мы вводили строку

As planned, the guests arrived; then

то получали слова

planned,

the

guests

arrived;

then,

Это слова невозможно найти в словаре: “planned,” и “arrived;” — это вообще не слова. Это набор букв, состоящий из слов, к которым присоединены лишние и не относящиеся к делу знаки пунктуации. В большинстве случаев мы должны рассматривать знаки пунктуации как разделители. Как же избавиться от этих знаков пунктуации? Мы могли бы считать символы, удалить знаки пунктуации или преобразовать их в пробелы, а затем ввести “очищенные” данные снова.

string line;

getline(cin,line); // вводим строку line

for (int i=0; i<line.size; ++i) // заменяем знаки пунктуации

// пробелами

switch(line[i]) {

case ';': case '.': case ',': case '?': case '!':

line[i] = ' ';

}

stringstream ss(line); // создаем поток istream ss, вводя в него

// строку line

vector<string> vs;

string word;

while (ss>>word) // считываем слова без знаков пунктуации

vs.push_back(word);

Применив такой способ, получаем желаемый результат.

planned

the

guests

arrived

then

К сожалению, этот код слишком сложен и излишне специализирован. А что делать, если знаки пунктуации определены иначе? Опишем более общий и полезный способ удаления нежелательных символов из потока ввода. Как должен выглядеть этот поток? Как должен выглядеть наш код? Может быть, так?

ps.whitespace(";:,."); // точка с запятой, двоеточие, запятая и точка

// считаются разделителями

string word;

while (ps>>word) vs.push_back(word);

Как определить поток, работающий так, как поток

? Основная идея заключается в том, чтобы считывать слова в обычный поток ввода, а затем обрабатывать символы-разделители, заданные пользователем, как настоящие разделители, т.е. не передавать разделители пользователю, а просто использовать их для отделения слов друг от друга. Рассмотрим пример.

as.not

Слова

not

должны быть двумя самостоятельными словами

not

Для того чтобы сделать это, можно определить класс. Он должен принимать символы из потока

istream

и содержать оператор

, работающий так же, как оператор ввода потока

istream

, за исключением того, что мы сами можем указывать, какие символы являются разделителями. Для простоты будем считать существующие символы-разделители (пробел, символ перехода на новую строку и т.д.) обычными символами; мы просто позволим пользователю указать дополнительные разделители. Кроме того, мы не будем удалять указанные символы из потока; как и прежде, мы превратим их в разделители. Назовем наш класс

Punct_stream

Программирование. Принципы и практика использования C++ Исправленное издание

Страуструп Бьерн

Шрифт:

Полезные ссылки

Контакты

Подпишитесь на рассылку: