Чтение книги Решаем задачи Python страница 12

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Integer sed sollicitudin leo. Vestibulum sed magna eget odio consequat commodo. Aliquam erat volutpat. Quisque pharetra diam nec enim facilisis, vel fringilla metus faucibus. Donec a posuere ligula. Suspendisse potenti. Nulla facilisi. Duis auctor lobortis risus, sit amet consectetur enim. Sed in odio nec diam volutpat rhoncus non nec libero. Phasellus scelerisque lacinia mi. Nulla non ullamcorper leo. Vestibulum ante ipsum primis in faucibus orci luctus et ultrices posuere cubilia curae; Curabitur nec eros non quam consequat vestibulum. Morbi euismod odio quis libero consectetur, a dictum mauris volutpat. Nam ac leo orci. Aliquam malesuada justo vel eros venenatis, nec scelerisque sem tempus.

"""

# Подсчет слов и вывод наиболее часто встречающихся слов

word_counter = count_words(text)

most_common = most_common_words(word_counter)

print("Наиболее часто встречающиеся слова:")

for word, count in most_common:

print(f"{word}: {count}")

```

Этот код сначала подсчитывает количество встречаемости каждого слова в тексте, а затем выводит наиболее часто встречающиеся слова с их количеством встречаний.

Пояснения к коду:

1. Функция `count_words`:

– Эта функция принимает текст в качестве входного параметра и возвращает словарь, в котором ключами являются слова из текста, а значениями – количество раз, которое каждое слово встречается в тексте.

– Сначала текст приводится к нижнему регистру с помощью метода `lower`, чтобы учесть слова с разным регистром как одинаковые.

– Затем с помощью регулярного выражения `re.findall(r'\b\w+\b', text)` текст разбивается на слова, игнорируя знаки пунктуации.

– Функция возвращает объект `Counter`, который создается из списка слов. `Counter` – это подкласс словаря Python, который используется для эффективного подсчета хэшируемых объектов.

2. Функция `most_common_words`:

– Эта функция принимает объект `Counter` и возвращает список из `n` наиболее часто встречающихся элементов в порядке убывания частоты.

– По умолчанию `n` равно 10.

– Метод `most_common` объекта `Counter` используется для получения наиболее часто встречающихся элементов.

3. Пример текста:

– В тексте представлены несколько предложений для демонстрации работы кода.

4. Подсчет слов и вывод наиболее часто встречающихся слов:

– Сначала вызывается функция `count_words`, чтобы подсчитать количество встречаемости каждого слова в тексте.

– Затем вызывается функция `most_common_words`, чтобы получить список из 10 наиболее часто встречающихся слов.

– Затем эти слова выводятся вместе с их количеством встречаний.

Этот код позволяет анализировать текст и извлекать информацию о самых часто встречающихся словах в нем.

18. Задача определение настроения (тональности) текста.

В этой задаче мы будем анализировать текст и определять, является ли он позитивным, негативным или нейтральным.

Идея решения будет следующей:

1. Использовать библиотеку для анализа тональности текста, например, TextBlob или VADER (Valence Aware Dictionary and sEntiment Reasoner).

2. Провести анализ текста и получить его тональность.

3. Вывести результат анализа, указав настроение текста.

Пример кода на Python для решения этой задачи с использованием библиотеки TextBlob:

```python

from textblob import TextBlob

def analyze_sentiment(text):

# Создаем объект TextBlob для анализа текста

blob = TextBlob(text)

# Определяем тональность текста

sentiment = blob.sentiment.polarity

if sentiment > 0:

return "Позитивный"

elif sentiment < 0:

return "Негативный"

else:

return "Нейтральный"

# Пример текста

text = """

Этот фильм был ужасен. Я полностью разочарован.

"""

# Анализ тональности текста

sentiment = analyze_sentiment(text)

print("Настроение текста:", sentiment)

```

Этот код анализирует текст и определяет его тональность как позитивную, негативную или нейтральную. В данном примере текст считается негативным из-за использования отрицательных слов "ужасен" и «разочарован".

Пояснения к коду:

1. Импорт библиотеки TextBlob:

– На первой строке импортируется класс `TextBlob` из библиотеки `textblob`. `TextBlob` – это библиотека для анализа текста с открытым исходным кодом, которая предоставляет простой интерфейс для обработки текста и выполнения различных операций, таких как определение тональности.

Решаем задачи Python

Девис Джеймс

Шрифт:

Полезные ссылки

Контакты

Подпишитесь на рассылку: