Шрифт:
Pandas предоставляет эффективные инструменты для работы с табличными данными, что делает его широко используемым в анализе данных, машинном обучении и других областях. DataFrame позволяет легко выполнять множество операций, от фильтрации и группировки данных до визуализации результатов. Это делает Pandas мощным инструментом для аналитики и обработки данных в Python.
Приведем примеры фильтрации, сортировки и агрегации данных с использованием библиотеки Pandas на основе предположимого DataFrame с информацией о людях:
В этом примере мы использовали фильтрацию для выбора только тех записей, где возраст больше 25 лет.
Здесь мы отсортировали DataFrame по столбцу 'Возраст' в порядке убывания.
В данном примере мы использовали агрегацию для расчета среднего возраста и суммы зарплаты для каждого города.
Эти примеры показывают базовые операции фильтрации, сортировки и агрегации данных с Pandas, которые могут быть полезны при работе с табличными данными.
Matplotlib – это библиотека для визуализации данных в языке программирования Python. Она предоставляет множество инструментов для создания различных типов графиков и диаграмм. Давайте рассмотрим несколько основных видов графиков и диаграмм, которые можно создать с помощью Matplotlib.
1. Линейный график
Линейный график подходит для визуализации зависимости одной переменной от другой. Рассмотрим пример:
```python
import matplotlib.pyplot as plt
# Создаем данные для примера
x = [1, 2, 3, 4, 5]
y = [10, 15, 7, 12, 9]
# Строим линейный график
plt.plot(x, y, marker='o', linestyle='-', color='b', label='Линейный график')
# Добавляем подписи и заголовок
plt.xlabel('X-ось')
plt.ylabel('Y-ось')
plt.title('Пример линейного графика')
plt.legend # Добавляем легенду
# Показываем график
plt.show
```
2. Гистограмма
Гистограмма используется для визуализации распределения данных. Пример:
```python
import matplotlib.pyplot as plt
import numpy as np
# Создаем данные для примера
data = np.random.randn(1000)
# Строим гистограмму
plt.hist(data, bins=30, color='skyblue', edgecolor='black')
# Добавляем подписи и заголовок
plt.xlabel('Значения')
plt.ylabel('Частота')
plt.title('Пример гистограммы')
# Показываем график
plt.show
```
3. Круговая диаграмма
Круговая диаграмма отображает доли от целого. Пример:
```python
import matplotlib.pyplot as plt
# Создаем данные для примера
sizes = [15, 30, 45, 10]
labels = ['Категория 1', 'Категория 2', 'Категория 3', 'Категория 4']
# Строим круговую диаграмму
plt.pie(sizes, labels=labels, autopct='%1.1f%%', startangle=90, colors=['skyblue', 'lightcoral', 'lightgreen', 'lightpink'])
# Добавляем заголовок
plt.title('Пример круговой диаграммы')
# Показываем график
plt.show
```
4. Диаграмма разброса
Диаграмма разброса отображает связь между двумя переменными. Пример:
```python
import matplotlib.pyplot as plt
import numpy as np
# Создаем данные для примера
x = np.random.randn(100)
y = 2 * x + np.random.randn(100)
# Строим диаграмму разброса
plt.scatter(x, y, color='green', alpha=0.7)
# Добавляем подписи и заголовок
plt.xlabel('X-ось')
plt.ylabel('Y-ось')
plt.title('Пример диаграммы разброса')
# Показываем график
plt.show
```
5. Столбчатая диаграмма
Столбчатая диаграмма хорошо подходит для сравнения значений различных категорий.
```python
import matplotlib.pyplot as plt
# Создаем данные для примера
categories = ['Категория 1', 'Категория 2', 'Категория 3', 'Категория 4']
values = [25, 40, 30, 20]
# Строим столбчатую диаграмму