Python Библиотеки. Джейд Картер

Читать онлайн.
Название Python Библиотеки
Автор произведения Джейд Картер
Жанр
Серия
Издательство
Год выпуска 2024
isbn



Скачать книгу

pandas as pd

      import matplotlib.pyplot as plt

      import seaborn as sns

      ```

      Здесь мы импортируем необходимые библиотеки. `pd` – это стандартное соглашение для обозначения библиотеки Pandas. `matplotlib.pyplot` используется для создания графиков, а `seaborn` – библиотека для стилизации графиков и добавления дополнительных функций визуализации.

      – Создание данных:

      ```python

      data = {'Имя': ['Анна', 'Борис', 'Виктория'],

      'Возраст': [25, 30, 22],

      'Город': ['Москва', 'Санкт-Петербург', 'Киев']}

      df = pd.DataFrame(data)

      ```

      Мы создаем простой DataFrame с тремя колонками: 'Имя', 'Возраст' и 'Город'. Эти данные представляют собой три записи с именами, возрастами и городами.

      Настраиваем стиль seaborn:

      ```python

      sns.set(style="whitegrid")

      ```

      Эта строка устанавливает стиль для графика с помощью библиотеки seaborn. Здесь мы выбрали стиль "whitegrid", который добавляет белую сетку на фоне графика.

      – Создаем гистограмму:

      ```python

      plt.figure(figsize=(8, 6))

      sns.histplot(df['Возраст'], bins=20, kde=True, color='skyblue')

      ```

      Здесь мы создаем гистограмму для столбца 'Возраст' из DataFrame. `figsize=(8, 6)` устанавливает размер графика. `bins=20` указывает количество столбцов в гистограмме. `kde=True` добавляет оценку плотности на гистограмму. `color='skyblue'` задает цвет графика.

      – Добавляем подписи и заголовок:

      ```python

      plt.xlabel('Возраст', fontsize=12)

      plt.ylabel('Частота', fontsize=12)

      plt.title('Гистограмма возрастов', fontsize=14)

      ```

      Эти строки добавляют подписи к осям и заголовок для улучшения понимания графика

      – Добавляем сетку:

      ```python

      plt.grid(axis='y', linestyle='–', alpha=0.7)

      ```

      Эта строка добавляет горизонтальную сетку для лучшей читаемости.

      – Показываем график:

      ```python

      plt.show()

      ```

      И наконец, эта строка отображает график.

      Этот код создает красивую гистограмму с данными о возрасте и демонстрирует базовые шаги визуализации данных с использованием библиотек Pandas, Matplotlib и Seaborn в Python.

      Pandas предоставляет эффективные инструменты для работы с табличными данными, что делает его широко используемым в анализе данных, машинном обучении и других областях. DataFrame позволяет легко выполнять множество операций, от фильтрации и группировки данных до визуализации результатов. Это делает Pandas мощным инструментом для аналитики и обработки данных в Python.

      Приведем примеры фильтрации, сортировки и агрегации данных с использованием библиотеки Pandas на основе предположимого DataFrame с информацией о людях:

      В этом примере мы использовали фильтрацию для выбора только тех записей, где возраст больше 25 лет.

      Здесь мы отсортировали DataFrame по столбцу 'Возраст' в порядке убывания.

      В данном примере мы использовали агрегацию для расчета среднего возраста и суммы зарплаты для каждого города.

      Эти примеры показывают базовые операции фильтрации, сортировки и агрегации данных с Pandas, которые могут быть полезны при работе с табличными данными.

2.3. Matplotlib

      Matplotlib – это библиотека для визуализации данных в языке программирования Python. Она предоставляет множество инструментов для создания различных типов графиков и диаграмм. Давайте рассмотрим несколько