Раздел 1. Начало работы с Pandas:
- Установка Pandas в различных средах.
- Горячие клавиши и сокращения в Pandas.
- Отладка и обработка ошибок.
Раздел 2. Основы Pandas:
- Series: Одномерные массивы данных.
- DataFrame: Двумерные таблицы данных.
- Создание и загрузка данных: Чтение данных из CSV, Excel, JSON и других форматов.
Раздел 3. Фильтрация и выбор данных:
- Фильтрация: Использование условий для выбора строк и столбцов.
- Выбор: Извлечение подмножеств данных.
- Индексация: Работа с индексами для быстрого доступа к данным.
Раздел 4. Операции с данными:
- Агрегация: Функции sum(), mean(), count(), max(), min() и другие.
- Группировка: Группировка данных по одному или нескольким столбцам.
- Слияние и объединение: Объединение данных из разных источников.
Раздел 5. Обработка временных данных:
- Работа с датами: Функции для работы с датами и временем.
- Временные ряды: Анализ временных рядов.
Раздел 6. Визуализация данных:
- Графики и диаграммы: Построение графиков с помощью matplotlib и seaborn.
- Статистический анализ: Использование pandas для статистического анализа данных.
Раздел 7. Обработка отсутствующих данных:
- Заполнение пропусков: Методы заполнения пропущенных значений.
- Удаление выбросов: Работа с выбросами в данных.
Раздел 8. Работа с текстовыми данными:
- Текстовые манипуляции: Преобразование текстовых данных в числовые.
- Стемминг и лемматизация: Обработка текстовых данных для анализа.
Раздел 9. Продвинутые методы:
- Сводные таблицы: Создание сводных таблиц.
- Работа с большими данными: Использование HDF5 и других форматов для работы с большими данными.