ЗАКАЗАТЬ ЗВОНОК
Центр
системно-инженерных компетенций
Необходимые для зачисления в группу документы: паспорт, СНИЛС, диплом о высшем или среднем специальном образовании, заключенный договор об образовании.
49 500 руб.
Стоимость:
5 дней (40 академических часов).
Длительность:
г. Москва, Ленинградский просп., 68/24;
Место проведения:
25 декабря 2023; 12 февраля 2024; 25 марта 2024; 20 мая 2024; 18 ноября 2024;

Программирование на Python,
Pandas для Data Science

Дата проведения:
Pandas - популярная библиотека Python, применяющаяся для практического анализа данных в реальных проектах. Она предлагает воспользоваться эффективными, быстрыми и высокопроизводительными структурами данных, которые упрощают предварительную обработку и анализ информации.

На курсе слушатели рассмотрят работу с данными в библиотеке Pandas и изучат внушительный набор инструментов, предлагаемых библиотекой Pandas для выполнения различных операций с данными и их анализа.

Описание курса
Целевая аудитория
Начинающие специалисты в области программирования, рассматривающие предмет как ступень к изучению Data Science.

25.12.2023; 12.02.2024; 25.03.2024; 20.05.2024; 18.11.2024
Расписание открытых форматов курса
Дистанционный формат — 49 500 ₽.
Очный формат — 49 500 ₽.
Стоимость обучения одного слушателя
В результате освоения курса вы:
представлять одномерные данные с помощью объекта Series;
представлять табличные и многомерные данные с помощью объекта DataFrame;
выполнять операции над объектом DataFrame и его содержимым;
работать с индексами;
создавать и использовать категориальные данные;
применять численные методы к объектам библиотеки Pandas;
загружать и читать данные в различных форматах;
объединять, связывать и изменять формы данных;
агрегировать данные;
проводить анализ временных рядов с помощью Pandas;
создавать графики временных рядов
как создать объект Series и провести его модификацию;
как создать объект DataFrame;
как выполнить операции над объектом DataFrame;
какие есть типы индексов в библиотеке Pandas;
как вычислить описательные статистики для категориальной переменной;
как выполнить статистические операции с объектами библиотеки Pandas;
как читать и записывать в базу данных SQL;
как применить агрегирующие функции преобразований и фильтров;
как применить к временному ряду операции на основе скользящего окна;
как разместить несколько графиков на одном рисунке
Научитесь
Узнаете
Основная информация
12 февраля 2024
25 марта 2024
20 мая 2024
18 ноября 2024
23 декабря 2024
пн–чт 10:00–17:00
49 500 руб.
м. Аэропорт,
Ленинградский проспект 68/24
Верхотуров Марк Валерьевич
Беляев Александр Владимирович
Порядок записи на курс
Консультация
Выбор курса
Заключение договора
Оплата обучения.
очно (до 15 слушателей);
дистанционно в составе очной группы (без ограничения числа подключений);
корпоративный формат (для групп от 10 до 15 слушателей).
Возможные форматы обучения и размеры групп
1 Установка и использование библиотеки Pandas

2 Основные объекты библиотеки Pandas

2.1 Объект Series библиотеки Pandas
2.2 Объект DataFrame библиотеки Pandas
2.3 Объект Index библиотеки Pandas

3 Индексация и выборка данных

3.1 Выборка данных из объекта Series
3.2 Выборка данных из объекта DataFrame

4 Операции над данными в библиотеке Pandas

4.1 Универсальные функции: сохранение индекса
4.2 Универсальные функции: выравнивание индексов
4.3 Универсальные функции: выполнение операции между объектами DataFrame и Series

5 Обработка отсутствующих данных

5.1 Компромиссы при обозначении отсутствующих данных
5.2 Операции над пустыми значениями

6 Иерархическая индексация

6.1 Мультииндексированный объект Series
6.2 Методы создания мультииндексов
6.3 Индексация и срезы по мультииндексу
6.4 Перегруппировка мультииндексов
6.5 Агрегирование по мультииндексам

7 Объединение наборов данных: конкатенация и добавление в конец

7.1 Напоминание: конкатенация массивов NumPy
7.2 Простая конкатенация с помощью метода pd.concat

8 Объединение наборов данных: слияние и соединение

8.1 Реляционная алгебра
8.2 Виды соединений
8.3 Задание ключа слияния
8.4 Задание операций над множествами для соединений
8.5 Пересекающиеся названия столбцов: ключевое слово suffixes

9 Агрегирование и группировка

9.1 Данные о планетах
9.2 Простое агрегирование в библиотеке Pandas
9.3 GroupBy: разбиение, применение, объединение

10 Сводные таблицы

10.1 Данные для примеров работы со сводными таблицами
10.2 Сводные таблицы «вручную»
10.3 Синтаксис сводных таблиц

11 Векторизованные операции над строками

11.1 Знакомство со строковыми операциями библиотеки Pandas
11.2 Таблицы методов работы со строками библиотеки Pandas

12 Работа с временными рядами

12.1 Дата и время в языке Python
12.2 Временные ряды библиотеки Pandas: индексация по времени
12.3 Структуры данных для временных рядов библиотеки Pandas
12.4 Периодичность и смещения дат
12.5 Где найти дополнительную информацию

13 Увеличение производительности библиотеки Pandas: eval() и query()

13.1 Основания для использования функций query() и eval():
13.2 Составные выражения
13.3 Использование функции pandas.eval() для эффективных операций
13.4 Использование метода DataFrame.eval() для выполнения операций по столбцам
13.5 Метод DataFrame.query()
13.6 Производительность: когда следует использовать эти функции

14 Загрузка данных

14.1 Работа с CSV-файлами и текстовыми/табличными данными
14.2 Чтение и запись данных в формате Excel
14.3 Чтение и запись JSON-файлов
14.4 Чтение HTML-файлов из Интернета
14.5 Чтение и запись HDF5-файлов
14.6 Загрузка CSV-файлов из Интернета
14.7 Чтение из базы данных SQL, и запись в базу данных SQL
14.8 Загрузка данных с удаленных сервисов
Подробная программа курса
Документы об окончании
Удостоверение о повышении квалификации
Ответы на часто задаваемые вопросы
Требуемый уровень предварительной подготовки
Уверенное знание основ языка Python или прохождение курсов «Программирование на Python, части 1» и «Программирование на Python, часть 2»

Верхотуров Марк Валерьевич

Руководитель IT проектов, Разработчик Python, Data Scientist, ML-engineer
Разработка на Python
Сбор и анализ данных Преобразование "сырых" данных в полезную информацию для бизнеса
Создание и обучение предиктивных моделей с помощью алгоритмов машинного обучения и нейросетей
Помощь бизнесу в нахождении скрытых закономерностей, прогнозировании развития событий и оптимизации ключевых бизнес-процессов
Консалтинг
Коучинг
Специализация
Должность
Дополнительные услуги

Тренер курса

Ведёт 13 курсов в ЦЕСИНКОМ

Беляев Александр Владимирович

Разработчик информационных систем, системный аналитик, аналитик данных
Разработка на Python
Машинное обучение
Математическая оптимизация
Консалтинг
Специализация
Должность
Дополнительные услуги

Тренер курса

Ведёт 19 курсов в ЦЕСИНКОМ
Разработка курса или траектории обучения под вашу задачу
Центр готов взять на себя разработку курсов и траекторий обучения под уже сформированную модель компетенций или просто под список знаний и навыков, которые нужно освоить специалистам организации.