Центр
системно-инженерных компетенций
ЗАКАЗАТЬ ЗВОНОК

Программирование на Python,
Pandas для Data Science

5 дней (40 академических часов).
Длительность:
г. Москва, Ленинградский просп., 68/24;
Место проведения:
18 июля 2022; 22 августа 2022; 26 декабря 2022
Дата проведения:
49 500 руб.
Стоимость:
Необходимые для зачисления в группу документы: паспорт, СНИЛС, диплом о высшем или среднем специальном образовании, заключенный договор об образовании.
Pandas - популярная библиотека Python, применяющаяся для практического анализа данных в реальных проектах. Она предлагает воспользоваться эффективными, быстрыми и высокопроизводительными структурами данных, которые упрощают предварительную обработку и анализ информации.

На курсе слушатели рассмотрят работу с данными в библиотеке Pandas и изучат внушительный набор инструментов, предлагаемых библиотекой Pandas для выполнения различных операций с данными и их анализа.

Описание курса
Целевая аудитория
Начинающие специалисты в области программирования, рассматривающие предмет как ступень к изучению Data Science.

Расписание открытых форматов курса
Стоимость обучения одного слушателя
18.07.2022; 22.08.2022; 26.12.2022
Очный формат — 49 500 ₽.
Дистанционный формат — 49 500 ₽.
В результате освоения курса вы:
представлять одномерные данные с помощью объекта Series;
представлять табличные и многомерные данные с помощью объекта DataFrame;
выполнять операции над объектом DataFrame и его содержимым;
работать с индексами;
создавать и использовать категориальные данные;
применять численные методы к объектам библиотеки Pandas;
загружать и читать данные в различных форматах;
объединять, связывать и изменять формы данных;
агрегировать данные;
проводить анализ временных рядов с помощью Pandas;
создавать графики временных рядов
как создать объект Series и провести его модификацию;
как создать объект DataFrame;
как выполнить операции над объектом DataFrame;
какие есть типы индексов в библиотеке Pandas;
как вычислить описательные статистики для категориальной переменной;
как выполнить статистические операции с объектами библиотеки Pandas;
как читать и записывать в базу данных SQL;
как применить агрегирующие функции преобразований и фильтров;
как применить к временному ряду операции на основе скользящего окна;
как разместить несколько графиков на одном рисунке;
Научитесь
Узнаете
Основная информация
18 июля 2022
22 августа 2022
26 декабря 2022
пн–чт 10:00–17:00
49 500 руб.
м. Аэропорт,
Ленинградский проспект 68/24
Верхотуров Марк Валерьевич
Беляев Александр Владимирович
Порядок записи на курс
Консультация
Выбор курса
Заключение договора
Оплата обучения.
Подробная программа курса
1 Библиотека pandas и анализ данных

1.1 Знакомство с библиотекой Pandas
1.2 Обработка данных, анализ, наука и библиотека Pandas
1.3 Процесс анализа данных
1.4 Понятие «данные» и «анализ» в контексте библиотеки Pandas
1.5 Другие библиотеки, работающие с Pandas

2 Представление одномерных данных с помощью объекта Series

2.1 Создание объекта Series
2.2 Свойства index и values
2.3 Размер и форма Series
2.4 Установка индекса во время создания объекта Series
2.5 Использование методов head(), tail() и take() для вывода значений
2.6 Получение значений в объекте Series по метке или позиции
2.7 Создание срезов объекта Series
2.8 Выравнивание данных по меткам индекса
2.9 Выполнение логического отбора
2.10 Переиндексация объекта Series
2.11 Модификация объекта Series на месте

3 Представление табличных и многомерных данных с помощью объекта DataFrame

3.1 Создание объектов DataFrame
3.2 Доступ к данным внутри объекта DataFrame
3.3 Логический отбор строк
3.4 Одновременный отбор строк и столбцов

4 Выполнение операций над объектом DataFrame и его содержимым

4.1 Переименование столбцов
4.2 Добавление новых столбцов с помощью оператора [ ] и метода insert
4.3 Добавление столбцов за счет расширения датафрейма
4.4 Добавление столбцов с помощью конкатенации
4.5 Переупорядочивание столбцов
4.6 Замена содержимого столбца
4.7 Удаление столбцов
4.8 Присоединение новых строк
4.9 Конкатенация строк
4.10 Добавление и замена строк за счет расширения датафрейма
4.11 Удаление строк с помощью метода drop()
4.12 Удаление строк с помощью логического отбора
4.13 Удаление строк с помощью среза

5 Индексация данных

5.1 Важность применения индексов
5.2 Типы индексов библиотеки Pandas
5.3 Работа с индексами
5.4 Преобразование данных в индекс и получение данных из индекса
5.5 Иерархическая индексация

6 Категориальные данные

6.1 Создание категориальных переменных
6.2 Переименование категорий
6.3 Добавление категорий
6.4 Удаление категорий
6.5 Вычисление описательных статистик для категориальной переменной

7 Численные и статистические методы

7.1 Применение численных методов к объектам библиотеки Pandas
7.2 Выполнение арифметических операций над объектами DataFrame и Series
7.3 Вычисление количества значений
7.4 Определение уникальных значений (и их встречаемости)
7.5 Вычисление минимума и максимума
7.6 Вычисление n наименьших значений и n наибольших значений
7.7 Вычисление накопленных значений
7.8 Выполнение статистических операций с объектами библиотеки pandas
7.9 Получение итоговых описательных статистик
7.10 Измерение центральной тенденции: среднее, медиана и мода
7.11 Вычисление дисперсии и стандартного отклонения
7.12 Вычисление ковариации и корреляции
7.13 Дискретизация и квантилизация данных
7.14 Вычисление ранга значений
7.15 Вычисление процентного изменения для каждого наблюдения серии
7.16 Выполнение операций со скользящим окном
7.17 Создание случайной выборки данных

8 Загрузка данных

8.1 Работа с CSV-файлами и текстовыми/табличными данными
8.2 Чтение и запись данных в формате Excel
8.3 Чтение и запись JSON-файлов
8.4 Чтение HTML-файлов из Интернета
8.5 Чтение и запись HDF5-файлов
8.6 Загрузка CSV-файлов из Интернета
8.7 Чтение из базы данных SQL, и запись в базу данных SQL
8.8 Загрузка данных с удаленных сервисов

9 Приведение данных в порядок

9.1 Что такое приведение данных в порядок
9.2 Как работать с пропущенными данными
9.3 Обработка дублирующихся данных
9.4 Преобразование данных

10 Объединение, связывание и изменение формы данных

10.1 Конкатенация данных, расположенных в нескольких объектах
10.2 Слияние и объединение данных
10.3 Поворот данных для преобразования значений в индексы и наоборот
10.4 Преимущества использования состыкованных данных

11 Агрегирование данных

11.1 Обзор схемы «разделение - применение — объединение»
11.2 Данные для примеров
11.3 Разделение данных
11.4 Применение агрегирующих функций, преобразований и фильтров

12 Анализ временных рядов

12.1 Представление дат, времени и интервалов
12.2 Введение во временные ряды
12.3 Вычисление новых дат с помощью смещений
12.4 Представление промежутков времени с помощью объектов Period
12.5 Обработка праздников с помощью календарей
12.6 Нормализация временных меток с помощью часовых поясов
12.7 Операции с временными рядами
12.8 Применение к временному ряду операций на основе скользящего окна

13 Визуализация

13.1 Основные инструменты визуализации
13.2 Создание графиков временных рядов
13.3 Виды графиков, часто использующихся в статистическом анализе данных
13.4 Размещение нескольких графиков на одном рисунке вручную

Возможные форматы обучения и размеры групп
очно (до 15 слушателей);
дистанционно в составе очной группы (без ограничения числа подключений);
корпоративный формат (для групп от 10 до 15 слушателей).
Документы об окончании
Удостоверение о повышении квалификации
Ответы на часто задаваемые вопросы
Какие форматы обучения?
Мы предлагаем курсы в двух форматах. Один из них — «открытое» обучение. Присутствовать на таких занятиях может любой, кто желает повысить свою компетентность по предложенному направлению. Приходить нужно в наш офис в соответствии с расписанием.
Обучение также проводится в «корпоративном» формате. Оно ведется по выбранной Заказчиком программе в удобные для него даты. Курсы проходит исключительно группа от Заказчика. В программу могут быть внесены изменения, чтобы она максимально отвечала конкретным потребностям.
Кто проводит обучение?
Занятия проходят под руководством опытных тренеров. Это эксперты в соответствующих направлениях деятельности. Уровень знаний и опыта помогает нашим преподавателям передать прочные знания и актуальные практические навыки слушателям, посещающим курсы.
Какой документ выдается после прохождения обучения?
Удостоверение о повышении квалификации — документ, который выдается после прохождения такой программы. Это документ государственного образца, изданный на русском языке. Данные о нем включаются в ФИС ФРДО.

Можно ли перед заказом корпоративного обучения познакомиться с тренером или увидеть, как он проводит обучение?

Чтобы оценить профессионализм нашего тренера, можно поприсутствовать на его открытом тренинге. Предоставляется также возможность пообщаться с преподавателем по телефону или онлайн. Во время беседы можно задать интересующие вопросы и обсудить программу обучения.
Требуемый уровень предварительной подготовки
Уверенное знание основ языка Python или прохождение курсов «Программирование на Python, части 1» и «Программирование на Python, часть 2»

Верхотуров Марк Валерьевич

Руководитель IT проектов, Разработчик Python, Data Scientist, ML-engineer
Разработка на Python
Сбор и анализ данных Преобразование "сырых" данных в полезную информацию для бизнеса
Создание и обучение предиктивных моделей с помощью алгоритмов машинного обучения и нейросетей
Помощь бизнесу в нахождении скрытых закономерностей, прогнозировании развития событий и оптимизации ключевых бизнес-процессов
Консалтинг
Коучинг
Специализация
Должность
Дополнительные услуги

Тренер курса

Ведёт 13 курсов в ЦЕСИНКОМ

Беляев Александр Владимирович

Разработчик информационных систем, системный аналитик, аналитик данных
Разработка на Python
Машинное обучение
Математическая оптимизация
Консалтинг
Специализация
Должность
Дополнительные услуги

Тренер курса

Ведёт 19 курсов в ЦЕСИНКОМ
Разработка курса или траектории обучения под вашу задачу
Центр готов взять на себя разработку курсов и траекторий обучения под уже сформированную модель компетенций или просто под список знаний и навыков, которые нужно освоить специалистам организации.