FAQ
Поиск
#Python
#Программирование
#Анализ данных
#Машинное обучение

Анализ данных с помощью Python

3 дня (24 академических часа)
Краткая аннотация
На курсе слушатели изучат возможности популярных библиотек анализа данных и машинного обучения в Python, научатся предобрабатывать, анализировать и визуализировать данные, использовать библиотеки для решения типичных задач машинного обучения.

В курсе освещаются следующие темы: основные типы задач машинного обучения, работа в IDE Spyder и jupyterLab, типы данных и возможности их обработки библиотек numpy и pandas, визуализация данных при помощи matplotlib и seaborne, возможности библиотеки scikit-learn относительно решения типовых задач машинного обучения.
Целевая аудитория
Дата-аналитики

Начинающие специалисты, решающие задачи анализа данных и машинного обучения
Расписание открытых форматов курса
Стоимость обучения одного слушателя
12.07.2021
Очный формат — 22 500 ₽.

Дистанционный формат — 20 250 ₽.
Подробная программа курса
Введение

  • Преимущества и недостатки применения Python в анализе данных.
  • IDE Python для анализа данных. Основы использования Spyder и JupyterLab.

Обработка данных при помощи Numpy

  • Использование и особенности numpy. Массивы.
  • Операции с массивами и возможности индексирования массивов. Выборки массивов.
  • Возможности манипуляции данными в numpy. Выборки и генерация значений.

Обработка данных при помощи Pandas

  • Особенности и применение pandas.
  • Серии. Запросы и операции с сериями.
  • Датафреймы. Создание, операции, запросы и индексирование датафреймов.
  • Специфика манипуляции данными в pandas. Статистические функции, сводные таблицы, агрегация, генерация и выборка данных.

Использование matplotlib для отображения данных

  • Обзор архитектуры библиотеки matplotlib
  • Основы рисования, линейные, точечные графики, столбчатые диаграммы.
  • Гистограммы, тепловые карты, ящичковые диаграммы.
  • Возможности настройки графиков: отрисовка нескольких графиков в одном окне, настройка цветов и маркеров, заполнение легенды.

Использование seaborn для визуализации данных

  • Визуализация статистических отношений.
  • Визуализация категорированных.
  • Визуализация распределений датасетов.
  • Визуализация линейных отношений.
  • Одновременное отображение нескольких графиков
  • Настройки эстетических предпочтений

Машинное обучение при помощи scikit-learn

  • Ключевые концепты машинного обучения.
  • Предобработка данных при помощи sklearn. Структура классов трансформаций наборов данных sklean и их использование.
  • Обучение с учителем. Линейные регрессии и классификаторы.
  • Оверфиттинг и андерфиттинг. Кросс-валидация.
  • Методы оценки качества моделей.

Практическая часть курса

  • Загрузка данных из разных источников, очистка, предобработка, визуализация, выдвижение и проверка гипотез.
  • Решение задач регрессии и классификации.

Итоговое тестирование

  • В конце обучения на курсе проводится итоговая аттестация в виде теста или на основании оценок за практические работы, выполненных в процессе обучения.
Возможные форматы обучения и размеры групп
очно (до 15 слушателей)

дистанционно в составе очной группы (без ограничения числа подключений)

корпоративный формат (для групп от 10 до 45 слушателей)

Тренер курса

Беляев Александр Владимирович

Разработчик информационных систем, системный аналитик, аналитик данных
Ведёт 19 курсов в ЦЕСИНКОМ
Разработка на Python
Машинное обучение
Математическая оптимизация
Консалтинг
Специализация
Должность
Дополнительные услуги
Требуемый уровень предварительной подготовки
Высшее или среднее специальное образование. Слушатели должны быть знакомы с основными принципами работы в среде операционной системы MS Windows, обладать базовыми навыками программирования на языке Python и иметь представление об анализе данных и решении задач машинного обучения.
Траектории, в которые входит данный курс
Разработчик Python

Специалист по машинному обучению
Список курсов, требующихся для прохождения данного курса
Основы программирования на языке Python

Основы машинного обучения
Список курсов, которые дополняют данный курс
Глубокое погружение в программирование на языке Python

Анализ данных с использованием языка R

Основы Big Data

Разработка настольных приложений и интерфейса пользователя на языке Python

Python: Работа с базами данных

Разработка WEB-приложений на языке Python
Список категорий каталога, в которые включён курс
Построение систем принятия решений на основе данных (Big Data)

Анализ данных и машинное обучение

Применение языка Python
Разработка курса или траектории обучения под вашу задачу
Центр готов взять на себя разработку курсов и траекторий обучения под уже сформированную модель компетенций или просто под список знаний и навыков, которые нужно освоить специалистам организации.