Блог
FAQ

Основы Data Science и Big Data, часть 2. Источники данных для анализа

5 дней (40 академических часов).
Длительность:
г. Москва, Ленинградский просп., 68/24;
Место проведения:
01 августа 2022; 05 декабря 2022
Дата проведения:
49 500 руб.
Стоимость:
Необходимые для зачисления в группу документы: паспорт, СНИЛС, диплом о высшем или среднем специальном образовании, заключенный договор об образовании.
Data Science (DS) — это совокупность понятий и методов, позволяющих придать смысл и понятный вид большим объемам данных. Междисциплинарная область Data Science на стыке статистики, математики, системного анализа и машинного обучения, которая охватывает все этапы работы с данными. Big Data или большие данные — это структурированные или неструктурированные массивы данных большого объема. Их обрабатывают при помощи специальных автоматизированных инструментов, чтобы использовать для статистики, анализа, прогнозов и принятия решений. Задачи работы в области Big Data составляют различные способы анализа и систематического извлечения больших объемов данных, что включает применение механических или алгоритмических процессов получения оперативной информации для решения сложных бизнес-задач.

На этом курсе слушатели познакомятся с некоторыми интересными вопросами data science: SQL-реляционные базы данных, NoSQL и ее отличие от реляционных баз данных, применение data science к потоковым данным, глубокий анализ текста и визуализация данных.

Описание курса
Целевая аудитория
Начинающие специалисты, решающие задачи получения, трансформации и выдачи данных.
Расписание открытых форматов курса
Стоимость обучения одного слушателя
01.08.2022; 05.12.2022
Очный формат — 49 500 ₽.
Дистанционный формат — 49 500 ₽.
В результате освоения курса вы:
использовать базы данных SQL;
использовать базы данных NoSQL;
понимать графовые базы данных;
понимать задачу глубокого анализа текста;
визуализировать данные для конечного пользователя.
как создать рабочую среду SQL;
как применять основные операции с таблицами;
чем отличаются понятия NoSQL, NewSQL;
какие есть принципы и типы данных NoSQL;
что такое связанные данные и графовые базы данных;
какие есть методы глубокого анализа текста;
как визуализировать данные для конечного пользователя.
Научитесь
Узнаете
Основная информация
01 августа 2022
05 декабря 2022
пн–чт 10:00–17:00
49 500 руб.
м. Аэропорт,
Ленинградский проспект 68/24
Верхотуров Марк Валерьевич
Беляев Александр Владимирович
Порядок записи на курс
Консультация
Выбор курса
Заключение договора
Оплата обучения.
Подробная программа курса
1 Базы данных SQL

● Введение в базы данных и SQL
● Создание рабочей среды
● Основные операции с таблицами
● Типы данных на примере СУБД PostreSQL
● Основы языка определения данных
● Запросы
● Изменение данных
● Индексы
● Транзакции
● Повышение производительности

2 Базы данных NoSQL

● Понятия NoSQL,NewSQL — отличия и особенности
● Принципы и типы баз данных NoSQL
● Пример использования. Диагностика болезней

3 Графовые базы данных

● Связанные данные и графовые базы данных
● Графовая база данных Neo4j. Язык запросов Cypher
● Пример использования связанных данных

4 Глубокий анализ текста

● Глубокий анализ текста
● Методы глубокого анализа текста
● Пример использования: Классификация сообщений

5 Визуализация данных для конечного пользователя

● Способы визуализации данных
● Crossfilter, библиотека MapReduce для JavaScript

Возможные форматы обучения и размеры групп
очно (до 15 слушателей);
дистанционно в составе очной группы (без ограничения числа подключений);
корпоративный формат (для групп от 10 до 15 слушателей).
Документы об окончании
Удостоверение о повышении квалификации
Ответы на часто задаваемые вопросы
Какие форматы обучения?
Мы проводим обучение в «открытом» и «корпоративном» форматах. «Открытые» курсы — это занятия для всех желающих, которые проходят в нашем офисе по определенной программе и установленному расписанию.
«Корпоративные» курсы — это обучение только сотрудников Заказчика. Он выбирает наиболее приемлемую дату. Программа может изменяться для максимального соответствия потребностям.
Кто проводит обучение?
Наши тренеры — практики с большим опытом работы в своих областях. Каждый преподаватель Центра — эксперт в определенном направлении деятельности. В своей работе наши тренеры используют испытанные временем методики для обучения широкого круга слушателей. Программы постоянно пополняются реальными примерами из практики. Благодаря этому каждый курс действительно актуален.
Какой документ выдается после прохождения обучения?
По окончании курсов слушатель получает документ государственного образца, удостоверение о повышении квалификации. Записи в документе сделаны на русском языке. Сведения о документе заносятся в ФИС ФРДО.

Можно ли перед заказом корпоративного обучения познакомиться с тренером или увидеть, как он проводит обучение?

Такая возможность предоставляется. Чтобы оценить работу тренера, можно посетить его занятие, проходящее в открытом формате. Кроме того, можно задать интересующие вопросы тренеру по телефону или в режиме онлайн. Они могут касаться в целом обучения и определенной программы.
Требуемый уровень предварительной подготовки
Слушатели должны быть знакомы с основными принципами работы в операционной системе, обладать базовыми навыками программирования на языке Python (или пройти обучение на курсах «Программирование на Python, часть 1» и «Программирование на Python, часть 2»), знать теоретические основы и характерные шаги процесса data science (или пройти обучение на курсе «Основы Data Science и Big Data часть 1».

Верхотуров Марк Валерьевич

Руководитель IT проектов, Разработчик Python, Data Scientist, ML-engineer
Разработка на Python.
Сбор и анализ данных. Преобразование "сырых" данных в полезную информацию для бизнеса.
Создание и обучение предиктивных моделей с помощью алгоритмов машинного обучения и нейросетей.
Помощь бизнесу в нахождении скрытых закономерностей, прогнозировании развития событий и оптимизации ключевых бизнес-процессов.
Консалтинг
Коучинг
Специализация
Должность
Дополнительные услуги

Тренер курса

Ведёт 13 курсов в ЦЕСИНКОМ

Беляев Александр Владимирович

Разработчик информационных систем, системный аналитик, аналитик данных
Разработка на Python
Машинное обучение
Математическая оптимизация
Консалтинг
Специализация
Должность
Дополнительные услуги

Тренер курса

Ведёт 19 курсов в ЦЕСИНКОМ
Разработка курса или траектории обучения под вашу задачу
Центр готов взять на себя разработку курсов и траекторий обучения под уже сформированную модель компетенций или просто под список знаний и навыков, которые нужно освоить специалистам организации.
Рекомендуемые курсы
Список курсов, которые дополняют данный курс
Список категорий каталога, в которые включён курс
Траектории, в которые входит данный курс
Список курсов, требующихся для прохождения данного курса
Основы семантического моделирования. Онтологии в организации компьютерных информационных систем

Язык запросов SPARQL для RDF-модели данных

Машинное обучение на Python, часть 1