Блог
FAQ

Глубокое обучение (нейронные сети) на Python часть 3. Анализ текстовых данных и обработка естественного языка

10 дней (80 академических часов).
Длительность:
г. Москва, Ленинградский просп., 68/24;
Место проведения:
05 сентября 2022; 21 ноября 2022
Дата проведения:
150 000 руб.
Стоимость:
Необходимые для зачисления в группу документы: паспорт, СНИЛС, диплом о высшем или среднем специальном образовании, заключенный договор об образовании.
Нейронные сети из теоретических научных исследований перешли в реальную жизнь, и анализ текста активно интегрируется в программные решения. Нейронные сети способны решать самые сложные задачи обработки естественного языка.

На курсе слушатели научатся применять методы машинного обучения для анализа текста в реальных задачах, используя возможности и библиотеки Python. От поиска модели и предварительной обработки данных к приемам классификации и кластеризации текстов, визуальной интерпретации, анализу графов, использованию глубокого обучения для анализа текста.



Описание курса
Целевая аудитория
Начинающие специалисты в области программирования, рассматривающие предмет как ступень к изучению Data Science, желающих продолжить знакомство с темой машинного обучения, с технологиями анализа текстовой информации.
Расписание открытых форматов курса
Стоимость обучения одного слушателя
05.09.2022; 21.11.2022
Очный формат — 150 000 ₽.
Дистанционный формат — 150 000 ₽.
В результате освоения курса вы:
понимать сложности компьютерной обработки естественного языка;
создавать собственный корпус данных;
предварительно обрабатывать и преобразовывать корпус данных;
создать приложения классификации текста;
проводить кластеризацию для выявления сходств в тексте;
проводить контекстно-зависимый анализ текста;
визуализировать текст;
применять графовые методы анализа текста;
создавать чат-боты.
что такое корпус;
как проводить трансформацию корпуса;
как распределяются слова в пространстве;
как создать приложение классификации текста;
как кластеризовать документы по сходству;
как провести контекстно-зависимый анализ текста;
как визуализировать пространство признаков;
как извлечь графы из текста;
где применимо обучение для рекомендаций.
Научитесь
Узнаете
Основная информация
05 сентября 2022
21 ноября 2022
пн–чт 10:00–17:30
150 000 руб.
м. Аэропорт,
Ленинградский проспект 68/24
Верхотуров Марк Валерьевич
Беляев Александр Владимирович
Порядок записи на курс
Консультация
Выбор курса
Заключение договора
Оплата обучения.
Подробная программа курса
1 Сложности компьютерной обработки естественного языка

2 Естественные языки и вычисления

2.1 Парадигма Data Science
2.2 Приложения данных, основанные на анализе естественного языка
2.3 Язык как данные

3 Создание собственного корпуса

3.1 Что такое корпус?
3.2 Управление корпусом данных
3.3 Объекты чтения корпусов

4 Предварительная обработка и преобразование корпуса

4.1 Разбивка документов
4.2 Трансформация корпуса

5 Конвейеры векторизации и преобразования

5.1 Слова в пространстве
5.2 Scikit-Learn API
5.3 Конвейеры

6 Классификация в текстовом анализе

6.1 Классификация текста.
6.2 Создание приложений классификации текста

7 Кластеризация для выявления сходств в тексте

7.1 Обучение на текстовых данных без учителя
7.2 Кластеризация документов по сходству
7.3 Моделирование тематики документов

8 Контекстно-зависимый анализ текста

8.1 Извлечение признаков на основе грамматики
8.2 Извлечение признаков на основе n-грамм
8.3 Модели языка n-грамм

9 Визуализация текста

9.1 Визуализация пространства признаков
9.2 Диагностика моделей
9.3 Визуальная настройка

10 Графовые методы анализа текста

10.1 Вычисление и анализ графов
10.2 Извлечение графов из текста
10.3 Разрешение сущностей

11 Чат-боты

11.1 Основы диалогового взаимодействия
11.2 Правила вежливой беседы
11.3 Занимательные вопросы
11.4 Обучение для рекомендаций

Возможные форматы обучения и размеры групп
очно (до 15 слушателей);
дистанционно в составе очной группы (без ограничения числа подключений);
корпоративный формат (для групп от 10 до 45 слушателей).
Документы об окончании
Удостоверение о повышении квалификации
Ответы на часто задаваемые вопросы
Какие форматы обучения?
Наши тренинги бывают «открытыми» и «корпоративными». В первом случае курсы предназначаются для всех желающих. Слушатели не выбирают программу и приходят в наш офис в заранее определенные даты.
«Корпоративные» курсы отличаются тем, что проводятся только для определенной группы от Заказчика. Он выбирает и время проведения занятий, и программу, которая может быть адаптирована для максимального соответствия потребностям.
Кто проводит обучение?
Авторы и ведущие наших курсов — признанные эксперты в своих областях. Это преподаватели, готовые передать свои знания и опыт широкому кругу слушателей. В свои программы они включают реальные примеры, поэтому каждый курс актуален в современных условиях.
Какой документ выдается после прохождения обучения?
Если были успешно пройдены кусы по повышению квалификации, выдается соответствующее Удостоверение. Это документ государственного образца, выпущенный на русском языке. Сведения о нем включаются в Федеральный реестр.
Можно ли перед заказом корпоративного обучения познакомиться с тренером или увидеть, как он проводит обучение?

Более подробно о программе и самом обучении можно узнать, задав вопросы тренеру онлайн или по телефону. Еще одна возможность получить представление о занятиях — посетить одно из них, проводимое в открытом формате.
Требуемый уровень предварительной подготовки
Опыт программирования на языке Python и знание основных библиотек Python для научных расчетов: Numpy, Pandas, Matplotlib. Понимание разделов математики: теория вероятности, статистика, математический анализ, линейная алгебра. Навыки работы с алгоритмами машинного обучения и начальные навыки работы с нейронными сетями (технологиями глубокого обучения).

Верхотуров Марк Валерьевич

Руководитель IT проектов, Разработчик Python, Data Scientist, ML-engineer
Разработка на Python
Сбор и анализ данных
Преобразование "сырых" данных в полезную информацию для бизнеса
Создание и обучение предиктивных моделей с помощью алгоритмов машинного обучения и нейросетей
Помощь бизнесу в нахождении скрытых закономерностей, прогнозировании развития событий и оптимизации ключевых бизнес-процессов
Консалтинг
Коучинг

Специализация
Должность
Дополнительные услуги

Тренер курса

Ведёт 13 курсов в ЦЕСИНКОМ

Беляев Александр Владимирович

Разработчик информационных систем, системный аналитик, аналитик данных
Разработка на Python
Машинное обучение
Математическая оптимизация
Консалтинг

Специализация
Должность
Дополнительные услуги

Тренер курса

Ведёт 19 курсов в ЦЕСИНКОМ
Разработка курса или траектории обучения под вашу задачу
Центр готов взять на себя разработку курсов и траекторий обучения под уже сформированную модель компетенций или просто под список знаний и навыков, которые нужно освоить специалистам организации.
Рекомендуемые курсы
Список курсов, которые дополняют данный курс
Список категорий каталога, в которые включён курс
Траектории, в которые входит данный курс
Список курсов, требующихся для прохождения данного курса