ЗАКАЗАТЬ ЗВОНОК
Центр
системно-инженерных компетенций
Необходимые для зачисления в группу документы: паспорт, СНИЛС, диплом о высшем или среднем специальном образовании, заключенный договор об образовании.
150 000 руб.
Стоимость:
10 дней (80 академических часов).
Длительность:
г. Москва, Ленинградский просп., 68/24;
Место проведения:
05 февраля 2024; 18 марта 2024; 17 июня 2024; 02 сентября 2024
Дата проведения:

Глубокое обучение (нейронные сети) на Python часть 3. Анализ текстовых данных и обработка естественного языка

Нейронные сети из теоретических научных исследований перешли в реальную жизнь, и анализ текста активно интегрируется в программные решения. Нейронные сети способны решать самые сложные задачи обработки естественного языка.

На курсе слушатели научатся применять методы машинного обучения для анализа текста в реальных задачах, используя возможности и библиотеки Python. От поиска модели и предварительной обработки данных к приемам классификации и кластеризации текстов, визуальной интерпретации, анализу графов, использованию глубокого обучения для анализа текста.



Описание курса
Целевая аудитория
Начинающие специалисты в области программирования, рассматривающие предмет как ступень к изучению Data Science, желающих продолжить знакомство с темой машинного обучения, с технологиями анализа текстовой информации.
05.02.2024; 18.03.2024; 17.06.2024; 02.09.2024
Расписание открытых форматов курса
Дистанционный формат — 150 000 ₽.
Очный формат — 150 000 ₽.
Стоимость обучения одного слушателя
В результате освоения курса вы:
понимать сложности компьютерной обработки естественного языка;
создавать собственный корпус данных;
предварительно обрабатывать и преобразовывать корпус данных;
создать приложения классификации текста;
проводить кластеризацию для выявления сходств в тексте;
проводить контекстно-зависимый анализ текста;
визуализировать текст;
применять графовые методы анализа текста;
создавать чат-боты.
что такое корпус;
как проводить трансформацию корпуса;
как распределяются слова в пространстве;
как создать приложение классификации текста;
как кластеризовать документы по сходству;
как провести контекстно-зависимый анализ текста;
как визуализировать пространство признаков;
как извлечь графы из текста;
где применимо обучение для рекомендаций.
Научитесь
Узнаете
Основная информация
05 февраля 2024
18 марта 2024
17 июня 2024
02 сентября 2024
пн–чт 10:00–17:30
150 000 руб.
м. Аэропорт,
Ленинградский проспект 68/24
Верхотуров Марк Валерьевич
Беляев Александр Владимирович
Порядок записи на курс
Консультация
Выбор курса
Заключение договора
Оплата обучения.
Подробная программа курса
1 Сложности компьютерной обработки естественного языка

2 Естественные языки и вычисления

2.1 Парадигма Data Science
2.2 Приложения данных, основанные на анализе естественного языка
2.3 Язык как данные

3 Создание собственного корпуса

3.1 Что такое корпус?
3.2 Управление корпусом данных
3.3 Объекты чтения корпусов

4 Предварительная обработка и преобразование корпуса

4.1 Разбивка документов
4.2 Трансформация корпуса

5 Конвейеры векторизации и преобразования

5.1 Слова в пространстве
5.2 Scikit-Learn API
5.3 Конвейеры

6 Классификация в текстовом анализе

6.1 Классификация текста.
6.2 Создание приложений классификации текста

7 Кластеризация для выявления сходств в тексте

7.1 Обучение на текстовых данных без учителя
7.2 Кластеризация документов по сходству
7.3 Моделирование тематики документов

8 Контекстно-зависимый анализ текста

8.1 Извлечение признаков на основе грамматики
8.2 Извлечение признаков на основе n-грамм
8.3 Модели языка n-грамм

9 Визуализация текста

9.1 Визуализация пространства признаков
9.2 Диагностика моделей
9.3 Визуальная настройка

10 Графовые методы анализа текста

10.1 Вычисление и анализ графов
10.2 Извлечение графов из текста
10.3 Разрешение сущностей

11 Чат-боты

11.1 Основы диалогового взаимодействия
11.2 Правила вежливой беседы
11.3 Занимательные вопросы
11.4 Обучение для рекомендаций

Возможные форматы обучения и размеры групп
очно (до 15 слушателей);
дистанционно в составе очной группы (без ограничения числа подключений);
корпоративный формат (для групп от 10 до 45 слушателей).
Документы об окончании
Удостоверение о повышении квалификации
Ответы на часто задаваемые вопросы
Требуемый уровень предварительной подготовки
Опыт программирования на языке Python и знание основных библиотек Python для научных расчетов: Numpy, Pandas, Matplotlib. Понимание разделов математики: теория вероятности, статистика, математический анализ, линейная алгебра. Навыки работы с алгоритмами машинного обучения и начальные навыки работы с нейронными сетями (технологиями глубокого обучения).

Верхотуров Марк Валерьевич

Руководитель IT проектов, Разработчик Python, Data Scientist, ML-engineer
Разработка на Python
Сбор и анализ данных
Преобразование "сырых" данных в полезную информацию для бизнеса
Создание и обучение предиктивных моделей с помощью алгоритмов машинного обучения и нейросетей
Помощь бизнесу в нахождении скрытых закономерностей, прогнозировании развития событий и оптимизации ключевых бизнес-процессов
Консалтинг
Коучинг

Специализация
Должность
Дополнительные услуги

Тренер курса

Ведёт 13 курсов в ЦЕСИНКОМ

Беляев Александр Владимирович

Разработчик информационных систем, системный аналитик, аналитик данных
Разработка на Python
Машинное обучение
Математическая оптимизация
Консалтинг

Специализация
Должность
Дополнительные услуги

Тренер курса

Ведёт 19 курсов в ЦЕСИНКОМ
Разработка курса или траектории обучения под вашу задачу
Центр готов взять на себя разработку курсов и траекторий обучения под уже сформированную модель компетенций или просто под список знаний и навыков, которые нужно освоить специалистам организации.
Рекомендуемые курсы
Список курсов, которые дополняют данный курс
Список категорий каталога, в которые включён курс
Траектории, в которые входит данный курс
Список курсов, требующихся для прохождения данного курса