IMG_719121312

Машинное обучение: от теории к практике

13 ноября 2019 года на площадке центра технического обслуживания Академпарка состоялся круглый стол на тему «Применение машинного обучения в ИТ продуктах». Событие состоялось благодаря Региональному Центру Инжиниринга «IVD-инжиниринг». Всего мероприятие посетило 17 представителей МСП.

В роли экспертов выступили: Анастасия Малышева (Data Scientist и Product Owner в LC Group, Data Science Master), Иван Бондаренко (Ведущий исследователь AI/NLP в МФТИ. Опыт работы: Data Monsters Russia, 2ГИС, GlobalLogic), Денис Бондаренко (Kraftway, BCS; Разработка решений по сбору и анализу данных для Росатом, Big Four и др. Руководитель ITMS, преподает в НГУ) и Буин Дылгыржап (Участник российской сборной команды по RL. Опыт работы: Eltex, Velvetech).

 

Открывающим докладом стала вводная лекция Анастасии Малышевой по технологии машинного обучения. Были разобраны основные понятия из сферы ML и Big Data, а также основные различия между ML и классическим программированием. Анастасия продемонстрировала на примерах типовых задач, какими преимуществами обладают нейронные сети по сравнению с линейными моделями и древами решений. 

На сегодняшний день, благодаря технологии ML, решаются задачи, связанные с кредитным скорингом, прогнозом спроса и планированием смен, контролем качества, прогнозом оттока и сегментацией клиентов, функционированием чат-ботов и виртуальных ассистентов, а также множеством других задач. 

— Наиболее важными факторами для эффективного машинного обучения являются культура работы с данными, рентабельная задача, данные и разметка для них, а также то, что задача должна быть решаемой, — прокомментировала Анастасия.

 

Выступление Ивана Бондаренко было посвящено применению машинного обучения для обработки естественного языка. Спикер рассказал, каким образом с помощью ML происходит анализ и понимание текстов на естественном языке, каким образом в машинном обучении реализуются распознавание именновых сущностей, классификация пользовательских намерений и анализ тональности высказывания. 

— Главная проблема при использовании этих механизмов — обязательное участие учителя, который должен на примере десятка тысяч текстовобучить систему взаимодействовать с естественным языком, — отметил Иван.

Решить эту проблему возможно методом переноса обучения на готовые системы: Word2vec, Elmo и Bert. Спикер рассказал о принципах и особенностях в работе каждой из систем, а также о том, какими достоинствами и недостатками обладает каждая из них.  

 

Денис Бондаренко в своем докладе осветил тему длинных и коротких трендов в машинном обучение (Data Mining, System Architecture, Rational Unified Process, Big Data, Data Flow Diagram). Спикер на собственных кейсах продемонстрировал возможности использования нотаций UML UC, UML Activity, UML Deployment, UML Class, UML Component Archimate, SDL и EPC. Выступление Дениса также коснулось темы различных видов СУБД и РСУБД.

 

В заключительном выступлении Буин Дылгыржап рассказал об обучении с подкреплением (Reinforcement Learning), о том, какие модели существуют, в каких областях примяются, а также примеры их реального использования. 

— Обучение с подкреплением является одним из методов машинного обучения, в ходе которого система взаимодействует с некоторой смоделированной средой, и в случае успешного действия получает вознаграждение и следующее состояние, — подчеркнул Буин.

Спикер рассказал о разных моделях обучения: Modal based, Modal free, On-policy и Off-policy. Обучение с подкреплением используется для создания искусственного интеллекта в играх: благодаря используемым алгоритмам система обучается в каждой партии и становится “умнее”, таким образом в 2017 году нейронная сеть AlphaGo выиграла у лучшего игра в Го. 

Размещено в Новости.