Обучение

Консультация
Консультируем с 8:30 до 19:00Выходной: суббота и воскресенье


Сообщение об ошибке

Обучение

Сообщение об ошибке

Основы Data Science

Профессиональный курс

Курс по Data Science направлен на приобретение знаний, навыков и умений по извлечению, структурированию и использованию полезной информации из неструктурированных, а также разрозненных источников. Он охватывает основные современные средства Data Mining, Machine Learning и Big Data. Использование указанных технологий даёт неоспоримое преимущество не только организациям на рынке товаров и услуг, но и людям на рынке труда.

Описание курса

Формы обучения

Вечерняя / Дистанционная, Минск

13.10.2020 - Осталось: 15 дней
Офлайн или онлайн занятия по расписанию:
два раза в неделю с 18.30 до 21.20
Подходящий формат Вы выбираете сами!
Тренер Владислав Сташевский, Data Scientist/Project Manager, Минск
2499 BYN
216 уч.ч (шесть месяцев)
Рассрочка шесть выплат 459 BYN/ месяц

При подаче заявки укажите, хотите ли Вы
посещать занятия в аудитории
или подключаться дистанционно
В группе конкурс.
Условия по телефону +375 (44) 570-22-22
№ группы: Mk-DS1-06-20

Условия отбора

Зачисление на курс производится на конкурсной основе по результатам:

  • теста по английскому языку;

  • решения задач на языке программирования Python;

  • устного собеседования с преподавателем на знание основ математики.

Для кого этот курс

  • для разработчиков, желающих расширить свои компетенции;

  • для студентов старших курсов и выпускников технических ВУЗов, которые хотят повысить свои шансы на трудоустройство;

  • для аспирантов и соискателей научных степеней, желающих приобрести навыки решения научных и исследовательских задач с использованием современных информационных технологий;

  • для специалистов, желающих повысить свою компетенцию в области Data Mining, Big Data и Data Science.

Необходимая подготовка

Для чего этот курс

Курс предназначен для: 

  • приобретения знаний в областях Data Mining, Big Data и Data Science;

  • формирования устойчивых навыков и умений по постановке и решению аналитических и исследовательских задач с использованием математической статистики и современных информационных технологий, а также разработки информационных рекомендательных систем.

Вы будете уметь

  • осуществлять сбор, обобщение и очистку исходных информационных данных;

  • находить аналитические зависимости в структурированных и неструктурированных данных;

  • осуществлять постановку и решение задач математического программирования и исследования операций;

  • знать и уметь применять основные алгоритмы машинного обучения и математического программирования;

  • знать, как работает Machine Learning;

  • уметь пользоваться основными инструментами Data Mining, Big Data и Data Science;

  • знать основные типы и архитектуру нейронных сетей;

  • реализовывать, внедрять и обучать Machine Learning модели;

  • решать задачи Computer Vision, Natural Language Toolkit, а также прогнозирования временных рядов;

  • знать концепции Map Reduce и CUDA;

  • знать принципы функционирования высоконагруженных систем;

  • разрабатывать рекомендательные системы.

Программа курса

  1. Введение в Data Science
    Объект Data Science.
    Взаимосвязь Data Mining, Big Data и Data Science.
    Инструментарий Data Science.
    Основные способы получения данных.
    Базовый эксплоративный анализ и визуализация данных.
  2. Математические основы Data Science
    Основы матричного исчисления.
    Реализация матричных операций в Python.
    Основы теории вероятности и математической статистики.
    Проверка статистических гипотез в Python.
    Основы математического программирования и исследования операций.
    Классификация алгоритмов математического программирования.
    Визуализация данных в Python.
  3. Основы Data Science и Machine Learning
    Принципы построения моделей в Data Science.
    Метрики качества моделей. Проверка качества модели.
    Введение в Deep Learning и Machine learning.
    Объект Deep Learnig и Machine Learning. Классы решаемых задач.
    Большие данные и параллельные вычисления.
    Подходы к построению высоконагруженных систем.
    Обобщение и сбор данных для обучения их очистка и нормализация.
    Обзор и классификация алгоритмов ML.
  4. Основные алгоритмы Machine Learning
    Алгоритмы «Дерево решений», «Случайный лес», «K-ближайших соседей», «Градиентный бустинг».
    Кластеризация и поиск ассоциаций.
    Линейная и логистическая регрессия. Ограничения, преимущества и недостатки.
    Обучение с учителем.
    Обучение классификатора на размеченных данных.
    Проверка качества модели: переобучение, регуляризация, обучающая и тестовая выборки.
    Борьба с переобучением: ансамблирование. Обзор методов ансамблирования.
    Реализация алгоритмов в Python.
  5. Методы предобработки данных
    Снижение размерности, разреженные данные, многомерные пространства.
    Коррелирующие параметры.
    Нерациональное использование памяти, сложность моделей.
    Статистический анализ данных, выбор параметров на основе корреляции.
    Снижение размерности данных: поиск подмножеств, регуляризация, уменьшение пространства.
    Векторное разложение.
    Методы декомпозиции.
    Спрямляющие пространства.
  6. Рекомендательные системы
    Введение в рекомендательные системы.
    Различие между предсказаниями и рекомендациями.
    Типы рекомендательных систем.
    Постановка целей.
    Неперсонализированные рекомендации.
    Способы построения рекомендательных систем.
    Цепи Маркова.
    Групповые рекомендации.
  7. Распознавание изображений, машинное зрение
    Теоретические основы обработки изображений.
    Форматы данных (RGB, CMYK, B&W), принципы и алгоритмы сжатия изображений, примеры чтения и конвертации изображений.
    Выделение признаков изображений.
    Задача поиска изображения по шаблону, представление свойств изображения с помощью гистограмм.
    Поиск похожих картинок по контенту.
    Сегментация изображений, детекция объектов.
    Детектор лиц на изображении.
  8. Введение в нейронные сети
    Основные элементы нейронных сетей.
    Классификация архитектур нейронных сетей.
    Обучение: функция потерь, обратное распространение ошибки, стохастический градиент.
    Регуляризация.
    Инициализация весов.
    Сверточные нейронные сети.
    Практическое применение сверточных рекурентных и генеративно-конкурирующих сетей в задачах Computer Vision.
  9. Распознавание естественного языка
    Введение в обработку текста.
    Частотный анализ.
    Законы Ципфа и Хипса.
    Морфологический и синтаксический анализ.
    Векторная модель и методы снижения размерности в ней.
    Классификация текстов.
    Извлечение именованных сущностей.
    Языковые модели.
    Извлечение информации.
    Генерация текстов.
  10. Временные ряды
    Временные ряды.
    Модели построения прогнозов.
    Разложение временного ряда на компоненты.
    Автокорреляция и корелограммы.
    Стационарность ряда.
    Сложные модели прогнозирования.
    Прогнозирование временных рядов на цепях Маркова.
  11. Общение с заказчиком. Требования к Data Science проектам
    Cпособы выяснения требований, проверка их выполнимости.
    Формализация и утверждение требований с заказчиком.
    Общий порядок составления отчетов.
    Цели, явные и неявные ожидания заказчиков проекта.
    Описание зависимостей и способов воздействия на важные для заказчика факторы.
    Практический опыт создания хайлоад моделей.
    Выбор алгоритмов, библиотек, тонкой настройки моделей.
  12. Подведение итогов
    Защита дипломных проектов.

Трудоустройство выпускников

IT-Academy не только обучает, но и помогает слушателям, нацеленным на результат, найти работу. Выпускники курса «Основы Data Science» участвуют в «Программе трудоустройства», с помощью которой можно получить заветную должность практически в любой IT-компании!

Преподаватели курса

  • Роман Сидоренко

    Опыт работы: 8 лет

    Специальность:
    Data Science

    Сфера интересов: С++, Python, MathCard, Mathlab, Wolfram, LPsolve, Statistica, SPSS, R, Computer vision, OpenCv, Apache, Hadoop, Django, Keras, PyAlgoTrade, Machine Learning, Deep Learning, Nltk, NLP, Fasttext, CUDA, Map Reduce ,Cafee, Pytorch, SciPy, NumPy, SkyKit, Theano, Xgboost, libffm.

    Узнать больше
  • Николай Кухальский

    Опыт работы: c 2015 года

    Специальность:
    Data Science

    Сфера интересов: Python, MathCad, Mathlab, Wolfram, Statistica, SPSS, Computer vision, OpenCv, Keras, Machine, Learning, Deep Learning, Nltk, NLP, Fasttext, CUDA, Pytorch, SciPy, NumPy, SkyKit, Xgboost, CatBoost.

    Узнать больше
  • Владислав Сташевский

    Опыт работы: c 2015 года

    Специальность:
    Data Science

    Сфера интересов: Data Science для бизнес-решений, анализ и прогнозирование временных рядов, оценка рисков финансовых инструментов, стохастическое моделирование процессов для бизнеса и финансового сектора, управление командой разработчиков Data Science подразделения.

    Узнать больше

Роман Сидоренко

Специальность:Data Science
Опыт работы:8 лет

Сфера интересов: С++, Python, MathCard, Mathlab, Wolfram, LPsolve, Statistica, SPSS,  R,  Computer vision,  OpenCv, Apache, Hadoop,  Django, Keras, PyAlgoTrade, Machine Learning,  Deep Learning, Nltk, NLP, Fasttext, CUDA, Map Reduce ,Cafee, Pytorch, SciPy, NumPy, SkyKit, Theano, Xgboost, libffm.

Профессиональный путь: В 2005 закончил году Военную Академию Республики Беларусь по специальности «инженер по радио и спутниковым телекоммуникациям». В 2010 году закончил магистратуру этой же академии с присвоением степени магистра технических наук.

С 2011 года занимаюсь научной и исследовательской работой в Научно-исследовательском институте Вооруженных Сил Республики Беларусь. Профессиональная область: разработка и сопровождение, создания и модернизации технических и организационно-технических систем различного назначения.

В 2016 году назначен начальником научно-исследовательского отдела обеспечения геопространственной информацией государственного учреждения «Научно-исследовательский институт Вооруженных Сил Республики Беларусь». 

В 2017 году защитил диссертацию в государственном учреждении «Научно-исследовательский институт Вооруженных Сил Республики Беларусь» с присвоением ученой степени кандидат военных наук.

Мною опубликовано более 20 научных работ, получено 2 патента. В настоящее время присвоено воинское звание подполковник.

Особенности преподавания: Образовательный курс нацелен на приобретение слушателями знаний, умений и навыков, достаточных для самостоятельного улучшения различных процессов, протекающих в бизнес-среде, предприятиях и организациях, с дальнейшей возможностью создания соответствующего enterprise решения или программного продукта.

В современных информационных технологиях повсеместно используются данные об управляющем объекте или процессе. С учетом того, что из года в год объём этих данных увеличивается, а скорость их восприятия человеком относительно постоянна, конкурентные преимущества имеет тот, кто лучше и быстрее извлекает полезную для него информацию. Применение методологии Data Science в программном продукте позволяет значительно повысить его качество и эффективность, что приводит к увеличению прибыли и сокращению затрат организации. Потому руководители предприятия или организации готовы платить немалые деньги тем, кто знает Data Science и умеет  воплощать ее методологию в жизнь.

Для успешного освоения курса слушателям необходимо иметь знания высшей математики на уровне 1-2 курса технического или математического высшего учебного заведения, а также владеть начальными навыками программирования, преимущественно на языке Python.

Николай Кухальский

Специальность:Data Science
Опыт работы:c 2015 года

Сфера интересов: Python, MathCad, Mathlab, Wolfram, Statistica, SPSS, Computer vision, OpenCv, Keras, Machine, Learning, Deep Learning, Nltk, NLP, Fasttext, CUDA, Pytorch, SciPy, NumPy, SkyKit, Xgboost, CatBoost.

Профессиональный путь: В 2005 году окончил Военную академию Республики Беларусь по специальности «Инженер по телекоммуникациям, радиоконтроль и противодействие». В 2008 году прошел адъюнктуру этой же академии. С 2008 года занимался научной и исследовательской работой в центре пограничных исследований ГУО «Институт пограничной службы Республики Беларусь». 

В 2010 году защитил диссертацию в УО «Военная академия Республики Беларусь» с присвоением ученой степени кандидат технических наук. 

С 2018 года член государственного экспертного совета «Безопасность человека, общества и государства» Государственного комитета по науке и технологиям Республики Беларусь.

С 2019 года доцент кафедры ГУО «Институт пограничной службы Республики Беларусь». В июне 2020 года присвоено ученое звание доцент по специальности «Радиотехника и связь». 

С августа 2020 года профессор кафедры ГУО «Институт пограничной службы Республики Беларусь». Профессиональная область: разработка, сопровождение, модернизации технических систем различного назначения. Анализ технологических процессов. Мною опубликовано более 20 научных работ, 5 учебных пособий.

Особенности преподавания: Образовательный курс нацелен на приобретение слушателями знаний, умений и навыков, достаточных для самостоятельного улучшения различных процессов, протекающих в бизнес-среде, предприятиях и организациях, с дальнейшей возможностью выработки соответствующего решения или программного продукта, а также осуществления анализа технологических процессов и выработки необходимых рекомендаций.

Data Scientist – специалист по данным, занимающийся интеллектуальным анализом структурированных и неструктурированных данных. Использует статистику, машинное обучение и продвинутые методы предиктивной аналитики для решения ключевых бизнес-задач. Специалист по данным должен не только уметь анализировать полученную информацию, но и обладать отличными навыками программирования, уметь разрабатывать новые алгоритмы, обрабатывать большие объемы информации и иметь хорошее представление о той сфере, в которой он применяет свои знания. 

Применение методологии Data Science в программном продукте позволяет значительно повысить его качество и эффективность, что приводит к увеличению прибыли и сокращению затрат организации. Поэтому руководители предприятия или организации готовы платить немалые деньги тем, кто является специалистом Data Science и умеет воплощать ее методологию в жизнь. 

Для успешного освоения курса слушателям необходимо иметь знания высшей математики на уровне 1-2 курса технического или математического высшего учебного заведения, а также владеть начальными навыками программирования, преимущественно на языке Python.



Владислав Сташевский

Специальность:Data Science
Опыт работы:c 2015 года

Сфера интересов: Data Science для бизнес-решений, анализ и прогнозирование временных рядов, оценка рисков финансовых инструментов, стохастическое моделирование процессов для бизнеса и финансового сектора, управление командой разработчиков Data Science подразделения.

Профессиональный путь: В 2016 году окончил экономический факультет БГУ, а через год – магистратуру по специальности «Математические методы в экономике». С 2017 года – аспирант по специальности «Математические и инструментальные методы экономики». Тема кандидатской диссертации: «Управление крупномасштабными инвестиционными портфелями на основе стохастических дифференциальных уравнений». 

С 2017 года работал в инженером-программистом в компании-резиденте ПВТ «Агентство "БитАктив"». Занимался разработкой и анализом торговых алгоритмов на финансовом рынке ММВБ (Российская Федерация). С 2018 года параллельно был назначен на должность специалиста по управлению рисками. С 2019 года начал заниматься DS-проектами на аутсорсе. С 2020 года занимаюсь управлением и координацией собственной командой DS-разработчиков.

С 2017 года занимаюсь преподавательской деятельностью на экономическом факультете БГУ. Веду курсы: «Эконометрика», «Анализ и прогнозирование временных рядов», «Математическая статистика». С 2019 года также работаю преподавателем в рамках курса повышения квалификации.

Основные научные публикации:

Особенности преподавания: В рамках курса студенты освоят основы математического анализа, теории вероятностей, математической статистики в приложении к разработке Data Science решений. Также научатся обрабатывать, анализировать, проверять гипотезы, визуализировать и проводить различные манипуляции с данными, создавать аналитические отчеты. Кроме этого, овладеют всеми необходимыми навыками Python, позволяющими использовать большую часть Data Science инструментов, получат навык правильного стилистического оформления Python кода и изучат большую часть функционала библиотек машинного обучения. 

После курса студенты смогут самостоятельно использовать модели машинного обучения, анализировать данные, понимать содержание современных математических исследований (научных статей) и технической документации для дальнейшего саморазвития.



Почему выбирают IT-академию?

Программа обучения очень насыщенная

На курс по Data Science записался, поскольку начал интересоваться этой областью. До этого изучил язык программирования Python и думал, как можно его применить. Собственно, это и привело меня в IT-Academy. Прошёл отбор. Входные задания мне показались интересными, но не очень сложными. Наверное, потому что уже была база. 

Курс сложный, но дал много новых и полезных знаний

Пришёл на курс с целью сменить сферу деятельности, связать свою карьеру с машинным обучением и Data Science. Образовательный центр ПВТ предлагает основательную программу обучения по Data Science.

На курс по Data Science записался, поскольку начал интересоваться этой областью. До этого изучил язык программирования Python и думал, как можно его применить. Собственно, это и привело меня в IT-Academy. Прошёл отбор. Входные задания мне показались интересными, но не очень сложными. Наверное, потому что уже была база. 

А вот сама программа обучения – очень насыщенная, всё шло плотнячком, времени расслабляться не было. Но здесь нужно понимать, что Data Science – довольно широкая область и углубляться в ней можно бесконечно. На курсе мы получили основы, были интересные задания. Впечатления остались самые положительные.

Пришёл на курс с целью сменить сферу деятельности, связать свою карьеру с машинным обучением и Data Science. Образовательный центр ПВТ предлагает основательную программу обучения по Data Science. Увидел это и решил: почему бы не попробовать? Входные тесты дались нормально, у меня математическое образование, с программированием тоже дружу, поэтому особых проблем не возникло. 

Курс в целом достаточно сложный, потребовал много усилий, но дал много новых и полезных знаний. В том числе и в программировании. Программа обучения полностью оправдала мои ожиданий. Теперь намерен искать работу в области Data Science и связать дальнейшую карьеру с этим направлением.

Более 3150 выпускников успешно работают в IT-компаниях в Беларуси и за рубежом

Акции и новости