Обучение

Сообщение об ошибке

Обучение

Сообщение об ошибке

Кем завтра будут работать те, кто сегодня изучает Data Science. Топ главных сфер и профессий

11 февраля 2019

По подсчетам Института Исследования Будущего (Institute for the Future, или IFTF) 85% профессий, ожидаемых к 2030 году, еще не существуют в 2019-м. Методы из компьютерных наук проникают во все области знания — даже в литературный анализ, когда исследователи вроде Мэтью Джокерса из университета Небраски судят о настроении авторов романов 19 века, исходя из статистического распределения местоимений.


Умение работать с данными, контекстуальное мышление, понимание логики и философии — те качества, которые нужны в мире, где суть работы трансформируется. Без этих качеств будет сложно создавать вычислительный интеллект или сотрудничать с ним, отмечает Марина Горбис, исполнительный директор IFTF.  Цифровой след человечества удваивается каждые 40 месяцев и достигнет 40000 экзабайт к 2020-му. Все эти накопленные данные меняют представление о процессах, происходящих в мире, и дают инструмент влияния или интеграции в них. В 2012 году в Harvard Business Review специалиста по анализу данных назвали самой сексуальной профессией 21 века. Постоянно растущий спрос на специалистов в области Data Science только укрепляет силу этого заявления.

Специалист по анализу данных в здравоохранении

Применение механизмов машинного обучения позволяет точнее диагностировать болезни, предсказывать судороги, сердечные приступы и вероятность поступления новых пациентов в госпиталь, а также назначать точную дозировку лекарств.

Интеграция существенных данных о пациенте в одном приложении может спасать жизни — именно так работает приложение Streams от DeepMind, которое анализирует результаты обследований и рассылает оповещения медперсоналу. Это позволяет прийти к нужному пациенту в нужное время и сокращает процент смертности от острой почечной недостаточности или сепсиса.


Так работает приложение Streams

InnerEye создает 3D-модель опухоли из изображений, полученных с помощью компьютерной томографии, и точно определяет ее размер и динамику роста. Софт также позволяет узнать процент клеток различного типа в опухоли и планировать терапию так, чтобы сохранить максимальное количество здоровых клеток. Разработка китайской компании Ping An Technology LUNA обнаруживает узелковые утолщения на флюорограммах с точностью 95%.

Глубинное обучение активно используют в исследовании и диагностике онкологии — например, пытаются выявлять биомаркеры рака, анализируя экспрессию генов, и определять тип/подтип рака по соматическим точечным мутациям (замене или модификации одного нуклеотида в молекуле ДНК). Разработать точные методы прогноза возникновения метастазов, их миграции и возможности повторного возникновения опухоли — задачи, которые предстоит решить в будущем. А также найти надежные пути подбора лекарств для каждого пациента, исходя из данных экспрессии его генов, чувствительности к препаратам, медицинской истории и информации с различных трекеров. Например, исследование по персонализации комбинации лекарств для лечения острого миелоидного лейкоза ведется в рамках проекта Hanover от Microsoft. Оптимизация молекул самих лекарств для  их более точного действия — еще одна задача для специалиста по анализу данных в здравоохранении.

Криминалистический эксперт

Доля киберпреступлений растет — в 2017-м мошенники получили, отмыли, потратили и реинвестировали 1.5 триллиона долларов. Столько же составил ВВП России. Анализ схем киберпреступлений, преследований и харассмента в интернете — задача для криминалистического эксперта, работающего с большими данными.

Также есть большое поле для анализа схем преступлений, случающихся в физическом пространстве. Так, например, Томас Харгров анализирует статистические аномалии в различных убийствах, используя алгоритм, который он окрестил «детектором серийных убийц». Ученые из Дартмутского колледжа разрабатывают решения, которые помогут идентифицировать номер машины или лицо человека на изображениях крайне низкого качества. Многие другие исследования направлены на предсказание подозрительного и криминального поведения по данным, получаемым с камер наблюдения — одежде, анатомическим особенностям, походке, траектории движения. Искусственный интеллект и машинное обучение также могут помочь в анализе микса ДНК с места преступления — например, когда в нем можно обнаружить данные нескольких подозреваемых или людей, не причастных к случившемуся. Анализ этих данных может выявить неожиданные схемы и закономерности. Эксперт науки о данных может изменить судебную экспертизу, улучшить общественную безопасность и сделать полицейскую экосистему более устойчивой.

Специалист по точному сельскому хозяйству

Старейший экономический сектор — земледелие — тоже становится предметом изучения науки о данных. GPS, сенсоры и geo-mapping генерируют большое количество сведений о влажности почвы, направлении ветра, солнечном излучении и прочих важных характеристиках.

Анализ помогает планировать и улучшать урожай — в Беларуси этим занимается команда OneSoil, в Америке, например, Farmobile. Они собирают агрономические данные и сведения о технике, используемой на полях, и предоставляют фермерам возможность монетизировать эту информацию. Вызов для аналитика — осуществить планирование так, чтобы каждый год пропадало меньше трети производимой еды. Чтобы использовать меньше воды. Точнее предсказывать погоду. Помочь фермерам точно планировать урожай под нужды региона.

Работа с данными ведется и в животноводстве — например, на коровах хозяйства Chitale Dairy установлены RFID-датчики, которые передают информацию в облако (как говорится, «cow to cloud»). Результаты ее анализа отправляют местным фермерам в виде оповещений, если корове нужно изменить рацион или провести плановые прививки. Своевременное получение информации помогает сохранить поголовье и увеличить общую прибыль.

Разработка белорусского физика Дмитрий Широкого — датчики Ovi-Bovi, позволяющие точно определить время половой охоты у коров и сократить расходы на искусственное осеменение. Фото: Александр Корсаков

Специалист по транспорту

Транспортное планирование предполагает многомерный анализ. Одни исследователи анализируют данные об операциях по кредитным картам, чтобы найти связь между передвижениями и тратами. Другие работают с информацией о прикладывании электронных проездных к терминалам и данными о больших городских мероприятиях, чтобы предсказывать прибытие туда пассажиров. Оптимизация транспорта в городах предполагает интеграцию данных о городских мероприятиях, соседних городах и погоде.

Эффективный транспорт — одна из характеристик «умных городов». В 2018 году исследование городского транспорта началось в Лондоне. Это первый проект такого масштаба в городе такой сложности: чтобы получить полноценную схему передвижений по Лондону, анализируются мультимодальные анонимные мобильные данные вместе с данными из разных приложений. Ожидается, что это поможет лучше приспособить транспорт под нужды горожан и сократить расходы из городского бюджета.

Финтех-эксперт

С разговорным ИИ уже можно подробно обсудить финансы и попросить прислать полный отчет о тратах за определенный период или в определенном месте — так делает KAI, используемая J.P.Morgan Chase, крупным банком из США. В будущем ИИ такого типа будут анализировать расходы пользователя, сопоставлять их с предпочтениями и давать рекомендации по планированию бюджета. Банками большие данные используются для анализа потенциального заемщика кредита: если раньше учитывали его уровень зарплаты и кредитную историю, то теперь во внимание принимаются данные о покупках и поведении в социальных сетях. Компании вроде Upstart анализируют еще большее количество переменных, характеризующих потенциального заемщика кредита — уровень образования, опыт работы, информацию о работодателе и схемы поведения онлайн. В некоторых случаях это позволяет получить кредиты людям, которых бы отфильтровала традиционная система.  Анализ поведения пользователей помогает создавать надежные системы безопасности и минимизировать мошенничество.

Эксперт по производству контента вместе с ИИ

Анализ данных о том, как пишет конкретный автор, и его целевой аудитории, поможет ему писать лучше. С лета 2018-го в редакции Forbes такой анализ осуществляет платформа ИИ по имени Берти — планируется, что после предлагаемых ею правок истории станут более читаемыми. Легко представить такую же платформу, например, для создателей видео. Алгоритмы влияют не только на то, какой именно контент пользователи видят на платформах, но и на причину и процесс его создания.

Большой маркетолог

Методы анализа данных вместе с алгоритмами обработки естественного языка помогают лучше понять, о чём говорят в сети и почему. И визуализировать происходящее — например, с помощью BuzzGraphs. Технология позволяет увидеть, какие слова часто появляются наряду с поисковым запросом и степень связи между ними, представленную типом линии. Можно также анализировать степень связи между людьми в комментариях в соцсетях и понимать, как их группировать. Или определять, купил ли пользователь продукт после того, как ему показали его в онлайн-объявлении, не сообщая данных о самом пользователе. Такой продукт, базирующийся на гомоморфном шифровании, недавно представил Google — реверанс в сторону безопасности, который стоит взять на вооружение многим крупным компаниям. Баланс между извлечением максимума из данных и защитой информации о пользователе — важный челлендж для аналитиков.


flickr.com / Skippy Beresford

Образование, саморазвитие и данные

Для более стремительного развития ИИ ему не хватает собственного механизма любопытства, считает Пьер-Ив Одейер, исследователь из французского института компьютерных наук INRA. По мнению Одейера, система должна использовать не один оптимизационный процесс, а целое семейство механизмов, связанных с новизной и неожиданностью. Прийти к модели любопытства исследователь пытается в новом инструменте для обучения KidLearn — умной системе тьюторства. На основе данных тестирования 600 учеников начальной школы система должна смоделировать стиль обучения каждого ученика математике и предоставить ему задания оптимальным способом. KidLearn не полагается на данные о других детях, собранные заранее, а воспринимает каждого ребенка как поле для исследования, адаптируясь под его уровень понимания, результаты и любопытство. Инструмент сочетает искусственную модель любопытства и мотивации.

Образование на рабочих местах тоже трансформируется с помощью интеграции дополненной реальности. С помощью Scope AR cхемы и мануалы конвертируются в 3D-инструкции, которые позволяют нетренированному пользователю справиться с высокотехническим заданием. Например, когда случается массовый переход к электромобилям, механикам нужно адаптировать набор своих навыков к новому типу двигателя, ходя на курсы повышения квалификации, для которых кто-то разработал программу. AR обходит все три уровня и быстро дает обучающемуся свежую информацию по делу.

Вычислительная мощность компьютеров следует закону Мура и к 2045 году скорее всего превысит мощность мозгов всего человечества, слитых воедино. Тем не менее в ближайшее время компьютерам вряд ли удастся полностью освоить интуицию, генерировать суждения и наработать эмоциональный интеллект. Именно поэтому сотрудничество и партнерство с роботами обещает эру еще большей эффективности и появление большого количества возможностей для реализации проектов разного толка.


Записывайтесь на курс «Основы Data Science» в Образовательном центре ПВТ. 

Форма обучения — вечерняя. Два дня в неделю.

Продолжительность — 216 учебных часов (около 6 месяцев).


Материал опубликован на dev.by, дата публикации: 07.02.2019.

Полная, частичная перепечатка или любое иное использование материалов с сайта IT-Academy разрешается только с указанием активной гиперссылки, ведущей на первоисточник (точный адрес страницы на www.it-academy.by).