Возможности больших

Использование Big Data принесет экономике региона неожиданные открытия, до которых не додумались раньше.

Компании:

Image by Gerd Altmann from Pixabay

В минувшем году, благодаря победе в федеральном конкурсе, в ТГУ открылся Центр компетенций по цифровой экономике «Управление, основанное на данных». Событие это оказалось как нельзя кстати, поскольку региональным чиновникам нужно реализовывать нацпроект «Цифровая экономика», в рамках которого ставится задача внедрять цифровые решения и анализ Больших данных в систему управления областью. С помощью ученых ТГУ и их IT-партнеров из бизнеса решить этот вопрос все-таки проще, чем разбираться самим, что же это за зверь такой – Big Data, и как его применять?

По большому счету, опыт разработки цифровых решений по управлению данными есть только у частного бизнеса, да университетских лабораторий. Чиновники и управленцы разных ведомств здесь пока в роли не очень компетентных учеников. В минувшем году, например, новый цифровой Центр ТГУ, совместно с партнерами – IT-компаниями Rubius, Enbisys и «Эконофизика» успел подготовить более 500 госслужащих социальной сферы технологиям управления, основанного на данных. Это, конечно, капля в море, тем более что из прошедших начальное обучение специалистов, большинство были из других регионов страны. Широкого понимания, как и что можно решить в экономике, применяя разносторонние массивы аналитической информации, у подавляющего большинства современных управленцев нет. Однако первые шаги делаются, и, чтобы поделиться начальным опытом использования Big Data, собрались за круглым столом представители власти, бизнеса и университетских кругов.

«Большие данные – не для одной головы, нужны команды»

Заместитель губернатора по научно-образовательному комплексу Людмила Огородова:

– Цифровая трансформация отраслей экономики на основе Больших данных – главная задача цифровизации. Что для этого нужно? Во-первых, сами Большие данные, а также четкое понимание задач отраслей. Центральным звеном являются подготовленные кадры, которые знают, что такое Большие данные и как руководить на основе их анализа, повышая производительность труда и снижая риски. Современный госслужащий-управленец обязан грамотно ставить задачу, при этом не только знать, как пользоваться Big Data, но с их помощью улучшать эффективность перестройки экономики, умело модернизируя процессы.
Нужно сказать, что Томская область одна из первых получила право готовить руководителей способных работать с Big Data. Но прошлогодний грант, выигранный ТГУ, позволяет готовить нам специалистов по работе с Большими данными не только для нашего региона. Специализируясь по направлениям образование, здравоохранение и социальные услуги, мы получили право разработки образовательных программ и подготовки кейсов – проектов, которые будут опробованы в Томской области, с последующим пилотным внедрением в других регионах.

Директор Межрегионального супервычислительного центра ТГУ Сергей Орлов:

– С 2016 года ТГУ начал исследовательские проекты в части анализа Больших данных на стыке социальной сферы и сферы безопасности жизнедеятельности, образования. При этом мы проводили мастер-классы и лабораторную практику для представителей бизнеса, образовательных организаций, органов госуправления. Весь этот опыт вылился в то, что в прошлом году ТГУ победил в конкурсе на право реализации образовательных программ по управлению Большими данными, получив право запуска Центра компетенций «Управление, основанное на данных». По факту Центр является местом, где осуществляется реализация имеющихся компетенций, в нём ведется как исследовательский процесс, так и образовательный, разрабатываются решения, инфраструктура для работы с данными, и консалтинговые услуги. Мы выбрали для работы в Томске те сферы, где имеем накопленный опыт: образование, здравоохранение и социальную сферу. При этом «боевой единицей» в процессе обучения является не один человек, а команда, внутри которой происходит распределение ролей на руководителя, аналитика, технолога, работающего непосредственно с данными. Но для каждого подразумевается индивидуальная образовательная траектория.

Заместитель губернатора по научно-образовательному комплексу Людмила Огородова:

– Необходима командная работа, с привлечением специалистов из конкретных отраслей, которые мы намереваемся модернизировать с помощью цифровых технологий. Людей нужно сводить между собой, поскольку часто мы даже не понимаем, где могут находиться данные, которые нам понадобятся. В Томске вообще недостаточная концентрация специалистов, умеющих работать с искусственным интеллектом, – говорят нам представители IT-инфраструктуры. Отчасти это из-за того, что они очень востребованы не только в нашем регионе, и быстро уезжают. Сегодня запрос на таких специалистов в пять раз выше, чем готовят наши университеты.

Если говорить об управленцах, то мы должны обучать организации команды, способные принимать решения на основе Big Data. Все технологические компетенции – как добывать эти данные, строить зависимость процессов от них – формируются в команде, поскольку сегодня один человек не в состоянии охватить весь объем имеющейся полезной информации.

Аналитика на службе детей, беременных и чиновников

Заведующий лабораторией наук о больших данных и проблемах общества ТГУ Вячеслав Гойко:

– Первый проект, который мы начали решать в Томске, с применением Big Data, касался молодых мам. Согласно нацпроекту «Демография» в нашей стране всячески приветствуется вовлечение в экономическую жизнь женщин, находящихся в декретном отпуске, либо в отпуске по уходу за ребенком. Мы сформировали команды специалистов из Центра занятости населения Томской области, которые прошли через нашу образовательную программу, и сегодня они работают над проектом, помогающим молодым мамам реализовать свои возможности на время нахождения в декретном отпуске.

Кроме того, мы занимались формированием сборной команды специалистов из республики Тывы, где требовалось решить проблемы с таким популярным у молодежи течением, как АУЕ. Напомню, что данное движение объединяет людей, исповедующих некую криминальную романтику, при этом оно развивается и благодаря интернету. На основе данных из соцсетей наша команда сформировала программу по профилактике этого увлечения.

Следующий очень перспективный проект подразумевает использование данных сотовых операторов в интересах Департамента архитектуры города Томска. Для того чтобы правильно планировать развитие городских территорий, необходимо четко понимать, как перемещаются люди в течение дня. Причем, анализ этих данных можно сузить до определения тенденций перемещения даже отдельных категорий людей, например, студентов или молодых мам.

Большие данные можно использовать и для решения проблем профориентации. Например, к сожалению, в Томской области, как и во всей стране, огромный дефицит абитуриентов, успешно сдающих экзамен по физике. Мы полагаем, что правильное применение образовательных технологий на базе детского центра «Кванториум» поможет справиться с этой задачей. Мы запустили проект по поиску талантливых детей на основе данных соцсетей. Сегодня наши специалисты работают над решением, позволяющим правильно таргетировать ребенку те или иные школьные предметы и знания, исходя из его естественных интересов.

Начальник отдела информационных технологий ИДО ТГУ Артём Фещенко:

– Образовательная тематика – одна из самых востребованных с точки зрения проектных задач. Специфика в том, что они сфокусированы на соединение информации, которая есть внутри образовательных организаций, с Большими данными из открытых источников, таких как социальные медиа. У ТГУ в этом плане огромный опыт работы: например, с 2016 года мы решаем задачу – как вузам лучше узнать своего абитуриента, и, фактически, по-другому организовывать приемную кампанию – через выявление индивидуальных запросов ребенка. Цель – помочь правильной профориентации школьников. Мы провели уже третью приемную кампанию, используя этот подход, проанализировав миллион абитуриентов. С помощью этой методики мы смогли привлечь в ТГУ около 700 абитуриентов. Причем наблюдения за такими формальными измерителями как ЕГЭ показывают, что инаковость и одаренность, запрос на индивидуализацию отражается в поведении школьника в соцсетях. Такие дети лучше учатся, у них сильней мотивация, более высок запрос на индивидуальную траекторию развития. С одной стороны это вызов для вуза и университетского сообщества, с другой – возможность конкурентного опережения других игроков, в том числе и по экспорту образования. Сейчас наша модель апробируется в других федеральных вузах: на этапе пилота мы проверяем, пригодна ли она для рекрутинга талантов в других университетах.

Заместитель губернатора по научно-образовательному комплексу Людмила Огородова:

– Использование Больших данных в области образования помогло нам лучше понять ситуацию со школьными выпускными экзаменами в Томске. Оказалось, что дети, к сожалению, меняют свои предпочтения не в сторону выбора технологических и инженерно-конструкторских профессий. Мы получили Большие данные из контрольных цифр приема абитуриентов, и увидели, что наши университеты ориентированы на высокотехнологичную новую экономику, а дети при этом стремятся сдавать обществознание, а не физику, информатику или химию, необходимые для поступления в томские вузы. Получив этот результат, мы задумались. Мы выяснили, кто дает рекомендации детям идти на более легкие экзамены. Но перед нами встает задача – сориентировать ребенка на выбор будущей профессии, востребованной рынком труда. Если у ребенка проявляется интерес к химии и физике, надо его вовлекать в развивающие проекты.

Отрицательный результат – тоже полезный опыт

Учредитель компании Rubius Антон Кудинов:

– На данный момент мы не ведем коммерческих проектов, финансируемых из регионального бюджета, только инициативные, за счет собственных ресурсов. При помощи власти и томских университетов мы накапливаем собственную экспертизу, которая позволит предлагать наши решения в других регионах, и даже экспортировать их за пределы РФ. То есть, бизнес-мотивация присутствует, но она не связана с зарабатыванием денег внутри региона.

Проекты в области Big Data могут иметь и отрицательный исследовательский результат. Например, в Томске мы взялись за обработку большого массива данных, накопленных службой «Скорой помощи», чтобы снизить количество повторных вызовов. Первые результаты, которые мы получили, были весьма обнадеживающими. Однако выборка была недостаточной, требовалось больше данных. При помощи Департамента здравоохранения и фонда ОМС мы подключили дополнительную информацию сугубо медицинского характера, и оказалось, что в новой постановке проблема решается с качеством не приемлемым для практического применения. Врачам «Скорой помощи», чтобы госпитализировать всех людей для предотвращения риска инфаркта или инсульта, настояв на их срочной госпитализации, требуется увозить каждого третьего из всех обращающихся. На практике людей привозят в больницу, а там у них все симптомы пропадают, как следствие доверие к нашим расчетам резко падает. Это хороший пример, иллюстрирующий рискованность решения таких задач, и подобные нюансы должны учитываться бизнесом при заключении госконтрактов.

Все говорят – «нужна правильная постановка задач». Это конечно важно, но мне кажется не менее полезным учить правильно оценивать результаты. А это в решении вопросов, связанных с искусственным машинным интеллектом, далеко не тривиально: нужна определенная математическая или инженерная подготовка, чтобы понять и правильно интерпретировать то, что выдали эти пресловутые Data-специалисты, перевести это на человеческий язык и понять, как их цифры использовать на практике.

Генеральный директор компании Enbisys Дмитрий Бубнов:

– У нас также нет амбиций зарабатывать на Больших данных в регионе, поскольку Томск, по сравнению с глобальным миром, не то место, где много денег. Стратегически мы работаем с университетами для того чтобы готовить себе будущих специалистов, поэтому преподаем в ТГУ по дисциплине Машинное обучение, совместно с вузами участвуем в проектах. Наша задача – накапливать знания и компетенции, чтобы потом их экспортировать, либо отдавать региону готовые продукты и решения бесплатно, на условиях партнерских отношений.

Если мы хотим с помощью Больших данных решать какие-то реальные задачи региона, то усилий IT-компаний здесь недостаточно. Конечно, у нас много IT-специалистов, но именно комбинация компетентных в каждой конкретной отрасли экспертов позволяет двигать дело. При этом фейлов среди проектов гораздо больше, чем успешных историй. И тему правильной постановки задач я бы вообще переложил в концепцию гипотез. Потому что всегда, когда мы говорим о Больших данных, мы предполагаем возможность решения какой-то проблемы из подтвержденных гипотез, а не наоборот. В большинстве случаев перед нами ставят виртуальные задачи, такими, какими они видятся нам сейчас, из-за того, что для них либо нет данных, либо нет методов решения, либо недостаточная точность информации.

При этом IT-бизнесу коммерциализировать что-то, например, в медицине, без государства невозможно. И это не только в России, но во всем мире, поскольку мы 14 лет работаем в этой сфере на рынке Западной Европы и хорошо знаем экономику вопроса. Немногие понимают, что реальный проект, который внедряет результаты исследований в ежедневную работу, как минимум в десять раз дороже пилотного. Это связано с совсем другими технологиями, аппаратным и программным обеспечением и системой хранения данных. Опыт внедрения в промышленность показывает, что средний бюджет пилотного проекта – 2-3 миллиона рублей, а расходы «боевого проекта» – до 30 миллионов. Это существенные затраты для бизнеса. Однако средний срок окупаемости таких решений – менее одного года. Выгода очевидна. Но это решение каждый раз рискованно, да и эффект от использования Больших данных для многих неочевиден.

Компании:

Читайте также: