Задания хакатона Северо-Кавказского федерального округа "Цифровой прорыв. Сезон: ИИ"


Источник: DD Planet
  1. ИИ в поисках гренландского кита

Участникам хакатона на основе методов искусственного интеллекта предлагается разработать программное решение по идентификации конкретной особи гренландского кита на основе данных, полученных с беспилотных летательных аппаратов. 

При помощи данных аэрофотосъемки, сформированных датасетов и материалов из открытых источников, участникам хакатона предстоит обучить нейросеть поиску индивидуальных особей гренландского кита, а также сформировать интерфейс загрузки данных и представления результатов распознавания с учетом требования по автономности решения (без использования сети «Интернет»).

Разработанное участниками решение позволит оптимизировать проведение регулярных и длительных сезонных экспедиций, в ходе которых осуществляется постоянный запуск беспилотных летательных аппаратов, обеспечивающих аэрофотосъемку скоплений гренландского кита. Алгоритм также позволит оптимизировать время обработки полученных данных. 

 

Рекомендуемый состав команды: Специалист ML; специалист по работе с хранилищами данных и базами данных; специалист по разработке интерфейсов; бизнес-аналитик

Предполагаемый стек технологий: Программы и библиотеки с открытым исходным кодом (open source) и общедоступные публичные данные, в остальном нет ограничений ни на языки программирования, ни на стек технологий. При этом, используемый стек технологий должен обеспечить автономность решения (возможность использования без сети «Интернет»)

Требования к железу: Не предъявляются

Уровень участников: Опытные

 

Решения: Цифровой прорыв. Сезон: искусственный интеллект (vk.com)

 

  1. Определение доходности ИП через кластеризацию 

Кластерный анализ играет важную роль для коммуникаций с клиентами банка. На данный момент в банке существует ML решение задачи кластеризации, но для этого используются персональные и внутренние данные банка о клиентах.

При наличии недостаточного количества информации о новых клиентах банка невозможно подобрать для них наилучшее банковское предложение, что влечет за собой как финансовые, так и репутационные потери в случае неудачного подбора продукта или коммуникации с клиентами.

Для полного отражения сегментного профиля по доходности и улучшения имеющейся модели банка участникам предлагается изучить возможность кластеризации на данных, находящихся в открытом доступе. Результат работы должен быть представлен парсером, предсказаниями модели, а также наличием веб-интерфейса, ключевой особенностью которой будет являться визуализация, отражающая качество кластеризации при изменении количества кластеров.

Предложенные участниками алгоритмы помогут оценить доходность предпринимателей РФ на основе открытых источников данных. 

 

Рекомендуемый состав команды: Специалист ML, back-end специалист

Предполагаемый стек технологий: Machine Learning, программы и библиотеки с открытым исходным кодом (open source) и общедоступные публичные данные, языки Python, PHP и т. д.

Требования к железу: Не важно

Уровень участников: Новички / опытные / профи

 

Решения:  Цифровой прорыв. Сезон: искусственный интеллект (vk.com)

 

  1. Переводчик с естественного языка на SQL

Современные технологии позволяют легко решать задачи перевода естественных человеческих языков. Доступно большое количество технологий и уже обученных нейросетей для решения подобных задач, но стабильно работающего переводчика с человеческой речи на язык программирования — нет. 

Решения в datadriven-компаниях принимаются на основании проверки гипотез на данных. При этом большая часть таких гипотез не является сложными — такие проверки могут осуществлять сами участники команд со стороны бизнеса (selfservice), но они не всегда обладают знаниями языков программирования.

Участникам хакатона предлагается реализовать переводчик с «человеческого» языка на язык SQL. 

Разработанное участниками решение позволит сократить время при принятии решений, ускорит бизнес-процессы в компании ПАО «Ростелеком», а также позволит командам быстрее обучаться работе с данными и сократит нагрузку на дата-аналитиков. 

 

— Рекомендуемый состав команды: Специалист ML, специалист SQL

— Предполагаемый стек технологий: Python, SQL 

— Требования к железу: Специфических требований нет

— Уровень участников: Новички / опытные / профи

 

Решения: Цифровой прорыв. Сезон: искусственный интеллект (vk.com)

 

  1. Маруся не отвечает на реплики из телевизора

Голосовые помощники становятся неотъемлемой частью нашей жизни — они помогают не только нам, но и пользователям разного возраста. Например, одной из ключевых аудиторий для голосового помощника от VK — Маруси являются дети — они общаются с ней как с другом, учатся через нее и получают полезную информацию. Зачастую детская коммуникация с детскими технологиями специфична. 

Дети, это не только цветы жизни, но и наша опора в будущем. Они должны расти всесторонне развитыми и получать максимальное количество информации в нашем быстро меняющемся мире. Надежным источником такой информации для познания мира и не только, может стать умная колонка. Участникам хакатона мы предлагаем вместе с нами поработать над качеством общения Маруси. Один из распространенных кейсов для такого срабатывания: дети часто болтают с Марусей, а фоном у них идут мультики, или они болтают одновременно друг с другом и с Марусей. Если Маруся научится понимать, что реплика явно обращена не к ней, дети смогут получать более релевантную и полезную информацию от Маруси и их общение будет максимально неискаженным.  

Для того, чтобы взаимодействие с пользователем было более естественным, после большинства своих ответов, Маруся в колонках слушает пользователя около 3-х секунд, ожидая следующую реплику. На основе методов искусственного интеллекта предстоит обучить модель, которая будет понимать, что фраза, которую слушает ассистент, идет не от пользователя, а исходит от телевизора, работающего в фоне, или от фонового разговора. Тогда Маруся перестанет отвечать на такие фразы, и качество ее коммуникации с пользователем повысится. Важно при этом сохранить текущее время ответа. 

 

— Рекомендуемый состав команды: Специалисты в области создания ML решений, предполагается работа с текстом.

— Предполагаемый стек технологий: Нет ограничений, любые доступные и открытые технологии и платформы.

— Требования к железу: нужна вычислительная мощность: GPU: V100/A100, память: 32Гб; хост: 4 ядра, память: 64 Гб. Будут предоставлены вычислительные ресурсы VK Cloud

— Уровень участников: Новички / опытные / профи

 

Решения: Цифровой прорыв. Сезон: искусственный интеллект (vk.com)

 

Найдем решение вашей задачи

Заполнить бриф