Temy_KT_2018.txt

 
 
Темы курсовых, бакалаврских и магистерских 
работ от международного научного центра 
«Компьютерные технологии» и друзей — 2018 
В этом документе приведены возможные темы для курсовых, бакалаврских и магистерских
работ, стартующих в 2018 году.
Темы предыдущих лет: ​2017​, ​2016​, ​2015​, ​2014

Шаблон темы
Темы по биоинформатике
Разработка конвейера для анализа HiC данных
Разработка конвейера для анализа ChIP-seq данных
Разработка Кномикс-Биоты - интерактивной системы для анализа метагеномных данных
Мета-анализ микробиоты пива
Солвер для задачи flux variance analysis с термодинамическими ограничениями на
основе сведения к целочисленному линейному программированию
Разработка алгоритма для поиска соответствия атомов в биохимических реакциях
Построение филогенетических сетей для штаммов вирусов
Темы по машинному обучению и анализу данных
Детекция и распознавание символов на изображениях
Понимание естественного языка
Система оценки задач кластеризации
Система выбора и настройки алгоритмов кластеризации на основе SMBO & AT
Система выбора и настройки алгоритмов классификации на основе SMBO & AT
Интеллектуальное удаление объектов
по нескольким фотоснимкам с разных ракурсов
Автоматическое исправление искажений на фотографии
с помощью нейронных сетей
Визуальный автопилот для DJI дрона
Обращение Random Forest
Исследование отсекающих правил ансамблей фильтрующих алгоритмов выбора
признаков

Исследование применимости мета-обучения для выбора отсекающих правил
ансамблей фильтрующих алгоритмов выбора признаков
Открытая тема по обработке естественного языка в информационном поиске
Обфускация данных для машинного обучения
Применение B-сплайнов (NURBS) в методе Embedded Deformation
Использование спектральных поверхностных дескрипторов в задачах распознавания
пространственных объектов на 3D сцене
Семантическая сегментация 3D сцен
Генеративные модели для улучшения 3D сцены, восстановленной фотограмметрией /
заполнение отверстий в 3D моделях с помощью генеративных нейросетей
Генерация трехмерных моделей по фотографии
Transformer-based multi-document scientific abstracts generation
Language Modelling with Deep Transformers for Generating Pseudo-Scientific Texts
Transformer-based Graph Convolutional Networks for Multi-Document Summarization
Распознавание дерматологических структур на изображениях родинок
Распределенный алгоритм иерархической кластеризации сообществ в социальном
графе
Обучение метрики похожести сообществ с помощью выделения векторного
представления
Поиск мошеннических действий в социальных сетях с помощью методов выделения
векторного представления в графах
Профилирование пользователей из профессиональных социальных сетей
Идентификация одного и того же пользователя в различных соц сетях
Работа с мультиязычными данными для задачи определения психотипа по данным из
социальных сетей
Темы по дискретной оптимизации и формальным методам в киберфизических системах
​Слайды В. Вяткина
Использование SAT/CSP-решателей в задаче планирования операций судов в порту
Modular, plugin-based IEC 61499 platform
Укладка конечных автоматов и сетей функциональных блоков на плоскость
​Верификация программ с временными штампами
​ редсказание вычислительной сложности формальной верификации методами
П
машинного обучения
​Автокорректировка управляющих программ по результатам их верификации
​Алгоритмы управления в виде нейронных сетей: реализация на микроконтроллерах и
формальная верификация (возможно, это два проекта)
Темы по технологиям​#heading=h.sohly55rm11g​программирования
Just-in-Time meets Divide-and-Conquer: что делать?

Темы по эволюционным вычислениям
[ЗАНЯТО] Тема 1. Адаптивный контроль параметров эволюционных алгоритмов в
случае, когда значения функции приспособленности динамически изменяются
Тема 2. Machine Learning meets Parameter Control
Темы 3, 4. Beyond Expected Optimization Times
Разработка эффективных операторов скрещивания и мутации в мультиплоидных
алгоритмах
Теоретический анализ методов адаптивной настройки параметров при решении
практических задач
Анализ адаптивной настройки мутации с помощью ε-greedy Q-learning на примере
задачи LeadingOnes
Теоретический анализ random-walk’ов
Разработка метода получения нижних оценок для бинарных несмещенных алгоритмов.
Адаптивный генетический алгоритм для генерации связей данных в приложении из
функциональных блоков
Итеративная разработка спецификации для формальных моделей
Разработка автоматического портфолио для black-box оптимизации (BBComp)
Разработка решений для соревновательных задач эволюционных вычислений
Получение дизайна сверхнаправленной диэлектрической наноантенны при помощи
эволюционных алгоритмов
Темы по сжатию видеопотоков
Темы по компьютерным сетям
Ускорения существующих методов верификации сетевых программ
Темы по конкурентным вычислениям
1. Can You Scale Machine Learning to Hundreds of Cores? (Dan Alistarh)
2. Communication-Scalable Machine Learning. (Dan Alistarh)
3. A Scalable Simulator for Billions of Interacting Molecules. (Dan Alistarh)
4. Concurrent Union-Find Algorithms. (Dan Alistarh)
7. Transactional Scalability on 1000+ Processor Cores. (Dan Alistarh)
8. Time-traveling concurrency control protocols. (Dan Alistarh)
9. CDSBench: A Serious Benchmarking Framework for Concurrent Data Structures. (Dan
Alistarh)
[ЗАНЯТО]10. Implementing Byzantine-Resilient Machine Learning Algorithms. (Dan Alistarh)
11. Compressing Neural Networks for Fun and Profit (Dan Alistarh)
1. Non-Volatile Computability (Petr Kuznetsov)
2. Byzantine Fault-Tolerant Reconfigurable Systems (Petr Kuznetsov)
3. Synchrony Assumptions for Blockchain Systems (Petr Kuznetsov)
4. Robust Cortical Learning (Petr Kuznetsov)

5. Combinatorial Structures for Bonded-Memory Computing (Petr Kuznetsov)
Темы от Транзаса
Разработка алгоритма динамической замены правил визуализации для электронных
навигационных карт
Разработка формата хранения данных для карт ручной корректуры

 
Шаблон темы 
Руководители​: ФИО (почта@сервер), ФИО2, …
Уровень​: стажировка/курсовая/бакалаврская/магистерская
Описание предметной области
<текст>
Цель работы​: <краткое описание>
Что следует сделать​:
● Пункт планируемой деятельности 1
● Пункт планируемой деятельности 2
Ожидаемые результаты​: <что видим в теме в качестве результата>
Требования​: <требования к кандидатуре>
Источники​:
● Статья по теме со ссылкой на скачивание
● URL полезного ресурса

Темы по биоинформатике 
Разработка конвейера для анализа HiC данных
Руководители:​Александр Тяхт (​a.tyakht@gmail.com​)
Уровень:​курсовая

Описание предметной области:
Технология HiC - опубликованная в 2009 г. методика анализа пространственной структуры
хромосом, основанная на высокопроизводительном секвенировании. Анализ таких
“больших данных” совместно с другими омикс-данными позволяет прояснить
фундаментальные вопросы относительно архитектуры генома, регуляции генной
экспресии, биологии раннего развития и др. В настоящее время алгоритмы обработки HiC
данных стремительно развиваются.
Цель работы: ​Сборка и оптимизация вычислительного пайплайна для анализа HiC данных
с фокусом на данных по клеточным линиям Drosophila melanogaster - cовместно с
биологами и биоинформатиками из Института биологии гена (Москва). Применение для
анализа новых данных, накопленных в ИБГ.
Что следует сделать:
- Ознакомиться с принципами технологии HiC
- Сравнительный обзор пакетов для первичной обработки данных
- Создание схемы базы данных и наполнение ее экспериментальными данными из
ENCODE/modENCODE (включая RNA-seq и ChIP-seq для кросс-анализа)
- Валидация на данных из статьи
Ожидаемые результаты: ​вычислительный конвейер, заполненная база данных с
общедоступными и новыми данными,
Требования: ​знание R и/или Python, знание английского языка на уровне чтения научных
статей по биологии/биоинформатике.
Источники
1) Comprehensive mapping of long-range interactions reveals folding principles of the human
genome
https://www.ncbi.nlm.nih.gov/pubmed/19815776
2) Topological domains in mammalian genomes identified by analysis of chromatin
interactions
https://www.nature.com/articles/nature11082
3) A 3D Map of the Human Genome at Kilobase Resolution Reveals Principles of Chromatin
Looping
https://www.ncbi.nlm.nih.gov/pubmed/25497547
4) Comparison of computational methods for Hi-C data analysis
https://www.nature.com/articles/nmeth.4325
5) (одна из статей ИБГ) Active chromatin and transcription play a key role in chromosome
partitioning into topologically associating domains
https://genome.cshlp.org/content/early/2015/10/30/gr.196006.115

Разработка конвейера для анализа ChIP-seq данных
Руководители:​Александр Тяхт (​a.tyakht@gmail.com​)
Уровень:​курсовая
Описание предметной области:
Технология ChIP-seq - это способ изучения ДНК-связывающих белков на основе
NGS-секвенирования. Среди насущных вопросов, на которые можно ответить - как белки
колокализуются между собой и какие имеют мотивы связывания. Проект будет посвящен
анализу данных по ряду белков-инсуляторов, которые совместно с CP190 участвуют в
регуляции транскрипции.
Цель работы:
Оптимизация прототипа вычислительного пайплайна для анализа ChIP-seq данных и
разработка базы данных - cовместно с биологами и биоинформатиками из Института
биологии гена (Москва). Сравнение результатов работы пайплайна с данными
общедоступных баз.
Что следует сделать:
- Изучить принципы технологии ChIP-seq и основ анализа данных
- Ознакомиться с существующим прототипом пайплайном и базы
- Ознакомиться с базой GFP
- Оптимизация пайплайна
- Сравнить результаты анализа CHIP-seq с результатами базы GFP для ряда белков
Ожидаемые результаты: ​вычислительный конвейер, заполненная база данных с
общедоступными и новыми данными.
Требования: ​знание R и/или Python, знание английского языка на уровне чтения научных
статей по биологии/биоинформатике. Опыт работы с ChIP-seq - плюс.
Источники
1) Гайдлайн по об обработке CHIP-seq данных:
https://genome.cshlp.org/content/22/9/1813.long
2) Пример исследования архитектурных белков:
https://genome.cshlp.org/content/25/1/89.long
3) (одна из статей ИБГ) Architectural proteins Pita, Zw5,and ZIPIC contain
homodimerization domain and support specific long-range interactions in Drosophila
https://www.ncbi.nlm.nih.gov/pubmed/27137890

4) Recent advances in ChIP-seq analysis: from quality management to whole-genome
annotation
https://www.ncbi.nlm.nih.gov/pubmed/26979602

Разработка Кномикс-Биоты - интерактивной системы для анализа
метагеномных данных
Руководители:​Александр Тяхт (​a.tyakht@gmail.com​)
Уровень:​курсовая
Описание предметной области: ​Система Кномикс-Биота (​https://biota.knomics.ru/​) онлайн-портал для разведочного и статистического анализа данных по микробиоте
человека и других микробиот, полученных с помощью метагеномного секвенирования.
Среди функций - интерактивные модули визуализации, база данных, анализ ассоциаций
между составом микробиоты и факторами, курированная база опубликованных данных,
доступных для сравнительного анализа пользовательских данных. В настоящий момент
ведутся работы над усовершенствованием портала и наполнением базы знаний с учетом
запросов пользователей.
Цель работы: ​разработка и внедрение новых аналитических функций в системе
Кномикс-Биота (​http://biota.knomics.ru​) и обработка больших массивов метагеномных
данных.
Что следует сделать:
- Ознакомиться с системой Кномикс-Биота (biota.knomics.ru)
- Разобраться с основными терминами метагеномики и биоинформатики микробиоты
- Основные шаги - могут включать в себя 1 или более задач:
- Доработка модуля анализа временных рядов (time series)
- Улучшение первичного анализа данных (поиск баркодов, сборка парных
ридов)
- Улучшение алгоритма таксономической классификации
- Литературный поиск с целью сбора метагеномов кишечника человека и
мета-анализа с помощью Кномикс-Биоты на одну из тем (воспалительные
заболевания кишечника; метаболические нарушения; диета; пре-/пробиотики)
Ожидаемые результаты: ​улучшение существующих и/или создание новых аналитических
модулей; выявление новых ассоциаций между составом микробиоты и внешними
факторами на основе собранных Big Data.

Требования: ​знание R и/или Python, знание английского языка на уровне чтения научных
статей по биологии/биоинформатике. Опыт анализа метагеномов и данных по микробиоте
человека - плюс.
Источники
1) Knomics-Biota - a system for exploratory analysis of human gut microbiota data
https://biota.knomics.ru/
https://www.biorxiv.org/content/early/2018/03/06/274993
Примеры статей-источников метагеномов по темам:
2) Extensive Modulation of the Fecal Metagenome in Children With Crohn’s Disease During
Exclusive Enteral Nutrition
https://www.nature.com/articles/ajg2015357
3) Gut microbiome diversity and high-fibre intake are related to lower long-term weight gain
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5500185/
4) Gut microbiota is associated with obesity and cardiometabolic disease in a population in
the midst of Westernization
https://www.nature.com/articles/s41598-018-29687-x

Мета-анализ микробиоты пива
Руководители:​Александр Тяхт (​a.tyakht@gmail.com​)
Уровень:​курсовая
Описание предметной области: ​Микробно-дрожжевое сообщество пива играют ключевую
роль в формировании биохимического состава продукта, влияет на его органолептические
свойства. Однако традиционные методы культивирования дрожжей дают представление
лишь о некоторых членах сообщества и их соотношении. Проект посвящен мета-анализу
накопленных данных о дрожжевом метагеноме пива.
Цель работы: ​развитие прототипа ​пайплайна для обработки метагеномных данных
ITS-секвенирования на базе аналитической системы Кномикс-Биота (​http://biota.knomics.ru​)
и статистическая обработка массивов опубликованных данных этого типа.
Что следует сделать:
- Ознакомиться с системой Кномикс-Биота (biota.knomics.ru)
- Разобраться с основными терминами метагеномики и микробной экологии пива
- Провести литературный поиск по теме “метагеном пива” и обработать найденные
сырые данные в Кномикс-Биоте
- Оптимизировать алгоритм таксономической классификации
- Провести многофакторный анализ по множеству исследований на предмет
ассоциаций микробиоты пива с органолептическими и другими параметрами

-

Возможно, впервые проанализировать новые данные от российских крафтовых
пивоварен

Ожидаемые результаты: ​мета-анализ состава пивного микробиома и оптимизированный
модуль анализа ITS-метагеномов.
Требования: ​знание R и/или Python, знание английского языка на уровне чтения научных
статей по биологии/биоинформатике. Представление об технологическом процессе и
основных органолептических и других характеристиках изучаемого объекта - плюс.
Источники
5) Knomics-Biota - a system for exploratory analysis of human gut microbiota data
https://biota.knomics.ru/
https://www.biorxiv.org/content/early/2018/03/06/274993
6) BeerDeCoded: the open beer metagenome project
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5657021/​(типовой источник данных)
7) Mapping microbial ecosystems and spoilage-gene flow in breweries highlights patterns of
contamination and resistance ​https://elifesciences.org/articles/04634
8) The microbial diversity of an industrially produced lambic beer shares members of a
traditionally produced one and reveals a core microbiota for lambic beer fermentation
https://www.ncbi.nlm.nih.gov/pubmed/25846912

Солвер для задачи flux variance analysis с термодинамическими 
ограничениями на основе сведения к целочисленному линейному 
программированию 
Руководители: ​Алексей Сергушичев (​alsergbox@gmail.com​)
Уровень: ​бакалаврская/магистерская
Описание предметной области
Одной из актуальных областей биологии является изучение регуляции метаболизма
(набора биохимических реакций, необходимых для жизнедеятельности клетки). Во-первых,
стала ясна большая роль, которую метаболизм играет в биологических процессах,
особенно в иммунной системе и раковых клетках. Во-вторых, появилась возможность
широкого изучения метаболических процессов из-за удешевления технологий получения
данных транскриптомного и метаболомного профилирования, отражающих активность
ферментов и изменения в концентрациях веществ в клетке, соответственно.

Для анализа есть фреймворк flux balance analysis (FBA), который позволяет немного
моделировать потоки через реакции с помощью оптимизации с линейными ограничениями.
В стандартном виде у этого фреймворка есть проблема: он учитывает закон сохранения
масс, но в нем возможны не валидные потоки сточки зрения термодинамики
(положительный круговой поток). Для решения этой проблемы можно добавить
специальные ограничения, но они являются целочисленными и резко усложняют задачу
оптимизации (она становится NP-трудной).
В 2018 году Дмитрием Якутовым был разработан солвер для задачи оптимизации сложного
потока. В этой теме предлагается на основе этого солвера разработать солвер для задачи
Flux Variance Analysis (FVA), в которой требуется вычислить максимальный и минимальный
поток через каждую реакцию. Базовым решением является запуск 2*N оптимизаций для
каждой отдельной реакции.
Цель работы: ​сделать практический солвер для задачи FVA с использованием библиотеки
CPLEX.
Задачи:
● Разобраться в том, что такое целочисленное линейное программирование (ILP).
● Разобраться в том, как работает библиотека CPLEX для решения ILP-задач.
● Разобраться в работе Якутова.
● Придумать и реализовать дополнительные особенности сведения, учитывающие
специфику задачи.
● Придумать и реализовать ускоряющие эвристики.
Ожидаемые результаты: ​программа для решения задачи FVA с термодинамическими
ограничениями.
Источники
●
●
●
●
●
●

http://www.nature.com/nbt/journal/v28/n3/abs/nbt.1614.html​— What is flux balance
analysis?
https://www.ncbi.nlm.nih.gov/pubmed/15135031​— Thermodynamic constraints for
biochemical networks
https://link.springer.com/chapter/10.1007%2F978-3-319-43681-4_17​— пример солвера
на графах для похожей задачи с использованием библиотеки CPLEX
Якутов Д.А. Солвер для задачи линейной оптимизации в пространстве
сбалансированных потоков с термодинамическими ограничениями
Fast-SNP: a fast matrix pre-processing algorithm for efficient loopless flux optimization of
metabolic models ​https://www.ncbi.nlm.nih.gov/pubmed/27559155
Accelerating flux balance calculations in genome-scale metabolic models by localizing the
application of loopless constraints ​https://arxiv.org/abs/1711.04084

Разработка алгоритма для поиска соответствия атомов в биохимических 
реакциях 
Руководитель: ​Алексей Сергушичев (​alsergbox@gmail.com​)
Уровень: ​магистерская
Описание предметной области
Понимание механизма биохимической реакции: то есть какие атомы переходят в какие при
прохождении реакции, - является важной составляющей при интерпретации
экспериментальных данных, касающихся регуляции метаболизма в клетке. Обычно задача
определения соответствия решается с помощью варианта задачи изоморфизма графов,
при этом в идеале должны использоваться методы для поиска реакционного пути в
пространстве потенциальной энергии состояний реакции.
В работе предлагается разработать алгоритм для поиска соответствия атомов, строящий в
явном виде возможные переходные состояния реакции и использующий их энергию.
Цель работы: ​разработать алгоритм для поиска соответствия атомов в биохимической
реакции.
Задачи:
● Разобраться в том, что такое реакции.
● Разобраться в существующих методах.
● Научиться работать с веществами, их энергиями и реакциями.
● Сделать метод.
● Сравниться с существующими методами.

Источники
●

●
●

Comparative evaluation of atom mapping algorithms for balanced metabolic reactions:
application to Recon 3D
https://jcheminf.biomedcentral.com/articles/10.1186/s13321-017-0223-1
Accurate atom-mapping computation for biochemical reactions.
https://www.ncbi.nlm.nih.gov/pubmed/22963657
Сергушичев А.А. Диссертация на тему «Методы вычислительного анализа
метаболических моделей для интерпретации транскриптомных и метаболомных
данных» ​http://is.ifmo.ru/disser/sergushichev-dissertation.pdf

Построение филогенетических сетей для штаммов вирусов 
Руководители​: Никита Алексеев (nikita.v.alexeev@gmail.com)
Уровень​: магистерская
Описание предметной области
Построение филогенетических сетей для штаммов вирусов – биоинформатическая
задача, имеющая прямые практические приложение (например, восстановление
сценариев и очагов заражения в юридических целях на основании клинических
данных). Эта задача включает в себя как подзадачу геномной сборки для очень
близких геномов (штаммов одного и того же вируса), так и подзадачу нахождения
графа с минимальной суммарной длиной ребер, в который все эти штаммы
включены как вершины.
Цель работы​: Разработка алгоритмов для построения филогенетических сетей для
штаммов вирусов
Ожидаемые результаты​: Новые алгоритмы для восстановления набора гаплотипов
по “сырым” ридам. Новые алгоритмы для построения филогений, учитывающих не
только мутации, но и более сложные события (например, рекомбинации).
Требования​: знание теории графов и теории вероятностей
Источники​:
1. https://journals.plos.org/ploscompbiol/article?id=10.1371/journal.pcbi.1003457
2. https://pdfs.semanticscholar.org/6872/0ec71a5d4f1861ffb2d559ebc359a6493bfc.pdf

Темы по машинному обучению и анализу данных 
Детекция и распознавание символов на изображениях 
Руководители: Иван Сметанников​(​smeivan@mail.ru​), ​Наталья Ханжина
(​nekhanzhina@gmail.com​)
Уровень:​бакалаврская / магистерская

Описание предметной области
Автоматизация распознавания того, что изображено на фотографии, содержит множество
сложных случаев, которые неразрешимы для стандартных решений. Автоматизация
разбивается на задачи детекции и распознавания, однако в последнее время это стало
хорошо решать end-to-end архитектурами. Отдельную сложность представляет ситуация,
когда на изображении представлено несколько языков.
Цель работы
Разработка алгоритмов для детекции и распознавания символов на изображениях (есть
обсуждаемые варианты постановки)
Требования
Знание Python, понимание глубоких нейронных сетей, минимальный опыт в TensorFlow /
PyTorch
Оплачиваемая стажировка

Понимание естественного языка 
Руководители: Иван Сметанников​(​smeivan@mail.ru​), ​Наталья Ханжина
(​nekhanzhina@gmail.com​)
Описание предметной области
Понимание естественного языка ​— новая область в обработке естественного языка, связанная с
распознаванием не только того, что человек сказал, что что он хотел и что он имел в виду.

Цель работы
Разработка новых алгоритмов в этой области (есть обсуждаемые варианты постановки)
Требования
Опыт в NLP / Большое желание и смекалка
Оплачиваемая стажировка

Система оценки задач кластеризации
Руководители:​Муравьёв Сергей (​mursmail@gmail.com​)
Уровень:​бакалаврская

Описание предметной области: ​Существует масса алгоритмов кластеризации и способов
оценки разбиений, которые они производят. Однако ни универсального алгоритма, ни
универсальной метрики не существует и построить таковые невозможно. В рамках данной
работы предлагается разработать систему, которая рекомендует меру для каждой
конкретной решаемой задачи.
Цель работы: ​разработать систему рекомендации метрик оценки задач кластеризации на
основе мета-обучения.
Что следует сделать ​Изучить предметную область, почитать статьи про существующие
алгоритмы кластеризации и метрики их оценки, почитать про методы агрегации
пользовательских оценок. Построить систему на основе человеческих оценок,
рекомендующую метрику оценки задачи кластеризации. Подобная система уже была ранее
разработана два года назад, требуется также проанализировать её недостатки.
Ожидаемые результаты: ​система рекомендации метрики кластеризации на основе
мета-обучения.
Требования: ​знание Python, начальные знания теории оптимизации, умение разбираться в
технической литературе на английском языке, отсутствие академических задолженностей,
высокая коммуникативность​.
Источники
1) Arbelaitz O. et al. An extensive comparative study of cluster validity indices //Pattern Recognition. –
2013. – Т. 46. – №. 1. – С. 243-256.

https://ccc.inaoep.mx/~ariel/2013/An%20extensive%20comparative%20study%20of%20cl
uster%20validity%20indices.pdf
2) An Impossibility Theorem for Clustering
https://www.cs.cornell.edu/home/kleinber/nips15.pdf
3) Filchenkov A., Muravyov S., Parfenov V. Towards cluster validity index evaluation and selection
//Artificial Intelligence and Natural Language Conference (AINL), IEEE. – IEEE, 2016. – С. 1-8.
https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=7891855
4) Hennig C. Cluster validation by measurement of clustering characteristics relevant to the user
//arXiv preprint arXiv:1703.09282. – 2017. ​
https://arxiv.org/pdf/1703.09282.pdf

Система выбора и настройки алгоритмов кластеризации на основе
SMBO & AT
Руководители:​Муравьёв Сергей (​mursmail@gmail.com​)
Уровень:​​бакалаврская​/магистерская(?)

Описание предметной области:
Существует масса алгоритмов кластеризации и способов оценки разбиений, которые они
производят. Однако ни универсального алгоритма, ни универсальной метрики не
существует и построить таковые невозможно. В рамках данной работы предлагается
разработать алгоритм, который, учитывая метрику оценки разбиения в качестве целевой
функции, производит поиск и настройку алгоритма кластеризации для подающегося на вход
набора данных.
Цель работы: ​разработать новый алгоритм поиска и настройку кластеризационной модели
на основе метода Active Testing с использованием запусков, полученных при помощи
SMAC-алгоритма.
Что следует сделать ​Изучить предметную область, почитать статьи про существующие
алгоритмы кластеризации и метрики их оценки, почитать про методы оптимизации SMBO.
Изучить существующие методы и выявить их недостатки Построить алгоритм и
провалидировать его на реальных данных. Убедиться, что построенный метод превосходит
по времени работы и по качеству результатов SMAC и Active Testing в отдельности.
Ожидаемые результаты: ​оптимизационный алгоритм, который принимает на вход метрику
оценки и набор данных и выдаёт настроенную модель, соответствующее наилучшему
значению заданной метрики.
Требования: ​знание Python, начальные знания теории оптимизации, умение разбираться в
технической литературе на английском языке, отсутствие академических задолженностей,
высокая коммуникативность​.
Источники
1) Leite R., Brazdil P., Vanschoren J. Selecting classification algorithms with active testing
//International workshop on machine learning and data mining in pattern recognition. – Springer,
Berlin, Heidelberg, 2012. – С. 117-131.
https://www.researchgate.net/profile/Joaquin_Vanschoren/publication/260311386_Selecting_Classi
fication_Algorithms_with_Active_Testing/links/55ca0be008aeb975674a400f.pdf
2) Feurer M., Springenberg J. T., Hutter F. Initializing Bayesian Hyperparameter Optimization via
Meta-Learning //AAAI. – 2015. – С. 1128-1135.
http://www.aaai.org/ocs/index.php/AAAI/AAAI15/paper/download/10029/9349
3) Arbelaitz O. et al. An extensive comparative study of cluster validity indices //Pattern Recognition. –
2013. – Т. 46. – №. 1. – С. 243-256.
https://ccc.inaoep.mx/~ariel/2013/An%20extensive%20comparative%20study%20of%20cluster%20
validity%20indices.pdf
4) An Impossibility Theorem for Clustering ​
https://www.cs.cornell.edu/home/kleinber/nips15.pdf
5) Hennig C. Cluster validation by measurement of clustering characteristics relevant to the user
//arXiv preprint arXiv:1703.09282. – 2017. ​
https://arxiv.org/pdf/1703.09282.pdf

Система выбора и настройки алгоритмов классификации на основе
SMBO & AT
Руководители:​Муравьёв Сергей (​mursmail@gmail.com​)
Уровень:​​бакалаврская​/магистерская(?)
Описание предметной области:
Существует масса алгоритмов классификации. Однако универсального алгоритма не
существует и построить таковой невозможно. В рамках данной работы предлагается
разработать алгоритм, который производит поиск и настройку алгоритма классификации
для подающегося на вход набора данных.
Цель работы: ​разработать новый алгоритм поиска и настройку классификационной
модели на основе метода Active Testing с использованием запусков, полученных при
помощи SMAC-алгоритма.
Что следует сделать ​Изучить предметную область, почитать статьи про существующие
алгоритмы классификации, почитать про методы оптимизации SMBO. Изучить
существующие методы и выявить их недостатки Построить алгоритм и провалидировать
его на реальных данных. Убедиться, что построенный метод превосходит по времени
работы и по качеству результатов SMAC и Active Testing в отдельности.
Ожидаемые результаты: ​оптимизационный алгоритм, который принимает на вход метрику
оценки и набор данных и выдаёт настроенную модель, соответствующее наилучшему
значению заданной метрики.
Требования: ​знание Python, начальные знания теории оптимизации, умение разбираться в
технической литературе на английском языке, отсутствие академических задолженностей,
высокая коммуникативность​.
Источники
1) Leite R., Brazdil P., Vanschoren J. Selecting classification algorithms with active testing
//International workshop on machine learning and data mining in pattern recognition. – Springer,
Berlin, Heidelberg, 2012. – С. 117-131.
https://www.researchgate.net/profile/Joaquin_Vanschoren/publication/260311386_Selecting_Classi
fication_Algorithms_with_Active_Testing/links/55ca0be008aeb975674a400f.pdf
2) Feurer M., Springenberg J. T., Hutter F. Initializing Bayesian Hyperparameter Optimization via
Meta-Learning //AAAI. – 2015. – С. 1128-1135.
http://www.aaai.org/ocs/index.php/AAAI/AAAI15/paper/download/10029/9349

Интеллектуальное удаление объектов
по нескольким фотоснимкам с разных ракурсов
Руководители​: Ефимова В.А. (valeryefimova@gmail.com), Фильченков А.А. (aaafil@mail.ru)
Уровень​: бакалаврская/магистерская
Описание предметной области
На вход даются несколько снимков, сделанные с разных ракурсов, нужно удалить с
итоговой фотографии набор указанных объектов: люди, провода, дорожные знаки, столбы.
Сейчас это реализуется следующим образом: делается несколько снимков с одной
точки, объекты, поменявшие свое положение замещаются неподвижными частями фона, а
стационарные нежелательные объекты остаются. Adobe Photoshop позволяет удалить
выделенный вручную объект, но для получения удовлетворительного результата
выделение не должно пересекать каких-либо границ.
Цель работы​: Требуется решить задачу более интеллектуально, методами машинного
обучения (с помощью нейронных сетей) и полностью автоматически удалять
нежелательные объекты.
Что следует сделать​:
● Находить на фото людей, провода, дорожные знаки, столбы.
● Находить на других фото области, которые перекрываются.
● Достоверно совмещать области.
● Оценивать результат.
Ожидаемые результаты​: android или десктопное приложение, в котором реализован
придуманный алгоритм. Программа должна обрабатывать фотоснимки и высокого
разрешения.
Требования​: приложение должно быть реализовано на java/kotlin/python.
Источники​:
● Shotton, Jamie, et al. "Textonboost for image understanding: Multi-class object recognition
and segmentation by jointly modeling texture, layout, and context." International Journal of
Computer Vision 81.1 (2009): 2-23. ​https://arxiv.org/pdf/1511.07122.pdf
● Fang, Chiung-Yao, et al. "An automatic road sign recognition system based on a
computational model of human recognition processing." Computer vision and Image
understanding 96.2 (2004): 237-268.
https://www.sciencedirect.com/science/article/pii/S1077314204000761

●

Про приложение камеры в Asus ZenFone
https://edgeup.asus.com/2018/introducing-zenfone-5z-ai-snapdragon-845/

Автоматическое исправление искажений на фотографии
с помощью нейронных сетей
Руководители​: Ефимова В.А. (valeryefimova@gmail.com), Фильченков А.А. (aaafil@mail.ru)
Уровень​: бакалаврская
Описание предметной области
Из-за свойств линз фотографии приобретают специфические искажения
перспективы: вертикальные, горизонтальные бочкообразные. ​Для их исправления
существуют алгоритмы, но само обнаружение искажений происходит вручную, например,
искажения можно исправлять с помощью Adobe Photoshop.
Цель работы​: ​автоматически в пост-обработке исправлять искажения с помощью
нейронной сети. После этого фотография изменит свою форму, так что требуется
достроить ее до прямоугольника указанных пропорций.
Что следует сделать​:
● Найти границы объектов на фото с помощью сверточных фильтров.
● Определить искажения (объекты по краям изображения, которые неправильно
выровнены).
● Применить алгоритм исправления искажений.
● Достроить края изображения.
Ожидаемые результаты​: приложение, позволяющее в автоматическом режиме
исправлять искажения на фотографиях.
Требования​: приложение должно быть реализовано на java/kotlin/python.
Источники​:
● Про искажения в целом:
http://home.agh.edu.pl/~kwant/wordpress/wp-content/uploads/KSzczesny_thesis_v5.pdf
● Sawhney, Harpreet S., and Rakesh Kumar. "True multi-image alignment and its
application to mosaicing and lens distortion correction." ​IEEE Transactions on Pattern
Analysis and Machine Intelligence​21.3 (1999): 235-243.
https://pdfs.semanticscholar.org/3cec/1c5c4dd1aa47d92e24d06bc5970f32b7c826.pdf
● Простейший алгоритм для исправления искажений:
http://www.tannerhelland.com/4743/simple-algorithm-correcting-lens-distortion/

Создание обложки художественной книги по ее краткому содержанию с 
помощью нейронных сетей 
Руководители​: Ефимова В.А. (valeryefimova@gmail.com), Фильченков А.А. (aaafil@mail.ru)
Уровень​: курсовая/бакалаврская/магистерская
Описание предметной области: ​Автор пишет новую книгу, но не создает для нее обложки.
Ее можно создать, привлекая к работе художника, а можно сгенерировать без
использования человеческого труда.
Цель работы​: Сгенерировать правдоподобную обложку для художественной книги.
Что следует сделать​:
● Выделить из краткого содержания художественного текста ключевые слова (3-7).
● Автоматически выбрать из базы картинки по ним.
● Автоматически подбирать картины (допустим, из живописи), которые позволят
объединить выбранные по словам картинки.
● Пользователь выбирает стиль, в котором будет выполнено итоговое изображение
(не по названию, а по одной из картинок предложенных на предыдущем шаге).
● Требуется соединить изображения по данным словам (возможно, при этом исключив
некоторые) и сделать их похожими на выбранную картинку. Это делается
нейросетью с применением neural style transfer.
Ожидаемые результаты​: Адекватное изображение.
Требования​: Программа должна быть написана на языке Java или Python.
Источники​:
● Carretero-Campos, C., et al. "Improving statistical keyword detection in short texts:
Entropic and clustering approaches." ​Physica A: Statistical Mechanics and its Applications
392.6 (2013): 1481-1492.
https://www.sciencedirect.com/science/article/pii/S0378437112010175
● https://en.wikipedia.org/wiki/Part-of-speech_tagging
●

●

●

Ghiasi, Golnaz, et al. "Exploring the structure of a real-time, arbitrary neural artistic
stylization network." ​arXiv preprint arXiv:1705.06830​(2017).
https://arxiv.org/pdf/1705.06830.pdf
Neural Style Transfer
https://medium.com/tensorflow/neural-style-transfer-creating-art-with-deep-learning-using-t
f-keras-and-eager-execution-7d541ac31398
Neural Style Transfer
https://medium.com/artists-and-machine-intelligence/neural-artistic-style-transfer-a-compre
hensive-look-f54d8649c199

Визуальный автопилот для DJI дрона 
Руководители​: Шаламов В. В. (​sslavian812@yandex.ru​), Фильченков А.А. (aaafil@mail.ru)
Уровень​: курсовая/бакалаврская/магистерская
Описание предметной области
Компания DJI выросла из автопилотов для квадрокоптеров.
Их дроны летают великолепно, используя данные из множества источников:
- GPS,
- компас
- IMU (inertial measurement unit, measures and reports an object's specific force, angular velocity
and attitude (including its course angle, pitch angle, and roll angle) using data from an
accelerometer, gyroscope, thermometer, and barometer.).
- ультразвуковые сенсоры
- визуальные сенсоры (вертикальные и горизонтальные).
Потребительские дроны стоят 1-2к$, более продвинутые модели 3-5к$ и больше.
Используются для любительской и профессиональной съёмки видео и фото с воздуха.
Если у дрона пропадает связь с пультом или заканчивается аккумулятор, он возвращается
на точку взлета автоматически, используя GPS.
В последнее время все более популярными и дешевыми становятся "глушилки",
устройства, наводящие помехи на частоты 2.4, 5, и диапазоны GPS L1, L2 и L5.
Если у дрона пропал сигнал GPS (что обычно не происходит по естественным причинам),
он либо сразу садится на землю, либо "висит на месте" и дрейфует по ветру, пока не сядет
аккумулятор и не будет включена аварийная посадка.
В таком случае дрон с большой вероятностью либо садится на "вражескую территорию",
либо может сесть где-то в воду или на деревья.
Велик риск потерять довольно дорогой дрон.
Планируется использовать также данные о том, по какому пути дрон летел, пока GPS был.
Цель - разработать систему, которая поможет дрону быстро вылететь из зоны помех,
вернув контроль пилоту, либо полностью вернуться на точку взлета, ориентируясь на видео
с камеры(камер) сенсоров-камер, компаса, датчика высоты.
(Без GPS и контроля со стороны оператора).

Основные задачи:
- склейка изображений с камеры (основной камеры у большинства дронов, либо “ходовой” у
DJI Inspire2) и информации с датчиков
- матчить картинки с камеры по GPS и визуально с изображением с Google Earth
- поиск текущей картинки "под дроном" в (*)
- работа с DJI API, реализация режима полета "по картинке"
DJI developers API - изучить, что у них есть.
Визуальный возврат домой:
- Ограниченная скорость.
- периодические фото основной камерой вниз (кроме съёмки видео)
- постоянные фото нижними (мелкими) камерами, склейка и матчинг по карте и
координатам.
- при потере всего - дрон ищет себя визуально камерой, возвращается по прошлому
маршруту как летел
Может быть сложно, но хотя бы надо улететь из зоны потери сигнала.
Возврат домой по направлению:
- дрон уже умеет отслеживать свой маршрут по карте.
- скорее всего умеет логировать все повороты и смещения.
=> Можно вычислить по карте, на сколько надо сместиться (вектор домой)
НО: сильный ветер может значительно сносить дрон
=> Ориентироваться по камерам вниз.
Очень не точно, нужно как можно скорее выйти из области глушилки и вернуться.

Цель работы​:
Цель - разработать систему, которая поможет дрону быстро вылететь из зоны помех,
вернув контроль пилоту, либо полностью вернуться на точку взлета, ориентируясь на видео
с камеры(камер) сенсоров-камер, компаса, датчика высоты.
(Без GPS и контроля со стороны оператора).

Что следует сделать​:
●
●

Разработка алгоритмов склейки изображений, визуальное позиционирование по
камере, датчикам, нестабильному GPS и всему остальному что доступно.
Реализация мобильного приложения \ плагина к DJIgo, который позволит дрону
летать по “визуальному автопилоту”

Ожидаемые результаты​: дрон умеет себя позиционировать и летать по визуальному
автопилоту некоторое расстояние или хотя бы умеет возвращаться из зоны потери сигнала
обратно, бороться с ветром
Требования​: Знание C++, алгоритмов. Любовь к дронам.
Источники​:
● http://14.139.186.108/jspui/bitstream/123456789/31653/1/Elements%20of%20Aerial%20P
hoto%20Interpretation.pdf
● http://developer.dji.com/
● https://mirquadrocopterov.ru/obshhie-voprosy/datchiki-uderzhaniya-vysoty-drona.html
● https://www.jammer-store.com/drones-frequencies.html
● https://link.springer.com/article/10.1007/s10846-010-9489-5

Обращение Random Forest 
Руководители​: Шаламов В. В. (​sslavian812@yandex.ru​), Фильченков А. А. (aaafil@mail.ru)
Уровень​: бакалаврская
Описание предметной области
Алгоритм машинного обучения Random Forest (Множество деревьев решений) позволяет по
вектор признаков предсказывать некую целевую величину.
Задача состоит в том, чтобы научиться по Random Forest’у получать ту область
пространства, на векторах из которой будет наблюдаться экстремум (наибольшие или
наименьшие значения целевой величины).
Обратить одно дерево легко: найти наибольший\наименьший лист, подниматься до корня
дерева, в каждом из узлов применяя каждое ограничение по пути.

Цель работы​:
Задача состоит в том, чтобы научиться по Random Forest’у получать ту область
пространства, на векторах из которой будет наблюдаться экстремум (наибольшие или
наименьшие значения целевой величины).
Что следует сделать​:
● Реализовать свой Random Forest (можно переделать библиотечный код из
scikit-learn)
● Добавить возможность “обращать его”, то есть находить в его области определения
подмножество, на котором ожидается экстремум

Ожидаемые результаты​: Реализация Random Forest’а, которая помимо стандартного API
поддерживает ответ на “а на каких векторах будет предсказано наибольшее значение”.
Требования​: Знание Python. Бонусом будет знание C++
Источники​:
● http://scikit-learn.org/stable/modules/generated/sklearn.ensemble.RandomForestRegresso
r.html
● https://habr.com/post/320726/

Исследование отсекающих правил ансамблей фильтрующих
алгоритмов выбора признаков
Руководители:​Сметанников Иван (​smeivan@mail.ru​)
Уровень:​бакалаврская/магистерская
Описание предметной области:​Одной из основных проблем машинного обучения
является “проклятие размерности”, когда число признаков в наборе данных сопоставимо
или превосходит число объектов, либо просто очень велико. Чтобы решить данную
проблему применяются алгоритмы уменьшения размерности, в частности алгоритмы
выбора признаков. Наиболее быстрыми и, как следствие, применимыми к большим
массивам данным являются фильтрующие алгоритмы выбора признаков (далее фильтры),
а также ансамблирующие алгоритмы выбора признаков, основанные на фильтрах.
Сами фильтры состоят из двух частей: меры значимости признаков (или ранжирующей
метрики), и отсекающего правила. Мера позволяет оценивать насколько выбранный
признак или множество признаков релевантно решаемой задаче, а отсекающее правило
основываясь на полученных значениях метрики решает какие признаки нужно оставить, а
какие отсечь. При этом, в данной области машинного обучения, остается открытым вопрос
выбора “адекватного” отсекающего правила, так как в большинстве случаев, несмотря на
явную зависимость получаемых от этого результатов, оно выбирается “на глаз”.
Цель работы: ​предложить новое отсекающее правило, которое обладало бы высокой
устойчивостью по входным данным и давало преимущество в качестве получаемых
моделей машинного обучения по сравнению с другими отсекающими правилами для
ансамблей фильтрующих алгоритмов выбора признаков
Что следует сделать: ​Прочесть несколько статей по алгоритмам выбора признаков,
фильтрующим алгоритмам выбора признаков и ансамблей фильтрующих алгоритмов
выбора признаков. Изучить предметную область на наличие статей по отсекающим

правилам, провести аналитический обзор. Реализовать систему, осуществляющую выбор
признаков путем ансамблирования фильтров на основе метода MeLiF для заданного
набора данных, позволяющую исследовать различные отсекающие правила как на
качество, так и на стабильность получаемых результатов. Реализовать множество
существующих отсекающих правил, провести различные вычислительные эксперименты и
провести их анализ. На основе проведенного анализа предложить несколько новых
отсекающих правил, провести их экспериментальное исследование, выбрать лучшее. По
необходимости заузить предлагаемые рекомендации на некоторую прикладную
предметную область.

Ожидаемые результаты: ​новая мера значимости признаков, её экспериментальное
исследование, рекомендации по прикладному использованию. Англоязычная статья
Scopus/WoS.
Требования: ​знание Java, начальные знания теории оптимизации, умение разбираться в
технической литературе на английском языке, отсутствие академических задолженностей,
высокая коммуникативность​.
Источники
1) A review of feature selection techniques in bioinformatics
https://academic.oup.com/bioinformatics/article-abstract/23/19/2507/185254
2) An ensemble of filters and classifiers for microarray data classification.
https://www.sciencedirect.com/science/article/pii/S0031320311002718
3) MeLiF: filter ensemble learning algorithm for gene selection
https://www.ingentaconnect.com/contentone/asp/asl/2016/00000022/00000010/art00081

Исследование применимости мета-обучения для выбора отсекающих
правил ансамблей фильтрующих алгоритмов выбора признаков
Руководители:​Сметанников Иван (​smeivan@mail.ru​)
Уровень:​бакалаврская
Описание предметной области:​Одной из основных проблем машинного обучения
является “проклятие размерности”, когда число признаков в наборе данных сопоставимо
или превосходит число объектов, либо просто очень велико. Чтобы решить данную
проблему применяются алгоритмы уменьшения размерности, в частности алгоритмы
выбора признаков. Наиболее быстрыми и, как следствие, применимыми к большим
массивам данным являются фильтрующие алгоритмы выбора признаков (далее фильтры),
а также ансамблирующие алгоритмы выбора признаков, основанные на фильтрах.

Сами фильтры состоят из двух частей: меры значимости признаков (или ранжирующей
метрики), и отсекающего правила. Мера позволяет оценивать насколько выбранный
признак или множество признаков релевантно решаемой задаче, а отсекающее правило
основываясь на полученных значениях метрики решает какие признаки нужно оставить, а
какие отсечь. При этом, в данной области машинного обучения, остается открытым вопрос
выбора “адекватного” отсекающего правила, так как в большинстве случаев, несмотря на
явную зависимость получаемых от этого результатов, оно выбирается “на глаз”.
Мета-обучение является одним из относительно новых разделов машинного обучения,
которое позволяет по предварительно собранной статистике запусков алгоритма
машинного обучения на различных наборах данных из некоторой предметной области,
позволяет оптимизировать запуск данного алгоритма на новых наборах данных из той же
предметной области.
Цель работы: ​разработать систему мета-обучения, позволяющую выбирать отсекающее
правило для заданного набора данных
Что следует сделать: ​Прочесть несколько статей по алгоритмам выбора признаков,
фильтрующим алгоритмам выбора признаков, ансамблей фильтрующих алгоритмов
выбора признаков, мета-обучению. Изучить предметную область на наличие статей по
отсекающим правилам, провести аналитический обзор. Реализовать систему,
осуществляющую выбор признаков путем ансамблирования фильтров на основе метода
MeLiF для заданного набора данных, позволяющую исследовать различные отсекающие
правила как на качество, так и на стабильность получаемых результатов. Реализовать
множество существующих отсекающих правил, провести различные вычислительные
эксперименты на большом числе наборов данных, собрать информацию по запускам.
Реализовать систему-мета обучения, позволяющую по заданному набору данных
определять его мета-признаки и рекомендовать наиболее релевантное отсекающее
правило. Провести экспериментальное исследование построенной системы.

Ожидаемые результаты: ​система мета-обучения для выбора меры значимости признаков,
её экспериментальное исследование, рекомендации по прикладному использованию.
Англоязычная статья Scopus/WoS.
Требования: ​знание Java, начальные знания теории оптимизации, умение разбираться в
технической литературе на английском языке, отсутствие академических задолженностей,
высокая коммуникативность​.
Источники
1) A review of feature selection techniques in bioinformatics
https://academic.oup.com/bioinformatics/article-abstract/23/19/2507/185254

2) An ensemble of filters and classifiers for microarray data classification.
https://www.sciencedirect.com/science/article/pii/S0031320311002718
3) MeLiF: filter ensemble learning algorithm for gene selection
https://www.ingentaconnect.com/contentone/asp/asl/2016/00000022/00000010/art00081
4) Metalearning: Applications to data mining
https://books.google.ru/books?hl=en&lr=&id=-Gsi_cxZGpcC&oi=fnd&pg=PA1&dq=+Metalearning:+
applications+to+data+mining&ots=wj-Kk_tvQm&sig=McWmQ6P2clCJEov8iULHW3jcU6k&redir_es
c=y#v=onepage&q=Metalearning%3A%20applications%20to%20data%20mining&f=false

Открытая тема по обработке естественного языка в информационном 
поиске 
Руководители​: Фильченков А. А. (​aaafil@mail.ru​), Чивилихин Д.С. (chivdan@gmail.com)
Уровень​: магистерская
Описание предметной области
Требуется разработать поисковую систему для научных статей, позволяющую выполнять
эффективный и качественный поиск по относительно небольшой базе статей по узкой
тематике. За основу можно взять один из свободно распространяемых поисковых движков с
открытым исходным кодом. Требуется изучить современные результаты и открытые задачи
в области обработки естественного языка для информационного поиска, предложить и
разработать методы, обеспечивающие максимально полные и релевантные результаты
поиска по заданному запросу.
Работа будет выполняться в рамках научного проекта с компанией Corning, одним из
крупнейших в мире производителей стекла и оптоволокна.
Цель работы​: Разработать поисковую систему для научных статей.
Что следует сделать​: На начальном этапе проекта (до конца 2018 года) необходимо
провести глубокий аналитический обзор существующих методов, современных трендов и
открытых задач в области обработки естественного языка для информационного поиска.
Конкретная научная задача будет сформулирована на основе результатов обзора.
Работа будет выполняться в рамках научного проекта с компанией Corning, одним из
крупнейших в мире производителей стекла и оптоволокна.
Ожидаемые результаты​:

●

Результат первого этапа - научно-технический отчет по обработке естественного
языка для информационного поиска, содержащий сформулированные направления
возможных исследований.
● Итоговый результат - разработанная поисковая система.
Требования​:
● Ответственность и коммуникабельность.
● Работа на очной основе в МНЛ КТ.
● Понимание принципов работы методов машинного обучения и опыт их применения.
Источники​: ...

Обфускация данных для машинного обучения 
Руководители​: Фильченков А. А. (​aaafil@mail.ru​), Чивилихин Д.С. (chivdan@gmail.com)
Уровень​: бакалаврская / магистерская
Описание предметной области
При применении машинного обучения часто встает вопрос приватности данных. Например,
компания-заказчик-обладатель-данных хочет проанализировать свои данные с помощью
машинного обучения в другой компании или университет. Однако данные содержат
коммерческую тайну, поэтому передавать их в “сыром” виде нельзя.
Работа будет выполняться в рамках научного проекта с компанией Corning, одним из
крупнейших в мире производителей стекла и оптоволокна.
Цель работы​: разработать систему для обфускации табличных и графических данных,
позволяющую эффективно применять методы машинного обучения на полученных
обфусцированных данных.
Что следует сделать​:
●
●
●
●

Провести аналитический обзор существующих подходов к обфускации данных.
Проанализировать примеры данных, предоставленные компанией, и подобрать
подходящие методы.
Разработать и реализовать методы обфускации.
Протестировать предложенные решения.

Ожидаемые результаты​:
Реализованная работающая система.

Требования​:
● Ответственность и коммуникабельность.
● Понимание принципов работы методов машинного обучения и опыт их применения.
● Работа на очной основе в МНЛ КТ.
Источники​: ..

Применение B-сплайнов (NURBS) в методе Embedded Deformation 
Руководитель: Роман Безбородов (​br-7@mail.ru​)
Уровень​: бакалаврская / магистерская
Применение в задачах компьютерной графики, а в частности для манипуляции 3D
моделей.
Задача экспериментальная и не факт, что получится, но попробовать было бы здорово.
Лучше для магистра, так как если тема не пойдет, то времени делать новую уже не
будет.

Использование спектральных поверхностных дескрипторов в задачах 
распознавания пространственных объектов на 3D сцене 
Руководитель: Роман Безбородов (​br-7@mail.ru​)
Уровень​: бакалаврская / магистерская
Берем геодезические сверточные сети или другие аналогичные и учимся распознавать
объекты.
В задаче крайне сложная математика, но код для дескрипторов и нейросетей у меня
уже имеется. Остается попробовать собрать датасет и использовать имеющиеся
наработки для детектирования.
P.S. Спектральные дескрипторы особенно хороши для деформируемых моделей,
поэтому класс решаемых задач лучше распространить на тему с детектированием
деформированных моделей

Семантическая сегментация 3D сцен 
Руководитель: Роман Безбородов (​br-7@mail.ru​)
Уровень​: бакалаврская / магистерская
Берем нейронки для 3D и генеративную сеть, получаем сегментацию.

Генеративные модели для улучшения 3D сцены, восстановленной 
фотограмметрией / заполнение отверстий в 3D моделях с помощью 
генеративных нейросетей 
Руководитель: Роман Безбородов (​br-7@mail.ru​)
Уровень​: бакалаврская / магистерская
Все те же сверточные-генеративные сети в 3D для улучшения качества реконструкции.

Генерация трехмерных моделей по фотографии 
Руководитель: Роман Безбородов (​br-7@mail.ru​)
Уровень​: бакалаврская / магистерская
Сейчас в основном на вокселях. Можно сразу топологию. Все еще нужны нейронки.

Transformer-based multi-document scientific abstracts generation 
Руководитель: Денис Степанов (​denis.stepanov@jetbrains.com​)
Уровень​: бакалаврская / магистерская
Описание предметной области. ​Natural Language Processing (NLP) - область
глубокого обучения, решающая задачи связанные с естественным языком: машинный
перевод, реферирование текста, генерация текста, разметка текста, генерация ответов
на вопросы. Обычно системы глубокой обработки текста состоят из кодировщика (часто
это рекуррентная нейронная сеть), переводящего поступающие на вход предложения в
вектор скрытых состояний, и декодировщика, генерирующего результирующую
последовательность (текст, перевод) из последовательности скрытых состояний.
Поскольку порядок слов в исходном предложении и в переводе часто не совпадает,
был предложен механизм выравнивания [1] который стал называться механизмом
внимания (Attention) и получил широкое распространение в моделях глубокой
обработки естественного языка. Использование рекуррентных сетей в стандартных
моделях типа кодировщик-декодировщик приводит к тому, что эти модели медленно
обучаются. Для решения проблемы медленного обучения было предложено построить
кодирование-декодирвание с использованием только механизма Attention [2].
Предложенная архитектура была названа Transformer, она позволила улучшить
state-of-the-art результаты и сократить время обучения модели. В задаче
реферирования текста важно иметь возможность работать с очень длинными кусками
текста, что стало возможным благодаря вариации архитектуры Transformer, в которой
используется только декодировщик - Transformer Decoder [3]. При использовании
детерминированного кодирования-декодирования наблюдается сокращение
разнообразия генерируемого текста, что предлагается решать с помощью

вариационного варианта Attention (Variational Attention) [4], устроенного по аналогии с
вариационным автоэнкодером (VAE применительно к генерации текста - см. [5]).
Ежедневно появляется множество новых научных статей по различным областям
знания, прочитать которые не представляется возможным. Специалист в предметной
области может выделить ряд объектов, новые факты относительно которых он хотел
бы иметь возможность извлекать из корпуса статей. Эту задачу можно рассматривать
как задачу реферирования множества статей по заданным ключевым понятиям,
которую можно решать с помощью архитектур подобных Transformer. В научных
статьях есть множество объектов, находящихся друг с другом не в текстовом
взаимодействии (различные числовые величины, названия специфических объектов),
для которых хотелось бы получить вероятностное семантическое вложение по
аналогии с тем, которое получается при обучении вариационных автоэнкодеров.
Цель работы. ​Построить модель для реферирования коллекции научных статей по
заданным ключевым понятиям.
Что следует сделать. ​Реализовать базовую модель language model на базе
Transformer. Исследовать объединение архитектур Transformer и Variational Attention в
задаче language modeling. Проверить, позволяет ли Variational Attention получить
осмысленное представление в вероятностном пространстве для объектов типа числа и
названия специфических объектов. Предложить архитектуру Variational Transformer для
реферирования статей.
Ожидаемые результаты. ​Работающий алгоритм реферирования научных статей,
построенный на базе новой архитектуры, совмещающей Transformer и Variational
Attention.
Требования. ​Знакомство с задачами глубокого обучения (хороший ориентир - книга С.
Николенко, А.Кадурин, Е.Архангельская Глубокое обучение. Погружение в мир
нейронных сетей)
Источники.
[1] Neural Machine Translation by Jointly Learning to Align and Translate
https://arxiv.org/abs/1409.0473
[2] Attention is all you need ​https://arxiv.org/abs/1706.03762
[3] Generating wikipedia by summarizing long sequences ​
https://arxiv.org/abs/1801.10198
[4] Variational Attention for Sequence-to-sequence models ​
https://arxiv.org/abs/1712.08207
[5] Generating Sentences from a Continuous Space ​
https://arxiv.org/abs/1511.06349

Language Modelling with Deep Transformers for Generating Pseudo-Scientific 
Texts 
Руководитель: Денис Степанов (​denis.stepanov@jetbrains.com​)
Уровень​: бакалаврская / магистерская
Описание предметной области. ​Natural Language Processing (NLP) - область
глубокого обучения, решающая задачи связанные с естественным языком: машинный
перевод, реферирование текста, генерация текста, разметка текста, генерация ответов
на вопросы. Обычно использующаяся для решения этих задач архитектура
представляет собой кодировщик-декодировщик, кодирующий входящий текст в скрытое
представление (последовательность векторов) и прогнозирующий выходные значения
на основе векторов из скрытого представления. Кодирование и декодирование обычно
производится с помощью рекуррентных или конволюционных нейронных сетей.
Использование векторов фиксированной размерности в скрытом представлении
является узким местом этих моделей в случае работы с длинными входящими
последовательностями. Для решения этой проблемы было предложено использовать
механизм внимания (Attention) который позволяет придавать веса предшествующим
векторам скрытого представления в зависимости от из важности для решаемой задачи
(например прогнозирования следующего элемента выходной последовательности) [1].
Окончательное оформление идея использования механизма внимания обрела в статье
[2], где было предложено вовсе отказаться от рекуррентных сетей в пользу
использования механизма внимания для построения как кодировщика так и
декодировщика. Данная архитектура получила название Transformer и позволила
получить новые значения state-of-the-art при значительно меньшем времени обучения.
Для работы с длинным контекстом было предложено [3] строить многослойные модели
Transformer-ов и использовать посимвольную обработку входящей
последовательности.
Существующий и непрерывно пополняющийся корпус научных статей из различных
областей знания приводит к необходимости предварительной машинной обработки
этих текстов для поиска релевантных результатов. Одной из задач, которую при этом
нужно решать является задача генерации текста (language modeling) из доменной
области.

Цель работы. ​Построить модель генерации текста по корпусу научных статей
корректно работающую с числовыми данными различной природы и редкими словами
(названиями специфических объектов из доменной области).
Что следует сделать. ​Построить многослойный Transformer [3] для посимвольной
обработки текста. Обучить Byte Pair Encoding (BPE) для корпуса научных статей и
предложить вариант модификации BPE, работающий с числовыми символами и
специфическими объектами из доменной области (названия и т.п.). Проверить,

комбинируется ли BPE с многослойным трансформером. Исследовать оптимальную
гранулярность входящих данных (посимвольная, BPE, обученное вложение для слов).
Ожидаемые результаты. ​Работающий алгоритм генерации текста по корпусу научных
статей. Нахождение оптимального уровня сжатия входящего текста (уровень символов,
BPE, вложение для слов).
Требования. ​Знакомство с задачами глубокого обучения (хороший ориентир - книга С.
Николенко, А.Кадурин, Е.Архангельская Глубокое обучение. Погружение в мир
нейронных сетей)
Источники.
[1] Neural Machine Translation by Jointly Learning to Align and Translate
https://arxiv.org/abs/1409.0473
[2] Attention is all you need ​https://arxiv.org/abs/1706.03762
[3] Character-level Language Modelling with Deeper Self-Attention
https://arxiv.org/abs/1808.04444

Transformer-based Graph Convolutional Networks for Multi-Document 
Summarization 
Руководитель: Денис Степанов (​denis.stepanov@jetbrains.com​)
Уровень​: бакалаврская / магистерская
Описание предметной области. ​Natural Language Processing (NLP) - область
глубокого обучения, решающая задачи связанные с естественным языком: машинный
перевод, реферирование текста, генерация текста, разметка текста, генерация ответов
на вопросы. Модели нейтронного реферирования текстов активно развиваются в
последнее время. Обычный подход к построению таких моделей состоит в
использовании архитектуры кодировщик-декодировщик, переводящей входную
последовательность в вектора скрытого представления и на их основе строящей
прогноз следующих выходных значений. В статье [1] была предложена архитектура
Transformer, позволяющая значительно ускорить процесс обучения за счет
использования только механизмов внимания Attention [2]. Одной из причин введения в
модели механизма внимания было то, что требовалось работать со все более
длинными кусками входящего текста, что было сложно делать при сворачивании всего
предшествующего контекста в вектор фиксированной размерности. Attention и
Transformer позволили увеличить размер контекста, с которым можно было
эффективно работать и в частности генерировать целые Wikipedia-подобные статьи из
источников [3]. Реферирование производилось в два этапа: сначала выделялись

наиболее значимые предложения (extractive summarization) а затем на их основе
генерировался текст.
При реферировании научных статей желательно учитывать только релевантные
кластеры статей связанные общей узкой тематикой. Задача классификации документов
связанных графом цитирования может быть решена с помощью архитектуры Graph
Convolutional Network [4, 5]. В [6] полученная разметка документов использовалась для
построения реферата по набору документов.
Цель работы. ​Построить модель реферирования научных статей, связанных графом
цитирования.
Что следует сделать. ​Предложить модификацию модели из [6], построенную на
Transformer-подобных архитектурах (в части построения вложений для предложений из
документов и оценке важности предложений на выходе из GCN). Исследовать и
визуализировать получающиеся кластеры документов. Построить модель
реферирования на базе Transformer и GCN.
Ожидаемые результаты. ​Работающий алгоритм классификации частично
размеченных научных статей, связанных графом цитирования.
Требования. ​Знакомство с задачами глубокого обучения (хороший ориентир - книга С.
Николенко, А.Кадурин, Е.Архангельская Глубокое обучение. Погружение в мир
нейронных сетей)
Источники.
[1] Attention is all you need ​https://arxiv.org/abs/1706.03762
[2] Neural Machine Translation by Jointly Learning to Align and Translate
https://arxiv.org/abs/1409.0473
[3] Generating wikipedia by summarizing long sequences ​
https://arxiv.org/abs/1801.10198
[4] Semi-Supervized Classification with Graph Convolutional Networks
https://arxiv.org/abs/1609.02907
[5] Convolutional Neural Networks on Graphs with Fast Localized Spectral Filtering
https://arxiv.org/abs/1606.09375
[6] Graph-based Neural Multi-Document Summarization ​
https://arxiv.org/abs/1706.06681

Распознавание дерматологических структур на изображениях родинок 
Руководитель: Татьяна Полевая (​tanusha2406@gmail.com​)
Уровень​: бакалаврская, инженерная, из которой может получиться научная

Цель работы
Разработать программу, способную распознавать какую-то дерматологическую структуру
на родинках

Что предполагается делать
Воспроизвести результат команды, успешно принявшей участие в соревнованиях по
анализу родинок, и применить перенос обучения на имеющийся небольшой датасет. Затем
улучшить архитектуру сети и получить более качественные результаты.

Распределенный алгоритм иерархической кластеризации сообществ в 
социальном графе 
Руководитель: Артем Попов (​artpop92@gmail.com​)
Уровень​: бакалаврская, инженерная, из которой может получиться научная
Ключевые слова:​машинное обучение, распределенные системы, кластеризация, анализ
социальных сетей, рекомендательные системы, разработка признаков
Описание предметной области​Сообщества в социальных сетях – важный объект интереса для
извлечения знаний о пользователях и их интересах. Сообщества состоит из списка участников и
содержимого сообщества – описание, записи. Если построить иерархическую кластеризацию
сообществ, то можно получить хороший инструмент для множества прикладных задач, связанных с
машинным обучением и анализом данных.
Иерархическая кластеризация на примере может выдать вот такой результат:
Группа студентов year2015
KT Memes
...
->
Кафедра компьютерных технологий
Кафедра информационных систем
->
Университет ИТМО
В таком примере мы уже сможем автоматически делать выводы о том, что скорей всего участник
группы KT Memes – студент университета.

По такой структуре можно решать много полезных задач – выделять новые представления
пользователей и сообществ для использования их в качестве признаков в различных задачах
рекомендаций и профилирования пользователя, автоматически строить иерархию интересов
пользователей, искать аномалии и накрутки подписчиков.
Проблема в том, что когда масштаб задачи – миллионы сообществ, где для вычисления функции
похожести нужно сравнивать множества пользователей размером до нескольких миллионов –
классические методы кластеризации не работают.
Цель диплома:​Вашей задачей будет исследовать существующие методы решения такой задачи,
проверить их применимость на домене сообществ на реальных данных из VK, при необходимость
довести существующие методы до практической применимости и проверить полученный результат
на наборе прикладных задач, нуждающихся в подобном графе сообществ.

Обучение метрики похожести сообществ с помощью выделения 
векторного представления 
Руководитель: Артем Попов (​artpop92@gmail.com​)
Ключевые слова: машинное обучение, глубокое обучение, выделение векторного
представления, анализ социальных сетей, рекомендательные системы.
Описание темы:​векторное представление (эмбеддинги) – способ представить некоторый
сложный объект в фиксированный вектор чисел таким образом, что расстояние между
такими векторами коррелирует с семантической похожестью объектов реального мира.
Например, если обучить такое представление для сообществ из социальной сети, то
можно, совместив контентную и сессионную информацию, получить очень полезный
инструмент для множества прикладных задач – в первую очередь для рекомендаций,
поиска похожих сообществ и feature engineering в любых ML задачах, связанных с соц
графом.
Современные методы обучения рекомендательных систем и профилирования
пользователей уже тяжело представить без методов глубокого обучения. Есть множество
интересных идей, которые связаны с частичным обучением на графах, которые позволяют
одновременно учитывать структуру объектов и отношений для обучения векторных
представлений (эмбеддингов).
Цель диплома:​в рамках этой работы мы переработаем и уточним идеи 2018 года для
конкретного домена (сообщества в социальной сети), учтем и задумаемся о
масштабируемости таких методов и применим их на реальных данных и задачах.

Поиск мошеннических действий в социальных сетях с помощью методов 
выделения векторного представления в графах 
Руководитель: Артем Попов (​artpop92@gmail.com​)
Ключевые слова:​машинное обучение, анализ данных, выделение векторного представления в
графах, анализ социальных сетей, поиск аномалий.
Описание темы:​Проблема накруток актуальна как для социальных сетей, так и для систем с
возможностью оставлять отзывы от пользователей. Особенно сильно актуальна она для рекламных
систем, где существует механизм оплаты за клик (CPC).
В социальных сетях и системах с пользовательским фидбеком (онлайн магазины, сайты для
рейтингов) накрутки (лайков, комментариев, подписчиков) позволяют манипулировать системой и
пользовательским восприятием. В рекламных системах накрутки напрямую приносят денежный
ущерб рекламодателям и позволяют мошенникам заработать путем обмана.
Атаки на такие системы можно проектировать множеством способов вплоть до очень трудно
замечаемых даже человеком. Типичная ситуация – вредоносное расширение в браузере обычного
пользователя, которое фоном делает дополнительные мошеннические действия. Для поиска таких
накруток необходимо учитывать структуру графа взаимодействий пользователей и объектов атаки
(например, рекламных объявлений или рейтингов для фильмов в кинопоиске). В рамках анализа
графов за последние несколько лет произошел бум работ, посвященных выделению векторных
представлений вершин, что может позволить искать аномалии в таких системах лучше, точнее и
находить более изощренные и нетривиальные способы обмануть систему и пользователей.
Цель диплома:​Вашей задачей будет исследование и применение спектра идей и моделей,
связанных с выделением векторного представления в графах для поиска аномалий в нем. Это
позволит решить сложные и важные прикладные задачи, связанные с поиском мошенничества в
рекламных и социальных сетях.

Профилирование пользователей из профессиональных социальных сетей 
Руководитель: Александр Фарсеев (​farseev@gmail.com​)
Уровень:​магистерская (желательно, на два года и ​работать начинаем сразу​)
Профилирование — одна из основных задач социальных сетей. Мы уже умеем много чего
понимать про то, как предсказывать свойства человека по его профилю.
Цель работы:​предсказывать профессию человека по его параметрам в LinkedIn, CV, и
других соц сетях
Что нужно делать​: собрать данные, разработать фичи, разработать модель
(только для тех магистров ​кто не работает на постоянной основе​вне университета)

Идентификация одного и того же пользователя в различных соц сетях 
Руководитель: Александр Фарсеев (​farseev@gmail.com​)
Уровень​: магистерская
Сама тема представляет собой развитие наших текущих исследований по маппингу
пользователей из одной сети в другую (раньше, в основном, маппилось на основе
идентификатора, хотим мапить на основе данных)
Цель:​поиск человека в одной соц сети на основе информации о нем в другой соц сети
(например, поиск человека в Твиттере на основе его фото в инстаграмме)
Что нужно делать​: Собрать данные, разработать фичи, разработать модель
(только для тех магистров ​кто не работает на постоянной основе​вне университета)

Работа с мультиязычными данными для задачи определения психотипа 
по данным из социальных сетей 
Руководитель: Ксения Бурая​(​
ks.buraya@gmail.com​)
Уровень:​бакалаврская/магистерская
Описание предметной области
Имеется мультимодальный датасет, состоящий из 18 тысяч пользователей Твиттера. Для
каждого пользователя имеется метка его MBTI. Пользователи пишут на 6 различных
языках. На данный момент нет механизма, позволяющий использовать мультиязычные
данные в предсказании психотипа.
Цель работы
Дополнить существующий датасет свежими данными. Проанализировать данные, убрать
старые данные. Разработать метод, позволяющий работать с мультиязычным датасетом в
задаче определения психотипа. Уметь обрабатывать ситуации, когда пользователь может
писать на нескольких языках (например, английский + немецкий). При расширении до
магистерского — дополнить данные геометками (сейчас их практически нет), проверить
добавление новых фич в медиа данные (сентимент картинок).
Ожидаемые результаты
Модель, принимающая на вход мультиязычные текстовые данные, и предсказывающая
MBTI для пользователя.
Источники
- ​Multi-view Personality Profiling Based on Longitudinal Data,
https://link.springer.com/chapter/10.1007/978-3-319-98932-7_2

Темы по дискретной оптимизации и формальным методам в 
киберфизических системах 
Слайды В.Вяткина 
Использование SAT/CSP-решателей в задаче планирования операций 
судов в порту 
Руководители​: Топаж А.Г. , ФГУП Крыловский государственный научный центр
(​alex.topaj@gmail.com​), Ульянцев В.И. (​vl.ulyantsev@gmail.com​), Чивилихин Д.С.
(​chivdan@gmail.com​)
Уровень​: бакалаврская/магистерская
Описание предметной области
Ставится задача создания и программной реализации алгоритма оперативного
составления эффективного расписания операций судов в порту (перемещения между
причалами, швартовки/отшвартовки, грузообработки, заправки) на коротком временном
горизонте планирования (3-5 дней). В качестве условий задачи планирования необходимо
учитывать имеющееся в распоряжении портовых служб число стационарных и движущихся
ресурсов (причалов, буксиров, средств грузообработки), их мощность, явно задаваемые
«окна погоды» для выполнения конкретных типов операций, текущие и прогнозируемые
заявки судов на выполнение погрузочно-разгрузочных работ, ограниченность объема
портовых хранилищ с учетом динамики «внешних» грузопотоков, грузоподъемность
транспортных судов, приоритеты обслуживания заявок различного типа и т.д.
Дополнительным требованием к создаваемому программному модулю выступает малость
времени отклика, допускающее его встраивание в динамическую имитационную модель
работы порта.
Цель работы​:
Ограниченность горизонта планирования и ожидаемо малая размерность задачи
(небольшое число судов, причалов, ресурсов и т.д. в конкретном порту) делают возможным
формулировку задачи нахождения оптимального плана операций в виде проблемы
разрешимости, псевдо-булевой оптимизации, mixed integer programming. Цель
предлагаемой дипломной работы: исследовать принципиальную возможность и
эффективность решения поставленной задачи путем ее сведения к формализациям,

допускающим применение внешних, свободно распространяемых SAT/CSP/MIP-решателей,
таких как lingeling, or-tools, CPLEX.
Что следует сделать​:
● Выполнить аналитический обзор предметной области, в частности, выделить классы
задач планирования операций и существующие методы их решения.
● Составить минимально полную, непротиворечивую и прозрачную информационную
модель (онтологию) предметной области.
● Разработать и реализовать формат представления входных данных для решаемой
задачи.
1. Разработать и программно реализовать алгоритмы сведения задачи к SAT/CSP/MIP.
● Создать репозиторий характерных примеров (кейсов) с учетом различных факторов
- движущиеся средства грузообработки, конкуренция судов за причалы, буксиры,
бункеровщики, множественность грузов, влияние «окон погоды» и т.д.
● Сравнить эффективность различных решателей и алгоритмов сведения на наборе
предопределенных тестов. Сформулировать рекомендации о принципиальной
возможности и эффективности используемых подходов для рассматриваемой
предметной области.
Ожидаемые результаты​: разработанные методы и библиотека со специфицированным
программным интерфейсом, реализующая алгоритмы оптимального планирования.
Публикация в рецензируемом журнале или доклад на международной конференции.
Требования​:
● Трудолюбие и самостоятельность.
● Понимание принципов работы и опыт использования SAT/CSP/MIP решателей будет
плюсом.
Источники​:
● Mathematical model for the Berth Allocation Problem in ports with cargo operation
limitations along the pier
● Optimal Scheduling of Port Operations—Integrated Berth Allocation and Quay Crane
Scheduling

Modular, plugin-based IEC 61499 platform 
Руководители​: ​Sandeep Patil​(​
patsan@ltu.se​), Чивилихин Д.С. (chivdan@gmail.com).
Уровень​: бакалаврская/магистерская (инженерная разработка)
Field description

Softwares and tools for Industrial automation is a challenging field. Unlike many other software
engineering fields, software and tools availability for use in control systems programming for
industrial automation faces some issues such as:
● not so user-friendly;
● lack of open platform;
● lack of plugin support;
● lack of software engineering best practices.
The IEC 61499 architecture represents a component solution for distributed industrial automation
systems aiming at portability, reusability
interoperability, reconfiguration of distributed
applications. The IEC 61499 Standard provides a generic model for distributed systems. This
model includes processes and communication networks as an environment for embedded
devices, resources and applications. Applications are built by networks of Function Blocks.
The Function Block is the elementary model of the IEC 61499 Standard. A Function Block
generally provides an Interface for Event I/O’s and Data I/O’s. There are two types of Function
Blocks. Basic Function Blocks on the one hand and Composite Function Blocks on the other. A
Composite Function Block can contain other Composite Function Blocks and/or Basic Function
Blocks. Thus, Composite Function Blocks enable modular design methodologies. Basic Function
Blocks include event-driven Execution Control Charts (abbr. ECC), which are state machines. The
elements of the ECC are states and event-triggered transitions. An ECC can trigger the execution
of Algorithms by the occurrence of events. IEC 61499 provides:
● combination of distributed programming language and legacy PLC programming with IEC
61131-3;
● generic modeling approach for distributed control applications;
● function block concept;
● separation of data and event flow.
IEC 61499 domain is relatively new, meaning not many tools exists and the ones that exists in the
ecosystem of IEC 61499 are all over the place. There are many tools such as transformation tools
that easily get lost and see end of life too soon. The main reason is it was not developed with
other user involvement in mind and due to lack of existing platforms that support easy adoption of
tools.
There is a need to create a new open platform that is user-friendly to use, is very intuitive and
more importantly modular in nature that makes it easier to scale the platform as and when
required. The platform should excite users to contribute towards long-term maintenance and
upgrade possible. It should encourage new users to work on existing modules.

Goal of the project

Short description​: To create a platform that is similar to the idea of popular programming
platforms such as tools from Jetbrains, Visual Studio Code, Atom, but for the IEC 61499
programming paradigm.
Detailed description​: The goal of the project is to develop a modular platform for use by IEC
61499 communities. The main goal is to make the platform modular. The ability for anyone who
wants to work with IEC 61499 standard should be able to develop modular plugins that can be
used for their purpose and also published on a common repository so that others can use it.
Features
● IEC 61499 standard XML scheme should be supported.
● Every entity must be a module.
○ Example: There can be plugins for ECC differentiated by the way the ECC looks, it
could be a classic state machine representation, different colors, etc.
● There should be an underlying structure for the complete IEC 61499 representation that
plugin developers can use for developing plugins.
○ Example: If a team is interested in developing a plugin for translation of IEC 61499
function block to a C program or Java program or any other target representation,
they should not be writing the parser first, they should instead use API for
interacting with the underlying structure.
● Ability for advanced plugin development that will support developing plugins that can
deploy the IEC 61499 system to different hardware.
● Each supported language will be a plugin, a plugin for Ladder Diagrams, for structured
text, etc.
What should be done
● Task 1: Identify the portable platform that can used. It is suggested that platforms such as
eclipse and netbeans are not considered. Instead either IntelliJ [1] or electron [2] should
be used. Using electron platform has an added advantage that it can also run in a
browser.
● Task 2: Study the two platforms the two platforms IntelliJ [1] or electron [2] and list pros
and cons. End of this task, you should decide on a platform to continue with the rest of the
project
● Task 3: Developing the core of the platform: the main core of the platform should be
developed. The underlying XML representation and API to interact with this model.
● Task 4: Developing first set of plugins: develop plugins that will support Basic and
composite function blocks
● Task 5: Develop second set of plugins: develop plugins for Application, sub application
and adaptor function blocks.
● Task 6: API documentation: a detailed document that us very easy to understand and
makes it very easy for plugin developments for the community.

Expected results: ​the main result at the end of Task 5 is the ability to show the development of a
basic application development using IEC 61499 standard. The application XML will be tested
using the open source runtime of forte [3].
Prerequisites for the student
The student is expected have a good experience/knowledge in the following:
● English language;
● a programming language;
● using GIT version management tool;
● software testing techniques;
● HTML/CSS/Javascript knowledge is an added advantage.
Sources
1. http://www.jetbrains.org/pages/viewpage.action?pageId=983889
2. https://electronjs.org/
3. https://www.eclipse.org/4diac/en_rte.php

Укладка конечных автоматов и сетей функциональных блоков на 
плоскость  
Руководитель: Чивилихин Д.С. (chivdan@gmail.com)
Уровень: ​Курсовая
Описание предметной области
Алгоритмы синтеза конечных автоматов по заданной спецификации позволяют
автоматически получать исполняемую модель, которую можно непосредственно загрузить в
hardware-контроллер или использовать в симуляционной среде. При этом встает задача
укладки автомата на плоскость. Ранее данная задача была решена для управляющих
конечных автоматов с петлями [1]. Разработанный алгоритм позволяет получать хорошую
укладку автомата для среды Matlab/Stateflow. В автоматах, используемых при разработке
систем управления стандарта IEC 61499 (например, в среде nxtControl) другая особенность
- петли используются редко, однако такие автоматы зачастую имеют большое число
переходов и большую степень каждой вершины графа переходов.
При этом автоматическая укладка автоматов на плоскость в данных средах не
предоставляется.
Также стоит задача красивой укладки сети функциональных блоков (пример сети http://seg.ee.upatras.gr/seg/dev/media/corfu_app_basic.png​)
для
минимизации
числа
пересечения связей.

Цель работы
1. Изучить существующие методы и программные средства укладки графов на
плоскость.
2. Разработать программное средство для укладки автоматов на плоскость.
3. Разработать программное средство для укладки на плоскость сети функциональных
блоков.
Ожидаемые результаты
1. Разработанные алгоритмы и программные средства.
2. Отчет о проделанной работе.
Источники
1. http://is.ifmo.ru/works/2014/2014_VSPU_Vedernikov_et_al.pdf

Верификация программ с временными штампами 
Руководители​: Валерий Вяткин (​valeriy.vyatkin@ltu.se​), Дмитрий Дроздов
(​dmitrii.drozdov@ltu.se​)
Уровень​: магистерская
Описание предметной области: ​Для программирования распределённых систем
автоматики используется язык функциональных блоков (ФБ), в котором программа
представляет собой набор программных компонентов связанных событийными связями и
каналами передачи данных. В недавних работах предприняты попытки расширить этот
язык за счёт добавления к событиям “временных штампов”, что позволяет определять
возраст событий и данных, ассоциированных с ними.
Формальная верификация программ на языке ФБ, как правило, проводится путём перевода
исходной программы в модель на входном языке программных средств, называемых
модел-чекерами (model-checker), таких как SMV или SPIN. Существует (открытое)
программное средство FB2SMV для реализации такого перевода. Данное средство, однако,
не поддерживает расширение языка ФБ временными штампами.
Аспирант LTU Дмитрий Дроздов занимается применением указанного расширения языка
ФБ для построения систем, в которых ПО “устойчиво” к изменениям в архитектуре
аппаратной платформы на которой выполняется ФБ-программа. Для проверки свойств
устойчивости используется model-checking.
Цель работы​: Разработка метода формального моделирования программ на языке с ФБ
временными штампами (например, на основе временых автоматов) и демонстрация его в

действии на примерах. Реализация генератора моделей (например, путём расширения
FB2SMV).
Что следует сделать​:
1. Определить синтаксис и семантику языка ФБ с временными метками.
2. Реализовать на этом языке несколько моделей систем.
3. Предложить формальную модель этого языка на одном из языков общепринятых
для модел-чекинга.
4. Промоделировать примеры #2 на формальном языке #3.
5. Разработать автоматический генератор моделей #3 из программ на #1.
6. Продемонстрировать применение разработанного комплекса программных средств
для решения задачи устойчивости ПО.
Ожидаемые результаты​: Программный комплекс моделирования и верификации
программ с временными метками с образцами его применения. Статья в международный
журнал.
Требования​: сильные навыки в разработке алгоримов и программировании, интерес к
формальным методам, готовность разрабатывать программные инструменты
Источники (обращайтесь, если не можете найти статьи бесплатно)​:
1. V. Vyatkin, C. Pang, S. Tripakis, “Towards Cyber-Physical Agnosticism by Enhancing IEC 61499
with PTIDES Model of Computations”, International Annual conference of IEEE Industrial
Electronics Society, Yokohama, November, 2015
2. W. Dai, C. Pang, V. Vyatkin, J. H. Christensen and X. Guan, "Discrete-Event-Based Deterministic
Execution Semantics with Timestamps for Industrial Cyber-Physical Systems," in ​
IEEE
Transactions on Systems, Man, and Cybernetics: Systems,​ vol. PP, no. 99, pp. 1-12., 2017
3. D. Drozdov, S. Patil, V. Vyatkin, “Towards Formal Verification for Cyber-physically Agnostic
Software: a Case Study”, International Annual conference of IEEE Industrial Electronics Society
IECON’17, Beijing, 2017
4. D. Drozdov, S. Patil, V. Vyatkin, “Formal Modelling of Distributed Automation CPS with CP-Agnostic
Software”, Workshop on Service Orientation in Holonic and Multi-Agent Manufacturing
(SOHOMA’16), Lisbon, Portugal, October 6-7, 2016

5. www.iec61499.com

Предсказание вычислительной сложности формальной верификации 
методами машинного обучения 
Руководители​: Валерий Вяткин (​valeriy.vyatkin@aalto.fi​ )
Уровень​: магистерская
Описание предметной области

Формальная верификация методом модел-чекинга в общем случае может иметь
экспоненциальную сложность, что делает этот метод неприменимым к задачам большой
размерности. Однако, метод применяется во многих практических случаях. Неясно, можно
по каким-то параметрам задачи статически оценить сложность модел-чекинга без
необходимости его выполнения.
Цель работы​: Провести исследование о возможности предсказания времени
модел-чекинга и использования методов машинного обучения
Что следует сделать​:
● Создать набор задач для модел-чекинга промышленных систем с параметризуемой
размерностью.
● Набрать статистику о времени модел-чекинга для данных задач.
● Выделить набор ключевых характеристик задач, которые могли бы использоваться
для предсказания времени модел-чекинга.
● Продемонстрировать применимость метода на новых задачах, не использованных
для тренировки системы предсказания.
Ожидаемые результаты​: Подтверждение или опровержение гипотезы о возможности
предсказания времени модел-чекинга.
Требования​: сильные навыки в разработке алгоримов и программировании, интерес к
формальным методам и машинному обучению, готовность разрабатывать программные
инструменты
Источники​:
1. По запросу будут предоставлены параметризуемые модели (точнее, генератор таких
моделей) робота-манипулятора и лифта, которые могут быть использованы для
экспериментов.

Автокорректировка управляющих программ по результатам их 
верификации 
Руководители​: Валерий Вяткин (​valeriy.vyatkin@aalto.fi​), Даниил Чивилихин
(​Daniil.Chivilikhin@gmail.com​)
Уровень​: магистерская
Описание предметной области
Формальная верификация методом model-checking предназначена для автоматического и
всеобъемлющего тестирования программ и систем на соответствие спецификациям. В

случае нахождения несоответствия со спецификацией, model-checker выдаёт контрпример,
представляющий собой путь в пространстве состояний из начального состояния системы в
проблемное состояние. Однако, затем программист должен вручную исправить ошибку в
программе и переверифицировать её.

Цель работы​: В данном проекте предлагается попробовать находить исправления
программ автоматически.
Что следует сделать​:
● Изучить применение модел-чекинга к верификации киберфизических систем с
использованием моделей замкнутого цикла (на предоставленных примерах).
● Создать набор “поломанных” программ (или сразу их формальных моделей),
отличающихся от корректных небольшими изменениями (например, перепутанными
идентификаторами, и др. изменениями не распознаваемыми компилятором).
● Реализовать метод нахождения корректировки программы путём перебора всех
возможных изменений поломанной программы (сложности 1, 2, 3, и т.д.) и
подвергания каждой такой конфигурации модел-чекингу, пока не будет найдена
корректная программа.
● Оптимизировать пространство перебора за счёт использования эволюционных
алгоритмов и других эвристик.
Ожидаемые результаты​: Прототип программной системы автоматической корректировки
ошибок и демонстрация его успешной работы на примерах.
Требования​: сильные навыки в разработке алгоримов и программировании, интерес к
формальным методам и машинному обучению, готовность разрабатывать программные
инструменты.
Источники​:
1. Книга по методу model-checking.
2. Набор примеров, представляющих собой формальные модели простых
промышленных систем, реализованные на одном из языков модел-чекеров.

Алгоритмы  управления  в  виде  нейронных  сетей:  реализация  на 
микроконтроллерах  и  формальная  верификация  (возможно,  это  два 
проекта) 
Руководители​: Валерий Вяткин (​valeriy.vyatkin@aalto.fi​), Андрей Фильченков
(​aaafil@mail.ru​)

Уровень​: магистерская
Описание предметной области
Растёт интерес к применению нейронных сетей не только в качестве средства
распознавания, но и средства управления (контроллера), обучаемого как на известных
примерах поведения, так и методами глубокого обучения с использованием имитационных
моделей. В недавней магистерской работе Д. Мухутдинов продемонстрировал построение
распределенной системы управления маршрутизацией багажа в форме сети
взаимодействующих агентов, каждый из которых реализован при помощи обучения
нейронной сети.
Этот результат ставит два новых вопроса:
1) Может ли метод Мухутдинова быть реализован на микроконтроллерах с
ограниченными ресурсами, которые могли бы встраиваться непосредственно в узлы
системы транспортировки багажа (конвейеры, толкатели, и др.). Требуется ли для
этого существенная модификация метода?
2) Может ли контроллер или сеть контроллеров, реализованных в виде нейросетей,
быть всеобъемлюще протестирован? Может ли метод верификации model-checking
быть применён к верификации таких систем?
Цель(и) работ(ы)​:
1) Реализовать метод Мухутдинова на сети микроконтроллеров типа RaspberryPI с
использованием, например, пакета Tensor Flow. В случае обнаружения ограничений,
препятствующих использованию метода, предложить его модификацию, снимающую
ограничения.
2) Исследовать возможные методы формальной верификации систем управления
реализованных в виде нейросетей. В частности, исследовать:
a) Возможность построения конечного автомата по трассировке поведения
нейросети (Метод Бужинского)
b) Возможность доказательства свойств нейросети методом доказательства
теорем, исходя из известных структурных свойств (например количества
слоёв в многослойной нейросети).
Что следует сделать​:
● Изучить метод Мухутдинова [1] и продемонстрировать его применимость на
практических задачах большей размерности и сложности.
Проект 1:
● Разработать адаптацию (или развитие) этого метода для реализации на
микроконтроллерах RaspberryPI.
● Построить демо-стенд из сети RaspberryPI интегрированных с имитационной
моделью системы транспортировки и сортировки багажа
Проект 2:
● Исследовать формальную верификацию контроллеров реализованных в форме
нейросетей.

●

●

Изучить метод Бужинского [2,3] для построения автомата описывающего поведение
объекта с явно неизвестным алгоритмом (т.н. черного ящика) и применить его к
построению модели нейросети - контроллера узла системы сортировки багажа.
Продемонстрировать верификацию всей системы сортировки багажа методом
model-checking.

Ожидаемые результаты​: Достижение существенного прогресса в практической
реализации систем управления на основе нейросетей.
Требования​: сильные навыки в разработке алгоримов и программировании, интерес к
формальным методам и машинному обучению, готовность разрабатывать программные
инструменты.
Источники​:
1. D. Mukhutdinov et al: Multi-Agent Deep Learning for Simultaneous Optimization for Time and
Energy in Distributed Routing System, under review for Next generation computer systems,
Elsevier, 2018 (draft available upon request).
2. I. Buzhinsky, V. Vyatkin, “Automatic Inference of Finite-State Plant Models from Traces and
Temporal Properties”, IEEE Transactions on Industrial Informatics, 2017, 99, pp.
3. I. Buzhinsky, A. Pakonen, V. Vyatkin. Scalable methods of discrete plant model generation for
closed-loop model checking. 43rd International Annual conference of IEEE Industrial Electronics
Society IECON’17, Beijing, 2017

Темы по технологиям программирования 
Just-in-Time meets Divide-and-Conquer: что делать? 
Руководитель​: Буздалов М.В. (​mbuzdalov@gmail.com​
)
Уровень​: стажировка/курсовая ввиду экспериментальности. Может стать выше, если
проблема окажется действительно серьезной.
Описание предметной области
Just-in-Time (далее JIT) - это технология динамической компиляции интерпретируемого
кода, используемая множеством софтверных платформ (например, Java Virtual Machine,
.NET, LLVM) для ускорения выполнения кода.
Divide-and-Conquer (или “разделяй-и-властвуй”) - парадигма проектирования алгоритмов,
при которой большая задача разделяется на подзадачи (существенно) меньшего размера,
подзадачи решаются отдельно, а результаты их решения объединяются. Является одной
из основных техник при создании высокопроизводительных алгоритмов, включая
разнообразные сортировки.

По указанной причине реализации алгоритмов, разработанных в рамках парадигмы
“разделяй-и-властвуй”, должны равно эффективно работать со входными данными как
больших, так и маленьких размеров. Однако имеются признаки того, что один и тот же код
на самых разных уровнях (от уровня процессора - например, настройки branch prediction до уровня JIT - например, во что конкретно компилировать циклы) не может быть одинаково
хорошо настроен как на большие, так и на маленькие данные.
Так, например, если скопировать один и тот же код поиска медианы два раза, при этом
обеспечить выполнение одной копии в диапазоне размеров от 1 до, скажем, 250, а второй
копии - при размерах, больших 250 - то вроде бы можно добиться определенного прироста
производительности (по крайней мере на Java).
Цель работы​: Подружить JIT со спецификой алгоритмов парадигмы Divide-and-Conquer
Что следует сделать​:
● Оценить экспериментальным путем масштаб эффекта на нескольких платформах и
для нескольких алгоритмов.
● Понять, какой именно эффект имеет наибольший вклад.
● Осознать, что со всем этим можно сделать, и, возможно, реализовать прототип.
Ожидаемые результаты​: стабильное ускорение алгоритмов “разделяй-и-властвуй” на хотя
бы одном из JIT-ов по сравнению с исходным вариантом хотя бы на единицы процентов.
Требования​:
● Не бояться (а желательно - иметь навыки) работы с кодом на низком уровне.
● Иметь опыт написания кода, требовательного к производительности, на платформах
с JIT.
● Не бояться математической статистики и тестов для определения статистической
значимости.

Темы по эволюционным вычислениям   
[ЗАНЯТО] Тема 1. Адаптивный контроль параметров эволюционных 
алгоритмов в случае, когда значения функции приспособленности 
динамически изменяются 
Руководитель: ​Арина Буздалова (​abuzdalova@gmail.com​), совместно с Carola Doerr
(Sorbonne University, Paris 6).

Уровень: ​Можно начать с ​курсовой​
. Для ​бакалаврской​будут необходимы
экспериментально обоснованные содержательные выводы и, возможно, модификация
существующих методов контроля параметров или разработка новых методов.
Возможно выполнение теоретического анализа под руководством Carola Doerr. В этом
случае работа может быть также ​магистерской​.
Описание предметной области
Эффективность работы эволюционных алгоритмов (ЭА) сильно зависит от значений
используемых параметров, например, от вероятности мутации или размера поколения. Для
ряда эволюционных алгоритмов и простых задач оптимизации известны оптимальные
функциональные зависимости значения этих параметров от приспособленности особей в
текущем поколении. Однако такие зависимости сложно угадать. Вместо них можно
использовать простые правила, или механизмы адаптивного контроля параметров [1, 2],
согласно которым значение параметра меняется в процессе работы эволюционного
алгоритма. Например, одним из известных простых механизмов является “правило одной
пятой”: если за последние пять итераций увеличение приспособленности происходило
больше, чем один раз -- увеличить вероятность мутации, в противном случае -- уменьшить.
Возможности методов адаптивного контроля на данный момент исследованы не
полностью. В частности, неизвестно, каковы будут особенности их работы в случае, если
функция приспособленности будет меняться в процессе работы эволюционного алгоритма.
Смогут ли методы адаптивного контроля подстраиваться под эти изменения? Какие именно
методы будут более эффективны в таких условиях? Насколько сильные изменения
допустимы?
Цель работы
Исследование особенностей использования методов адаптивного контроля параметров
эволюционных алгоритмов в условиях использования динамически изменяющейся функции
приспособленности.
Что следует сделать
1. Если вы раньше не работали с эволюционными алгоритмами, получить о них общее
представление (например, воспользовавшись источником [4])
2. Ознакомиться с туториалом и статьей ([1] и [2] в списке источников).
3. Реализовать ​(1+𝜆)  ​
эволюционный алгоритм (желательно быструю версию, детали
можно узнать у научного руководителя).
4. Реализовать
различные
алгоритмы
адаптивного
контроля
параметров,
перечисленные в статье [2].
5. Реализовать
динамически
изменяющиеся
функции
приспособленности.
Предлагается начать с задачи LeadingOnes с меняющейся маской и перестановкой.
6. Провести вычислительный эксперимент: построить графики времени работы ​
(1+𝜆) 
ЭА с использованием различных алгоритмов контроля параметров в условиях
использования различных изменяющихся функций приспособленности, сравнить

эффективность этих алгоритмов. Также построить графики значений настраиваемых
параметров и другие графики, помогающие понять, как происходит процесс
подстройки
под
изменяющуюся
функцию
приспособленности.
Оценить
статистическую значимость наблюдаемых различий в эффективности алгоритмов.
7. Проанализировать полученные результаты. Возможно, предложить модификации
существующих алгоритмов контроля параметров или новые алгоритмы контроля,
эффективно работающие в условиях изменяющейся функции приспособленности.
Оценить эффективность модификаций / новых алгоритмов.
8. Возможно продолжение работы в теоретическом ключе: доказательство
асимптотических оценок времени работы алгоритмов адаптивного контроля
параметров ЭА при использовании динамически изменяющейся функции
приспособленности.
Ожидаемые результаты
Результаты экспериментального сравнения эффективности алгоритмов адаптивной
настройки параметров ЭА при решении различных задач с изменяющейся функцией
приспособленности. При необходимости, модификации существующих алгоритмов или
новые алгоритмы адаптивной настройки параметров и оценка их эффективности. В случае
проведения теоретического анализа, асимптотические оценки времени работы алгоритмов
адаптивного контроля параметров ЭА.
Требования
Готовность начать в октябре и заниматься исследованиями в течение всего учебного года,
регулярно (раз в одну-две недели) встречаться и обсуждать сделанное.
Готовность читать научные тексты на английском языке и разбираться в них, а также
оформлять результаты работы на английском и активно участвовать в подготовке статей на
международные конференции по результатам работы.

Источники
1. Туториал Doerr C. Non-static parameter choices in Evolutionary Computation // GECCO
2017 (​http://www-ia.lip6.fr/~doerr/GECCO17tutorial.pdf​)
2. Статья Carola Doerr с GECCO 2018
(​https://drive.google.com/file/d/1awn6PW3JlNP87XsfFm2cGtwM_Nv_Mbts/view?usp=driv
esdk​)
3. Книга "Introduction to Reinforcement Learning"
(​https://www.dropbox.com/s/tr0sywhxp2l66yb/sutton-barto-book.pdf?dl=0​)
4. Конспект лекций Luke S. Essentials of Metaheuristics
(​https://cs.gmu.edu/~sean/book/metaheuristics/Essentials.pdf​)
5. Диссертация А. С. Буздаловой
(​https://isu.ifmo.ru/index/F8DA58B6C6A1A2E23D1308E40A74C692

 
Тема 2. Machine Learning meets Parameter Control 
 
Supervisors: ​Carola Doerr (Sorbonne University, Paris 6), Arina Buzdalova (ITMO University,
abuzdalova@gmail.com​)
Deadline to choose the topic: 15 October 2018
Level: ​better to start as a coursework, then it may become bachelor or master
Research goal
Among the most successfully and most widely applied optimization algorithms are randomized
search heuristics (RSH) that search the solution space in an iterative, trial-and-error manner. RSH
are parametrized algorithms, and their performance is to a large extend determined by a suitable
choice of the parameters. Additional performance gains are possibly by adapting the algorithm
parameters during the optimization process. The idea to control the parameters on-the-fly has
gained much attention in the last 10 years. Several works make an explicit connection to machine
learning, where similar problems arise in the well-studied multi-armed bandit problem. As of
today, the question which control technique to use under which circumstances is largely open.
The goal of this project will be to
(1) perform a comparative study across suitably chosen benchmark problems, and
(2) to use these results to derive recommendations that take into account the characteristics of
the benchmarks.
Expected results
The goal of this project is to derive guidelines that help users decide which ML-inspired parameter
control technique to use under which circumstances. Among the central questions of this project
are a solid reasoning for which benchmark problems to consider, and how to measure their
characteristics; i.e., which landscape features should have the strongest influence on the choice
of the control technique.
We expect to derive guidelines of strong practical importance, and aim at results that are
publishable in international conferences of the field (GECCO, FOGA, PPSN, EvoCOP, etc.).
Requirements to the student
This topic is co-supervised by Carola Doerr, CNRS researcher at Sorbonne University in Paris,
France. Our working language will thus be English. Fluency in written and spoken English is
required.
The student should bring some basic background in algorithmics, and a strong motivation to
bridge the fields of optimization and machine learning.
Literature

2 recent surveys of parameter control techniques can be found here:
○

○

Giorgos Karafotias​,​​Mark Hoogendoorn​, Ágoston E. Eiben: Parameter Control in
Evolutionary Algorithms: Trends and Challenges.​​IEEE Trans. Evolutionary
Computation 19(2)​: 167-187 (2015)
Benjamin Doerr​, Carola Doerr: Theory of Parameter Control for Discrete Black-Box
Optimization: Provable Performance Gains Through
Dynamic
Parameter Choices.​​CoRR
abs/1804.05650​(2018)

 
Темы 3, 4. Beyond Expected Optimization Times 
Supervisors: ​Carola Doerr (Sorbonne University, Paris 6), Arina Buzdalova (ITMO University,
abuzdalova@gmail.com​)
Deadline to choose the topic: 15 October 2018
May be split into ​two topics:​theoretical and experimental. You may choose one of them.
Level: ​Bachelor, Master
Research goal
Iterative Optimization Heuristics (IOH) are, in par with Mathematical Programming, among the
most successfully applied techniques for solving industrial and academic optimization challenges.
Understanding the performance of IOH with mathematical means is a research field that is
attracting more and more attention. Most theoretical results, however, only concern a very limited
performance measure: the first hitting time of an optimal solution. In this project, we aim to
(1) extend existing theoretical runtime guarantees to fixed-target and fixed-budget results,
(2) to provide a rigorous evaluation of different anytime performance measures,
(3) to work towards a better reflection of implementation details in the theoretical performance
bounds.
Approximate plan
In the beginning of the project, the student will get familiar with the common techniques needed
for the analysis of IOHs, most notably with drift analysis, a powerful technique that allows to
derive hitting time statements by bounding the probabilities to make certain progress. The student
will use these tools (and possibly extend them) in order to derive the sought fixed-target and
fixed-budget results. In a next step, we will extend these results into parametrized bounds, that
give insight into how the performance of different IOHs depends on their various algorithm
parameters. Such parametrized bounds are rare to find in the current literature, and require a
good understanding of the underlying optimization process, which we will acquire through the
detailed performance analysis.

Expected results
The goal of this project is to derive theoretical results that are publishable in international
conferences of the field (GECCO, FOGA, PPSN, EvoCOP, etc.).
Requirements to the student
This topic is co-supervised by Carola Doerr, CNRS researcher at Sorbonne University in Paris,
France. Our working language will thus be English. Fluency in written and spoken English is
therefore required. The student should bring some basic background in Maths, and ideally some
basic knowledge in probability theory (IOHs are typically randomized algorithms).
Literature
We aim at extending results of this type:
● Benjamin Doerr,​​Carola Doerr​:
Optimal Static and Self-Adjusting Parameter Choices
for the (1+(λ, λ)) Genetic
Algorithm.​​Algorithmica 80(5)​: 1658-1709 (2018)
● Carsten Witt:
Tight Bounds on the Optimization Time of a Randomized Search Heuristic on Linear
Functions.​​Combinatorics, Probability & Computing 22(2)​: 294-318 (2013)

Разработка эффективных операторов скрещивания и мутации в 
мультиплоидных алгоритмах 
 
Руководители​:

Нина

Буланова

(​ninasbulanova@gmail.com​)

Максим

Буздалов

(​mbuzdalov@gmail.com​)
Уровень​: курсовая; при получении положительных результатов возможно развитие в
бакалаврскую или даже в магистерскую.
Описание предметной области
Генетические алгоритмы основываются на принципах естественной эволюции и обычно
оперируют

гаплоидными

особями, состоящими из одной аллели. Однако многие

биологические виды обладают диплоидными или мультиплоидными геномами, в которых
активность каждого гена в первом приближении определяется с помощью доминирования
(гены могут быть доминантными или рецессивными). Мультиплоидность помогает
запоминать ранее эффективные адаптации. Таким образом, она полезна в ситуациях, когда
функция

приспособленности

нестационарна

(меняется

со

временем),

так

как

мультиплоидные особи быстро реагируют и эффективнее приспосабливаются, храня в
себе рецессивные гены. Становясь рецессивными, гены могут защитить сами себя от
уничтожения в процессе развития популяции.

Одной из проблем многих эволюционных алгоритмов является стагнация и недостаточно
быстрое развитие особи. Алгоритмам, использующим и операторы скрещивания и
операторы мутации, сложно быть быстрее, чем унарные алгоритмы (использующие только
операторы мутации). Недавние теоретические исследования [1] полностью опровергли
данную точку зрения, что, вероятно, должно быть очень на руку алгоритмам, использующим
мультиплоидную схему, ведь в их работе операторы скрещивания крайне необходимы.
Цель работы​: Разработка эффективного мультиплоидного алгоритма.
Что следует сделать​:
●
●
●
●

Изучить область ЭА, если она Вам не знакома (например, по [2]).
Изучить понятие мультиплоидности (например, по [3])
Разобраться с возможностями GREEDY (μ + 1) GA [1]
Реализовать подход к мутации и кроссоверу из [1] в мультиплоидных схемах

●

Сравнить его эффективность с существующими мультиплоидными и гаплоидными
алгоритмами на известных задачах оптимизации (например, OneMax)

Ожидаемые результаты​: Мультиплоидный алгоритм оптимизации с эффективными
кроссоверами и мутациями. Для доказательства своей эффективности алгоритму требуется
быть быстрее таких алгоритмов оптимизации, как (1+1) EA или RLS. Можно доказать это
теоретически, подтвердить экспериментально, либо получить доказательство того, почему
данная цель недостижима. Также требуется достичь достаточно высокого разнообразия
особей в процессе оптимизации. Хорошие результаты можно будет опубликовать на
международных конференциях, таких как GECCO, FOGA, Evo*.
Требования​: Готовность каждые две недели обсуждать полученные результаты и
продвигаться в освоении темы.
Источники​:
1. A Simple Proof for the Usefulness of Crossover in Black-Box Optimization. Eduardo
Carvalho Pinto and Carola Doerr
(​http://www-desir.lip6.fr/~doerr/CarvalhoDoerr-PPSN18-Crossover.pdf​)
2. Конспект лекций Luke S. Essentials of Metaheuristics
(​https://cs.gmu.edu/~sean/book/metaheuristics/Essentials.pdf​)
3. Topical Critique - Multiploidy in Evolutionary Computation
(​http://home.earthlink.net/~paulcarr/cool_tech/multiploidy.html​)

Теоретический анализ методов адаптивной настройки параметров при 
решении практических задач  
Руководители​:
Денис
Антипов
(​antipovden@yandex.ru​),
(​abuzdalova@gmail.com​).
Возможно сотрудничество с Carola Doerr (Sorbonne, Paris 6).

Арина

Буздалова

Уровень​: курсовая; при получении положительных результатов возможно развитие в
бакалаврскую и далее в магистерскую.
Описание предметной области
В области эволюционных алгоритмов (ЭА) в последнее время очень популярно изучение
различных механизмов адаптивной настройки параметров [1]. Проводится довольно много
теоретических и практических исследований, цель которых -- выявить наиболее
эффективные механизмы.
С точки зрения теории уже проводился анализ (1 + 1) ЭА с правилом ⅕-ой для настройки
силы мутации на различных модельных задачах, как например OneMax и LeadingOnes. В
данный момент интерес составляет исследование данного алгоритма на примере
практических задач, таких как задача о рюкзаке, задача коммивояжера, задача составления
расписаний и других.
В данной работе может принимать участие более одного человека.
Цель работы​: Разработка методов получения точных асимптотических оценок на время
работы (1 + 1) ЭА с адаптивной силой мутации при решении различных NP-трудных задач.
Что следует сделать​:
● Изучить область ЭА, если она Вам не знакома (например, по [2]).
● Почитать про настройку параметров (туториал [1]).
● Изучить теоретические результаты для ЭА, решающих практические задачи
(например, [3-4], но хорошо бы поискать и другие работы по данной теме).
● Выбрать задачу для проведения анализа.
● Придумать некоторые инстансы задачи, для которых понятен оптимум и на которых
будет просто проводить анализ (пример инстанса задачи о рюкзаке: ценность
каждого предмета обратно пропорциональна его весу [4])
● Запустить эксперименты, чтобы проверить, что адаптивная сила мутации на
выбранной задаче вообще работает и посмотреть, как ведет себя сила мутации с
течением времени.

●
●

Провести теоретический анализ (1 + 1) ЭА с адаптивной силой мутации на
выбранной задаче.
Оформить результаты в виде англоязычной статьи

Ожидаемые результаты​: Получение теоретических оценок времени работы ЭА с
адаптивной мутацией на практических задачах для некоторых конкретных инстансов.
Требования​: Готовность изучать научные тексты на английском языке. Хорошие
математические знания и способности приветствуются. Готовность иметь “удаленного”
научного руководителя, но с возможностью регулярной видеосвязи.
Источники​:
1. Туториал Doerr C. Non-static parameter choices in Evolutionary Computation // GECCO
2017 (​http://www-ia.lip6.fr/~doerr/GECCO17tutorial.pdf​)
2. Конспект лекций Luke S. Essentials of Metaheuristics
(​https://cs.gmu.edu/~sean/book/metaheuristics/Essentials.pdf​)
3. Frank Neumann, Andrew M. Sutton:
Runtime Analysis of Evolutionary Algorithms for the Knapsack Problem with Favorably
Correlated Weights. PPSN (2) 2018: 141-152
(https://cs.adelaide.edu.au/~ec/research/files/PPSN18-MOKP.pdf)
4. Dogan Corus, Pietro Simone Oliveto, Donya Yazdani:
Artificial Immune Systems Can Find Arbitrarily Good Approximations for the NP-Hard
Partition Problem. PPSN (2) 2018: 16-28
(arxiv version: https://arxiv.org/pdf/1806.00300.pdf)

Анализ адаптивной настройки мутации с помощью ε-greedy Q-learning на 
примере задачи LeadingOnes 
Руководители​:
Денис
Антипов
(​antipovden@yandex.ru​),
(​abuzdalova@gmail.com​).
Возможно сотрудничество с Carola Doerr (Sorbonne, Paris 6).

Арина

Буздалова

Уровень​: курсовая; при получении положительных результатов возможно развитие в
бакалаврскую.
Описание предметной области
Сила мутации является важным параметром эволюционных алгоритмов (ЭА). При
неправильном выборе значения данного параметра время работы алгоритма может стать
экспоненциальным [1]. Однако оптимальное значение параметра может меняться в

процессе оптимизации, и в последнее время стали очень популярны различные методы
адаптивной настройки параметров [2].
Ранее уже проводился теоретический анализ (1 + 1) ЭА с настройки силы мутации с
помощью обучения с подкреплением на различных модельных задачах, как например
OneMax, а также были проведены некоторые практические исследования на задачах
LeadingOnes и MaxCut [3-4].
Цель работы​: Теоретическая оценка времени работы (1 + 1) ЭА с адаптивной силой
мутации на примере задачи LeadingOnes
Что следует сделать​:
● Изучить область ЭА, если она Вам не знакома (например, по [5]).
● Почитать про настройку параметров (туториал [1] и присутствующие в нем ссылки).
● Почитать про оптимальную силу мутаций для LeadingOnes [6] и прочую литературу
по теме (список будет составлен позже).
● Провести теоретический анализ времени работ
Ожидаемые результаты​: Точные асимптотические оценки времени работы ЭА с
адаптивной мутацией на задаче LeadingOnes.
Требования​: Готовность изучать научные тексты на английском языке. Хорошие
математические знания и способности приветствуются. Готовность иметь “удаленного”
научного руководителя, но с возможностью регулярной видеосвязи.
Источники​:
1. Benjamin Doerr, Thomas Jansen, Dirk Sudholt, Carola Winzen, Christine Zarges:
Mutation Rate Matters Even When Optimizing Monotonic Functions. Evolutionary
Computation 21(1): 1-27 (2013)
(https://dl.acm.org/citation.cfm?id=2464111)
2. Туториал Doerr C. Non-static parameter choices in Evolutionary Computation // GECCO
2017 (​http://www-ia.lip6.fr/~doerr/GECCO17tutorial.pdf​)
3. Benjamin Doerr, Carola Doerr, Jing Yang:
Optimal Parameter Choices via Precise Black-Box Analysis. GECCO 2016: 1123-1130
(arxiv version: https://arxiv.org/pdf/1807.03403.pdf)
4. Benjamin Doerr, Carola Doerr, Jing Yang:
k-Bit Mutation with Self-Adjusting k Outperforms Standard Bit Mutation. PPSN 2016:
824-834
(https://link.springer.com/chapter/10.1007/978-3-319-45823-6_77#citeas)
5. Конспект лекций Luke S. Essentials of Metaheuristics
(​https://cs.gmu.edu/~sean/book/metaheuristics/Essentials.pdf​)
6. Böttcher S., Doerr B., Neumann F. (2010) Optimal Fixed and Adaptive Mutation Rates for
the LeadingOnes Problem. In: Schaefer R., Cotta C., Kołodziej J., Rudolph G. (eds)

Parallel Problem Solving from Nature, PPSN XI. PPSN 2010. Lecture Notes in Computer
Science, vol 6238. Springer, Berlin, Heidelberg
(​https://link.springer.com/chapter/10.1007/978-3-642-15844-5_1​)

Теоретический анализ random-walk’ов 
Руководители​: Денис Антипов (​antipovden@yandex.ru​)
Уровень​: курсовая; при получении положительных результатов возможно развитие в
бакалаврскую или даже в магистерскую.
Описание предметной области
Random walk -- это явление, при котором стохастический процесс совершает
ненаправленное движение по пространству состояний данного процесса. В области
эволюционных алгоритмов (ЭА), которые сами по себе являются стохастическими
процессами, такое явление часто встречается, когда алгоритм находится на плато целевой
функции, то есть области пространства поиска, в которой значение целевой функции
постоянно [1].
Несмотря на кажущуюся простоту данного явления, его теоретический анализ вызывает
много трудностей. Особый интерес представляет анализ различных эволюционных
алгоритмов на задаче Needle и на других модельных задачах, в которых присутствуют
плато различных размеров, таких как XdivK.
Цель работы​: Разработка методов анализа ЭА на плато.
Что следует сделать​:
● Изучить область ЭА, если она Вам не знакома (например, по [2]).
● Почитать предыдущие работы на данную тему (статья [1] и присутствующие в ней
ссылки).
● Провести теоретический анализ времени работ
Ожидаемые результаты​: Асимптотические оценки времени работы различных ЭА на
задачах с плато.
Требования​: Готовность изучать научные тексты на английском языке. Хорошие
математические знания и способности. Готовность иметь “удаленного” научного
руководителя, но с возможностью регулярной видеосвязи.
Источники​:
1. Denis Antipov, Benjamin Doerr:
Precise Runtime Analysis for Plateaus. PPSN (2) 2018: 117-128
(arxiv version: https://arxiv.org/pdf/1806.01331.pdf)

2. Конспект лекций Luke S. Essentials of Metaheuristics
(​https://cs.gmu.edu/~sean/book/metaheuristics/Essentials.pdf​)
3. Böttcher S., Doerr B., Neumann F. (2010) Optimal Fixed and Adaptive Mutation Rates for
the LeadingOnes Problem. In: Schaefer R., Cotta C., Kołodziej J., Rudolph G. (eds)
Parallel Problem Solving from Nature, PPSN XI. PPSN 2010. Lecture Notes in Computer
Science, vol 6238. Springer, Berlin, Heidelberg
(https://link.springer.com/chapter/10.1007/978-3-642-15844-5_1)

Разработка метода получения нижних оценок для бинарных 
несмещенных алгоритмов. 
Руководители​: Денис Антипов (​antipovden@yandex.ru​), Максим Буздалов
(​mbuzdalov@gmail.com​).
Уровень​: магистерская.
Описание предметной области
Теоретический анализ эволюционных алгоритмов -- это область математики, которая
занимается анализом сравнительно узкого семейства алгоритмов, однако даже несмотря
на это уже сделала большой вклад в анализ стохастических процессов в целом [1].
В данный момент уже придумано много различных методов анализа унарных
эволюционных алгоритмов, то есть алгоритмов, которые используют только оператор
мутации. Однако кроссовер, часто используемый на практике, довольно плохо изучен с
теоретической точки зрения. На данный момент уже существует несколько работ,
доказывающих эффективность использования кроссовера на некоторых модельных
задачах, однако в теории также очень важен вопрос, какого предела эффективности можно
достичь.
Несмещенные операторы представляют большой интерес для теоретиков, так как являются
наиболее универсальными операторами: они изменяют значения некоторых бит в особи,
причем выбирают эти биты вне зависимости от их позиции или значения.
Цель работы​: Разработка методов получения нижних оценок для ЭА, использующих
бинарные несмещенные операторы.
Что следует сделать​:
● Изучить область ЭА, если она Вам не знакома (например, по [3]).
● Почитать предыдущие работы на данную тему (статья [2] и присутствующие в ней
ссылки).
● Почитать про технику получения нижних оценок family trees [4].
● Расширить ее на бинарные операторы.

Ожидаемые результаты​: Асимптотические нижние оценки на время работы бинарных
несмещенных ЭА на задаче OneMax.
Требования​: Готовность изучать научные тексты на английском языке. Обязательны
хорошие математические знания и способности. Готовность иметь “удаленного” научного
руководителя, но с возможностью регулярной видеосвязи.
Источники​:
1. A. Auger and B. Doerr, Theory of randomized search heuristics: Foundations and recent
developments, Series on theoretical computer science, World Scientific, 2011.
2. Bulanova N., Buzdalov M. Better fixed-arity unbiased black-box algorithms // Proceedings
of Genetic and Evolutionary Computation Conference Companion. — 2018. — P.
322–323.
(arxiv version: https://arxiv.org/pdf/1804.05443.pdf)
3. Конспект лекций Luke S. Essentials of Metaheuristics
(​https://cs.gmu.edu/~sean/book/metaheuristics/Essentials.pdf​)
4. C. Witt. Population size vs. runtime of a simple ea. In Proceedings of the IEEE
International Conference on Evolutionary Computation, CEC 2003, volume 3, pages
1996–2003. IEEE, 2003.
(https://ieeexplore.ieee.org/document/1299918)

Адаптивный генетический алгоритм для генерации связей данных в 
приложении из функциональных блоков 
Руководители​: Владимир Миронович (​mironovich.vladimir@gmail.com​)
Уровень​: курсовая => бакалаврская (?)
Ссылочка на презентацию: ​https://goo.gl/wcYFmK
Описание предметной области: ​IEC 61499 [1] – открытый стандарт разработки
промышленных систем управления. В стандарте система реализуется с помощью сети
функциональных блоков, взаимодействующих между собой. Для каждого блока определен
интерфейс – входы и выходы данных.
В работе [2] эволюционные алгоритмы были применены для автоматической генерации
связей данных между заранее заданными блоками системы, реализующие некоторый
требуемый функционал (выраженный в виде формальной спецификации) [3].
В работе [4] был разработан эффективный популяционный алгоритм для решения данной
задачи. Эмпирический анализ времени работы разработанного алгоритма показал его
зависимость от размера используемой популяции. Предполагается, что можно разработать
адаптивную версию предложенного алгоритма, позволяющую оптимизировать процесс
выбора данного параметра.
Цель работы​: разработка и реализация адаптивного генетического алгоритма для
представленной задачи.
Что следует сделать​:

●
●

Изучить ЭА (см. темы выше)
Изучить работы из источников, вероятно реализовать алгоритмы из них на удобном
(для себя и научрука) языке программирования
● Рассмотреть способы настройки параметров алгоритма
● Реализовать несколько вариантов адаптивного алгоритма
● Провести эксперементы по сравнению эффективности разработанного алгоритма
Ожидаемые результаты​: реализация алгоритма + результаты экспериментов, статья =>
бакалаврская
Требования​: умение писать адекватный и понятный код, способность самостоятельного
поиска и исследования информации в английской литературе.
Источники​:
1. https://en.wikipedia.org/wiki/IEC_61499
2. Mironovich V., Buzdalov M., Vyatkin V. Automatic generation of function block applications
using evolutionary algorithms: Initial explorations //Industrial Informatics (INDIN), 2017
IEEE 15th International Conference on. – IEEE, 2017. – С. 700-705.
3. https://en.wikipedia.org/wiki/Model_checking
4. Mironovich V., Buzdalov M., Vyatkin V. From fitness landscape analysis to designing
evolutionary algorithms: the case study in automatic generation of function block
applications //Proceedings of the Genetic and Evolutionary Computation Conference
Companion. – ACM, 2018. – С. 1902-1905.

Итеративная разработка спецификации для формальных моделей 
Руководители​: Владимир Миронович (​mironovich.vladimir@gmail.com​)
Уровень​: ??? (необходимо оценить объем работы и ее новизну)
Ссылочка на презентацию: ​https://goo.gl/wcYFmK
Описание предметной области: ​Верификация ПО ставит своей целью доказательство
соответствия некоторой программы заявленным требованиям [1, 2]. Метод проверки
моделей позволяет проверить соответствие модели ПО некоторым требованиям, заданных
на языке формальной логики. При использовании данного метода важным является вопрос
полноты и корректности составленных требований.
Интерпретируя подход из [3] предлагается метод итеративной разработки спецификации.
Для заданной модели можно составить некоторый набор требований на языке формальной
логики, используя метод автоматической генерации из [3] можно попытаться получить
некорректную модификацию модели, удовлетворяющую всем заданным требованиям.
Анализ полученной модели (возможно автоматический) позволит обнаружить недостающие
требования, которые необходимо включить в спецификацию. Repeat.
Цель работы​: разработать и реализовать итеративный подход к составлению
спецификации, показать наглядный пример его применения
Что следует сделать​:
● Изучить источники, эволюционные алгоритмы, методы верификации ПО
● Разработать и реализовать метод разработки
● Применить метод на наглядном примере

Ожидаемые
результаты​: метод итеративной разработки спецификации для
существующей формальной модели с использованием эволюционных алгоритмов и пример
его применения
Требования​: умение писать адекватный и понятный код, способность самостоятельного
поиска и исследования информации в английской литературе.
Источники​:
1. https://en.wikipedia.org/wiki/Formal_verification#Formal_verification_for_software
2. https://en.wikipedia.org/wiki/Model_checking
3. Mironovich V., Buzdalov M., Vyatkin V. Automatic generation of function block applications
using evolutionary algorithms: Initial explorations //Industrial Informatics (INDIN), 2017
IEEE 15th International Conference on. – IEEE, 2017. – С. 700-705
4. Chivilikhin D., Ivanov I., Shalyto A. Inferring Temporal Properties of Finite-State Machine
Models with Genetic Programming / In Proceedings of 17th Genetic and Evolutionary
Computation Conference companion (GECCO'15 companion), 2015, pp. 1185-1188

Разработка автоматического портфолио для black-box оптимизации 
(BBComp) 
Руководители​: Владимир Миронович (​mironovich.vladimir@gmail.com​)
Уровень​: курсовые => бакалаврские (?)
Ссылочка на презентацию: ​https://goo.gl/wcYFmK
Описание предметной области: ​"Black Box" optimization refers to a problem setup in which
an optimization algorithm is supposed to optimize (e.g., minimize) an objective function through a
so-called black-box interface: the algorithm may query the value f(x) for a point x, but it does not
obtain gradient information, and in particular it cannot make any assumptions on the analytic form
of f (e.g., being linear or quadratic). We think of such an objective function as being wrapped in a
black-box. The goal of optimization is to find an as good as possible value f(x) within a predefined
time, often defined by the number of available queries to the black box. Problems of this type
regularly appear in practice, e.g., when optimizing parameters of a model that is either in fact
hidden in a black box (e.g., a third party software library) or just too complex to be modeled
explicitly. [1]
BBComp – ежегодное соревнование по разработке алгоритмов для black-box оптимизации.
В данной работе необходимо разработать автоматическое портфолио алгоритмов для
данного соревнования, которое, в идеале, показывало бы хорошие результаты и заняло
высокие места.
Существует достаточно много алгоритмов оптимизации и методов выбора алгоритма для
решения некоторой задачи. Требуется выбрать и реализовать некоторую комбинацию
методов и принять участие в соревновании. В случае высокой эффективности и новизны
разработанного метода, возможно оформить результаты в бакалаврскую.
Цель работы​: разработать эффективное портфолио для black-box оптимизации
Что следует сделать​:
● Изучить эвристические методы оптимизации
● Изучить методы выбора алгоритма (ML, RL, if then else, random, ...)

● Реализовать все это дело и принять участие в BBComp
Ожидаемые результаты​: h
​ ttps://bbcomp.ini.rub.de/#results
Требования​: умение писать адекватный и понятный код, способность самостоятельного
поиска и исследования информации в английской литературе.
Источники​:
1. https://bbcomp.ini.rub.de/
2. https://en.wikipedia.org/wiki/No_free_lunch_in_search_and_optimization

Разработка решений для соревновательных задач эволюционных 
вычислений 
Руководители​: Владимир Миронович (​mironovich.vladimir@gmail.com​)
Уровень​: курсовые
Ссылочка на презентацию: ​https://goo.gl/wcYFmK
Описание предметной области: ​Помимо BBComp (см. выше), существует множество
различных соревновательных задач. В качестве курсовой работы можно придумать и
согласовать со мной ​гениальное решение для некоторого соревнования и реализовать его,
с целью принять участие в следующей итерации. Опять же, успешность и новизна решения
могут привести к оформлению результата в виде статьи и бакалаврской работы.
Требования​: умение писать адекватный и понятный код, способность самостоятельного
поиска и исследования информации в английской литературе.
Источники​:
1. http://gecco-2018.sigevo.org/index.html/tiki-index.php?page=Competitions
2. https://project.dke.maastrichtuniversity.nl/cig2018/competitions/

Получение  дизайна  сверхнаправленной  диэлектрической  наноантенны 
при помощи эволюционных алгоритмов 
Руководители: Владимир Ульянцев (vl.ulyantsev@gmail.com), Константин
(​k.ladutenko@metalab.ifmo.ru​), Павел Белов (​belov@metalab.ifmo.ru​)

Ладутенко

Уровень: бакалаврская/магистерская
Описание предметной области:
Создание направленных антенн является современным и популярным направлением
исследований по всему миру (более 1000 работ при поиске по словам directivity antenna в
базе Scopus за 2017/2018 годы). Область потенциального применения подобных
излучателей очень широка, в том числе телеком, оптические чипы, внешние датчики для
самоуправляемых автомобилей и т.д. Использование методов стохастической оптимизации
(успешно зарекомендовавшей себя в других областях, см. источники) для разработки
дизайнов направленных излучателей находится в зачаточном уровне (около 10 работ) и

является крайне перспективным с точки зрения возможных результатов, в том числе для
исследования относительно нового физического эффекта сверхнаправленности
(superdirectivity).
Цель работы: Получение дизайна сверхнаправленной диэлектрической наноантенны
Что следует сделать:
1) Реализовать в виде программы математическую модель или адаптировать
существующий код для расчёта направленности.
2) Провести оптимизацию направленности наноантенны.
3) Провести анализ полученных результатов.
4) Подготовить отчёт о работе в форме статьи на английском языке для дальнейшей
публикации.
Ожидаемые результаты: публикация в зарубежном журнале с impact factor > 5
Требования: хороший уровень математической подготовки, желание решать физические
проблемы и получить опыт взаимодействия с крупным (около 200 сотрудников) научным
центром.
Источники:
"Superdirectivity"
Nature
Photonics
volume
11,
page
532
(2017)
https://www.nature.com/articles/nphoton.2017.155
"Superabsorption
of
light
by
nanoparticles"
Nanoscale,
2015,7,
18897-18901
https://pubs.rsc.org/en/content/articlelanding/2015/nr/c5nr05468k
"Reduction of scattering using thin all-dielectric shells designed by stochastic optimizer" Journal of
Applied Physics 116, 184508 (2014) ​https://aip.scitation.org/doi/10.1063/1.4900529
https://metalab.ifmo.ru/publications/

Темы по сжатию видеопотоков 
Темы по компьютерным сетям 
Руководитель:​Кирилл Коган ​http://people.networks.imdea.org/~kirill_kogan/​, Университет
IMDEA Networks Institute in Madrid
Поставьте в копию письма Аксенов Виталия aksenov.vitaly@gmail.com.

Ускорения существующих методов верификации сетевых программ 
Уровень​: магистерская + cтажировка

Описание предметной области
Одним из наиболее известных методов верификации программ является symbolic
execution. Symbolic execution эмулирует проход по всем возможным путям исполнения
программы и ищет те пути которые приводят к ошибке. Каждый путь исполнения программы
накладывает ограничения на входные данные при удовлетворении которых программа
будет выполняться именно по этому пути. Программа является корректной только в том
случае если для каждого пути приводящего к ошибке не существует входных данных
удовлетворяющих соответствующим ограничениям.
Существует две стратегии проверки ограничений:
1. Ленивая - ограничения проверяются только в конце путей приводящих к ошибке
2. Активная - ограничения проверяются после добавления каждого нового ограничения
Преимуществом первой стратегии является то что проверки ограничений редко
запускаются. Вторая же стратегия позволяет отсекать большое количество путей для
которых не существует входных данных еще в самом начале программы.
Сетевые программы обычно содержат в себе классификационные таблицы.
Классификационная таблица по строке, состоящей из $n_i$ бит, возвращает действие
которое надо выполнить. Именно из за большого количества бит и сложного представления
таблиц проверка ограничений требует существенных временных затрат. При ленивой
стратегии возникает большое количество различных путей (например если программа
состоит из двух последовательных классификационных таблиц то количество различных
путей будет равно количеству различных действий в первой таблице умножить на
количество различных действий во второй таблице).
Цель работы​: В данном проекте предлагается разработать смешанную стратегию в
которой часть ограничений проверяется сразу, а часть в конце. Один из возможных
методов -- это предполагать что во время прохождения по пути классификационные
таблицы классифицирую только подстроки из $m_i < n_i$ битов, а ограничения на целые
строки проверять в конце ошибочных путей.
Что следует сделать​:
● Сделать symbolic executor со смешанной стратегией для P4 программ
● Исследовать зависимость времени выполнения symbolic execution в зависимости от
длины подстрок проверяемых во время прохождения по пути
● Исследовать то как влияют структурные свойства классификационных таблиц на
количество путей и сложность проверки ограничений
Ожидаемые результаты​: Symbolic executor который показывает преимущества смешанной
стратегии.

Требования​: способность думать и кодить, заинтересованность в проекте, желание
исследовать а не просто реализовать что то конкретное. Знание symbolic execution и
компьютерных сетей не может быть плюсом.
Источники​:
5. https://en.wikipedia.org/wiki/Symbolic_execution
6. Debugging P4 programs with Vera (​https://dl.acm.org/authorize.cfm?key=N666960​)

Темы по конкурентным вычислениям 
Руководитель проектов:​Dan Alistarh, IST Austria, Vienna. Предварительно связаться с
Виталием Аксеновым (​aksenov.vitaly@gmail.com​)
Требования:
1) Оценка не ниже 4 по математическому анализу, алгоритмам и структурам данных,
параллельным и распределённым вычислениям.
2) Положительная рекомендация от работника кафедры (например, Нияза
Нигматуллина).
3) Решиться в течение недели.
Описание тем:
https://docs.google.com/document/d/1_Xwgm1WB2lvvXsv56UZOX2HiuL6ReCKc97UIcwoapiw/e
dit?usp=sharing

1. Can You Scale Machine Learning to Hundreds of Cores? (Dan Alistarh) 
Уровень:​Advanced Bachelor / Master

2. Communication-Scalable Machine Learning. (Dan Alistarh) 
Уровень:​Advanced Bachelor / Master

3. A Scalable Simulator for Billions of Interacting Molecules. (Dan Alistarh) 
Уровень: ​Advanced Bachelor / Master

4. Concurrent Union-Find Algorithms. (Dan Alistarh) 
Уровень: ​Bachelor

7. Transactional Scalability on 1000+ Processor Cores. (Dan Alistarh) 
Уровень:​Advanced Bachelor/Master

8. Time-traveling concurrency control protocols. (Dan Alistarh) 
Уровень:​Bachelor

9. CDSBench: A Serious Benchmarking Framework for Concurrent Data 
Structures. (Dan Alistarh) 
Уровень:​Bachelor / Master

[ЗАНЯТО] 10. Implementing Byzantine-Resilient Machine Learning 
Algorithms. (Dan Alistarh) 
Уровень:​Master

11. Compressing Neural Networks for Fun and Profit (Dan Alistarh) 
Уровень:​Master
Руководитель проектов:​Пётр Кузнецов, Telecom ParisTech, ИТМО
(petr.kuznetsov@telecom-paristech.fr).

1. Non-Volatile Computability (Petr Kuznetsov) 
Goal:​Characterize the computing power of non-volatile memory models.
Tools:​Logic, algorithmic reasoning, programming
Prerequisites:​basic knowledge of distributed algorithms, basic concurrent programming skills,
curiosity and persistence
Level:​Bachelor/Master
Concurrent programs are often expected to provide safety and progress in asynchronous systems
in the presence of crash failures [7]: a faulty process prematurely stops taking steps of its
algorithm. Recently, a lot of attention has been paid recently to crash-recovery models [2] in which
a process can resurrected after a crash. This was driven by the emerging non-volatile memory in
which main conventional memory is equipped with the persistence feature. Recoverable objects
designed for such models allow their operations to recover from crash failure [1,5,6].
The new model forces us to reconsider classical distributed computability results [3,4,7,8],
separating computable from not computable for a given model of computation. The goal of this
project is to determine the computability bounds in the non-volatile context.
References:
[1] H. Attiya, O. Ben-Baruch, and D. Hendler. Nesting-safe recoverable linearizability: Modular
constructions for non-volatile memory. In Proceedings of the 2018 ACM Symposium on Principles
of Distributed Computing, PODC 2018, Egham, United Kingdom, July 23-27, 2018, pages 7–16,
2018.
[2] H. Boehm and D. R. Chakrabarti. Persistence programming models for non-volatile memory.
In Proceedings of the 2016 ACM SIGPLAN International Symposium on Memory Management,
Santa Barbara, CA, USA, June 14 - 14, 2016, pages 55–67, 2016.
[3] T. D. Chandra, V. Hadzilacos, and S. Toueg. The weakest failure detector for solving
consensus. J. ACM, 43(4):685–722, July 1996.

[4] M. J. Fischer, N. A. Lynch, and M. S. Paterson. Impossibility of distributed consensus with one
faulty process. J. ACM, 32(2):374–382, Apr. 1985.
[5] W. Golab. Recoverable consensus in shared memory. CoRR, abs/1804.10597, 2018.
[6] W. M. Golab and D. Hendler. Recoverable mutual exclusion in sub-logarithmic time. In
Proceedings of the ACM Symposium on Principles of Distributed Computing, PODC 2017,
Washington, DC, USA, July 25-27, 2017, pages 211–220, 2017.
[7] M. Herlihy. Wait-free synchronization. ACM Trans. Prog. Lang. Syst., 13(1):123–149, 1991.
[8] M. Herlihy and N. Shavit. The topological structure of asynchronous computability. J. ACM,
46(2):858–923, 1999.

2. Byzantine Fault-Tolerant Reconfigurable Systems (Petr Kuznetsov)  
Goals:​Study the potential of building a storage system in a dynamic environment tolerating
Byzantine faults.
Tools:​Logic, algorithmic reasoning, programming
Prerequisites:​basic knowledge of distributed algorithms (with a focus storage systems and
Byzantine Fault-Tolerance), basic concurrent programming skills, curiosity and persistence
Level:​Master
In the simplest setting, a decentralized storage service [2,3] runs on a set of fault-rpone servers
(sometimes also called replicas) provides the interface of a read-write register [8]. A number of
proposals [1,5,6,9] suggested a reconfigurable service that allows the system replicas to join,and
leave, while ensuring consistency of the stored data. Early proposals [6] were based on using
consensus [4,7] as a way to ensure that the replicas agree on the evolution of system
membership. Given that consensus is expensive and difficult to implement, more recent solutions
[1,5,9] replace consensus with smart quorum-based broadcast algorithms.
All these implementations tolerate crash failure of a certain fraction of active users. The goal of
this project is to explore to which extent consensus-less reconfigurations can be implemented in
the dynamic Byzantine fault model, where some replicas may arbitrarily deviate from the
algorithms they are assigned.
References:
[1] M. K. Aguilera, I. Keidar, D. Malkhi, and A. Shraer. Dynamic atomic storage without
consensus. J. ACM, 58(2):7:1–7:32, 2011.
[2] H. Attiya, A. Bar-Noy, and D. Dolev. Sharing memory robustly in message passing systems. J.
ACM, 42(2):124–142, Jan. 1995.
[3] G. V. Chockler, R. Guerraoui, I. Keidar, and M. Vukolic. Reliable distributed storage. IEEE
Computer, 42(4):60–67, 2009
[4] M. J. Fischer, N. A. Lynch, and M. S. Paterson. Impossibility of distributed consensus with one
faulty process. J. ACM, 32(2):374–382, Apr. 1985.

[5] E. Gafni and D. Malkhi. Elastic configuration maintenance via a parsimonious speculating
snapshot solution. In Distributed Computing - 29th International Symposium, DISC 2015, Tokyo,
Japan, October 7-9, 2015, Proceedings, pages 140–153, 2015.
[6] S. Gilbert, N. A. Lynch, and A. A. Shvartsman. Rambo: a robust, reconfigurable atomic
memory service for dynamic networks. Distributed Computing, 23(4):225–272, 2010.
[7] M. Herlihy. Wait-free synchronization. ACM Trans. Prog. Lang. Syst., 13(1):123–149, 1991.
[8] L. Lamport. On interprocess communication; part I and II. Distributed Computing,
1(2):77–101,1986.
[9] A. Spiegelman, I. Keidar, and D. Malkhi. Dynamic reconfiguration: Abstraction and optimal
asynchronous solution. In 31st International Symposium on Distributed Computing, DISC 2017,
October 16-20, 2017, Vienna, Austria, pages 40:1–40:15, 2017.

3. Synchrony Assumptions for Blockchain Systems (Petr Kuznetsov) 
Goals:​Determine the trade-offs between consistency and performance in permissionless and
permissioned blockchains.
Tools:​Logic, algorithmic reasoning, programming
Prerequisites:​basic knowledge of distributed algorithms (with a focus on state-machine
replication, Byzantine Fault-Tolerance, storage systems), basic concurrent programming skills,
curiosity and persistence
Level:​Master
The prominent blockchain technology aims at implementing a public ”ledger”: a decentralized
consistent history of transactions proposed by an open set of participating processes, with no
static membership. This problem can be seen as an instance of fault-tolerant state-machine
replication [14], prominent examples of which are the crash-tolerant Paxos protocol by Lamport
[11] and the BFT (Byzantine fault-tolerant) system by Castro and Liskov [3]. These systems use
instances of consensus protocols in order to ensure that users get consistent views of the system
evolution.
Principal downside of classical consensus protocols are lack of scalability and the need for a fixed
or properly reconfigurable set of participants out of which only a bounded fraction (up to one third)
can be faulty. This can be hard to ensure in an open system, where an arbitrary fraction of
participants can be controlled by the adversary [5]. Prominent blockchain protocols [13,15]
achieve (nondeterministic) consistency by assuming that (1) the system is synchronous, (2)
participants can use asymmetric cryptography, and (3) the adversary can control at most a
minority (in practice, a minor fraction) of computing power.
Intuitively, these assumptions are used to overcome the folklore CAP theorem [2, 8] stating that
no system can combine Consistency, Availability, and Partition-Tolerance. In particular, these
protocols avoid partitioning by enforcing the proof of work (PoW) mechanism requiring that a
participant must solve a time-consuming cryptographic puzzle before updating the ledger. The

resulting protocols are notoriously slow and energy-demanding. More recent blockchain
prototypes propose to obviate the energy demands via using proof-of-stake [1,10], proof-of-space
[6], or proof of space-time [12]. However, the proposals still resort to synchronous networks
and/or impose restrictions on the fraction of honest players to ensure proper security levels. An
immediate question is whether these costs and assumptions are unavoidable.
In this project, we intend to characterize the model assumptions that enable strong ledger
consistency in an open system. This will involve determining precise bounds on the amount of
synchrony [4,7] and energy/space/time consumption for implementing a generic distributed
transaction ledger. This might lead to improving the conventional “proof” mechanisms, used, e.g.,
in Tezos [9] and Cardano [10] platforms.
Theoretical in its nature, the project is motivated by viable practical concerns. Besides provable
complexity and computability bounds, it intends to develop system prototypes that are not only
formally proved correct but also studied experimentally.
References:
[1] I. Bentov, A. Gabizon, and A. Mizrahi. Cryptocurrencies without proof of work. In Financial
Cryptography and Data Security - FC 2016 International Workshops, BITCOIN, VOTING, and
WAHC, Christ Church, Barbados, February 26, 2016, Revised Selected Papers, pages 142–157,
2016.
[2] E. A. Brewer. Towards robust distributed systems (abstract). In Proceedings of the Nineteenth
Annual ACM Symposium on Principles of Distributed Computing, PODC ’00, pages 7–, 2000.
[3] M. Castro and B. Liskov. Practical byzantine fault tolerance. In OSDI: Symposium on Operating Systems Design and Implementation. USENIX Association, Co-sponsored by IEEE TCOS and
ACM SIGOPS, Feb. 1999.
[4] T. D. Chandra, V. Hadzilacos, and S. Toueg. The weakest failure detector for solving
consensus. J. ACM, 43(4):685–722, July 1996.
[5] J. R. Douceur. The sybil attack. In Peer-to-Peer Systems, First International Workshop, IPTPS
2002, Cambridge, MA, USA, March 7-8, 2002, Revised Papers, pages 251–260, 2002.
[6] S. Dziembowski, S. Faust, V. Kolmogorov, and K. Pietrzak. Proofs of space. In Advances in
Cryptology - CRYPTO 2015 - 35th Annual Cryptology Conference, Santa Barbara, CA, USA,
August 16-20, 2015, Proceedings, Part II, pages 585–605, 2015.
[7] F. C. Freiling, R. Guerraoui, and P. Kuznetsov. The failure detector abstraction. ACM Comput.
Surv., 43(2):9:1–9:40, 2011.
[8] S. Gilbert and N. Lynch. Brewer’s conjecture and the feasibility of consistent, available,
partition-tolerant web services. SIGACT News, 33(2):51–59, June 2002.
[9] L. Goodman. Tezos: A self-amending crypto-ledger: Position paper, August 2014. https:
//tezos.com/static/papers/position_paper.pdf.
[10] A. Kiayias, A. Russell, B. David, and R. Oliynykov. Ouroboros: A provably secure proof-ofstake blockchain protocol. In Advances in Cryptology - CRYPTO 2017 - 37th Annual International
Cryptology Conference, Santa Barbara, CA, USA, August 20-24, 2017, Proceedings, Part I,
pages 357–388, 2017.

4. Robust Cortical Learning (Petr Kuznetsov) 
Goals:​Explore the potential of “cortical learning” to tolerate failures and asynchrony of
communication.
Tools:​Logic, algorithmic reasoning, programming
Prerequisites:​basic knowledge of distributed algorithms and neural computation, basic
concurrent programming skills, curiosity and persistence
Level:​Bachelor/Master
The goal of this interdisciplinary project is to explore computational mechanisms of learning in the
brain. In the conventional neuronal model [4], the cortex is represented as a large random graph
of neuroids (abstract neuron-like automata) connected via directed edges called synapses.
Communication between neuroids is bound to be vicinal: a neuroid fires if the sum of potentials of
all firing neuroids with synapses to it exceed a specific theshold. In this model, the problem
unsupervised learning consists in memorizing an input pattern x ∈ {0, 1}​n​, i.e., associating x with
a hierarchical structure in the cortex and a top-level pattern I(x) so that (1) for all x ̸= y, I(x) ̸= I(y)
and (2) whenever x fires, I(x) fires too.
It has been argued that learning can be implemented with simple primitives [2, 3, 5], such as
LINK, JOIN and PJOIN. For example, if two items A and B are already represented in the neural
system, the primitive JOIN(A,B) modifies its structure so that a new item C will fire whenever
representations of A and B fire. This way massively distributed cortical computation can be
viewed as a composition of simple sequential primitives, which can be implemented in the vicinal
way.
This project intends to extend this approach to fault-prone in which neuroids or synapses are
subject to failures, which may affect the process of learning. Pursuing this goal may require
reconsidering existing models of cortical computations, analyzing alternative proposals [1], and
deriving new algorithms for robust (fault-tolerant) learning.

Contact
This is a joint project between T ́ el ́ ecom ParisTech and UPMC.
Petr Kuznetsov
http://www.infres.enst.fr/~kuznetso/ petr.kuznetsov@telecom-paristech.fr INFRES, T ́ el ́ ecom
ParisTech
Denis Sheynikhovich
http://www.aging-vision-action.fr/people/denis-sheynikhovich/ denis.sheynikhovich@upmc.fr
Vision Institute
Aging in Vision and Action Lab
CNRS INSERM University Pierre&Marie Curie

References:
[1] E. M. E. Mhamdi and R. Guerraoui. When neurons fail. In 2017 IEEE International Parallel
and Distributed Processing Symposium, IPDPS 2017, Orlando, FL, USA, May 29 - June 2, 2017,
pages 1028–1037, 2017.
[2] C. H. Papadimitriou and S. Vempala. Cortical learning via prediction. In Proceedings of The
28th Conference on Learning Theory, COLT 2015, Paris, France, July 3-6, 2015, pages 1402–
1422, 2015.
[3] C. H. Papadimitriou and S. S. Vempala. Cortical computation. In PODC, pages 1–2, 2015.
[4] L. G. Valiant. Circuits of the mind. Oxford University Press, 1994.
[5] L. G. Valiant. Memorization and association on a realistic neural model. Neural Computation,
17(3):527555, 2005.

5. Combinatorial Structures for Bonded-Memory Computing (Petr Kuznetsov) 
Goals:​Characterize computability in shared memory models of bounded capacity using tools of
combinatorial topology.
Tools:​Logic, mathematics, algorithmic reasoning.
Prerequisites:​Maturity in math and algorithms, curiosity and rigor.​Level:​Master
Practically all computing systems, from fire alarms to Internet-scale services, are nowadays
distributed: they consist of a number of computing units performing independent computations
and communicating with each other to synchronize their activities. Our dependence on
performance and reliability of the distributed computing becomes more and more imminent.
Therefore, understanding fundamentals of distributed computing is of crucial importance.
The main complication here is the existing immense diversity of distributed applications, models of
distributed computations, and performance metrics, combined with the lack of mathematical tools
to handle this complexity.
Recently, an impressive attempt to address this challenge was made: some long-standing open
questions in distributed computability were resolved using advanced branches of modern
mathematics, such as combinatorial and algebraic topology. More precisely, a set of possible
concurrent executions can be represented as a geometrical structure, called simplicial complex,
and all possible ways the concurrent system can evolve can be seen as a transformation of the
simplicial complex in space.
For example, it turns out that the simplicial complex modelling the reachable states of a wait- free
system (imposing neither synchrony assumptions nor bounds on the number of failures) is always
contractible (connected in all dimensions) and, thus, there is no way to solve non-trivial set
agreement (imposing an odd number of “holes”) [1,4,5,7]. More generally, task computability in
read-write shared-memory systems has been characterized via the celebrated Asynchronous
Computability Theorem (ACT) [3,5], relating the ability if solving a task with the existence of a

specific simplicial map from the task’s input simplicial complex to the task’s output simplicial
complex.
ACT and its more recent generalizations [2,6] implicitly assumes unbounded shared-memory
distributed systems. Indeed, these characterizations are based on full-information protocols in
which processes use the shared memory to exchange complete information about their states,
which might require no bounds on both the local and shared memory. In this project, we intend to
characterize bounded computations. This may potentially give rise to new time and space
complexity bounds for shared-memory algorithms.
References:
[1] E. Borowsky and E. Gafni. Generalized FLP impossibility result for t-resilient asynchronous
computations. In STOC, pages 91–100. ACM Press, May 1993.
[2] E. Gafni, P. Kuznetsov, and C. Manolescu. A generalized asynchronous computability
theorem. In ACM Symposium on Principles of Distributed Computing, PODC ’14, Paris, France,
July 15-18, 2014, pages 222–231, 2014.
[3] M. Herlihy, D. N. Kozlov, and S. Rajsbaum. Distributed Computing Through Combinatorial
Topology. Morgan Kaufmann, 2014.
[4] M. Herlihy and N. Shavit. The asynchronous computability theorem for t-resilient tasks. In
STOC, pages 111–120, May 1993.
[5] M. Herlihy and N. Shavit. The topological structure of asynchronous computability. J. ACM,
46(2):858–923, 1999.
[6] P. Kuznetsov, T. Rieutord, and Y. He. An asynchronous computability theorem for fair adversaries. In Proceedings of the 2018 ACM Symposium on Principles of Distributed Computing,
PODC 2018, Egham, United Kingdom, July 23-27, 2018, pages 387–396, 2018.
[7] M. Saks and F. Zaharoglou. Wait-free k-set agreement is impossible: The topology of public
knowledge. In STOC, pages 101–110. ACM Press, May 1993.

Темы от Транзаса 
Разработка алгоритма динамической замены правил визуализации для
электронных навигационных карт
Руководители:​Алексей Захаров (​zakharov_alexey1@mail.ru​, ​Alexey.Zakharov@transas.com
)
Уровень​: бакалаврская/магистерская
Описание предметной области

S101 – это формат электронных навигационных карт, который в ближайшие годы станет
стандартом для морской отрасли, заменив S57. Одна из основных идей разработки S101 –
обеспечить возможность динамической замены каталога объектов и правил визуализации,
чтобы изменения правил визуализации и отображение новых объектов могли быть
реализованы без обновления программного обеспечения на компьютере пользователя.
Правила визуализации выпускаются IHO (International Hydrographic Organization) на языках
XSLT и Lua.
Исследованные варианты реализации:
1. Прямое применение правил на языке XSLT обеспечивает возможность применения
любых правил, но неприемлемо по производительности.
2. Прямое применение правил на языке Lua обеспечивает возможность применения
любых правил, но тоже неприемлемо по производительности, хотя и лучше XSLT.
3. Чтение правил рисования с помощью языка C++ и формирование иерархии объектов,
применяющих правила, обеспечивает среднюю производительность, но позволяет
покрыть только определенное подмножество языка.
4. Конвертация правил визуализации (с помощью скриптов Python) в код на C++
обеспечивает высокую производительность, но позволяет покрыть только определенное
подмножество языка и рассматривается как дыра в Cyber Security.
Цель работы​: Разработка алгоритмов динамической замены правил визуализации для
электронных навигационных карт.
Что следует сделать​:
● Изучить стандарты визуализации карт S101 и имеющиеся в Транзасе наработки по
данной тематике
● Исследовать возможность более производительной интеграции Lua и C++ кода
(возможно, предложить изменения в Lua правилах, которые позволят без изменения
содержания эффективнее интегрировать их с C++, мы можем предложить
разработчикам стандарта такие изменения)
● Исследовать возможность комбинирования Lua правил для обновленных объектов и
конвертированных в C++ правил для остальных
● Исследовать возможность разработки сервиса, который получает информацию о
новых правилах рисования и запрашивает у сервера на берегу обновленную
библиотеку
Ожидаемые результаты​: Выбор решения для реализации динамической замены правил
визуализации, реализация выбранного решения, сравнение его с альтернативами по
производительности и другим характеристикам.
Требования​: Хорошие навыки разработки на C++, навыки программирования на Python
и/или Lua будут преимуществом.

Источники​:

1.

J​. Powell. S-101 – The new IHO Electronic Navigational Chart Product Specification.
https://www.hydro-international.com/conthttps://www.hydro-international.com/content/
news/s-101-the-new-iho-electronic-navigational-chart-product-specification-3
1. https://www.iho.int/mtg_docs/com_wg/TSMAD/TSMAD_Misc/S-101/S-101_Index.htm
2. https://www.sevencs.com/enc-production-tools/s-100-data-model/

Разработка формата хранения данных для карт ручной корректуры
Руководители:​Алексей Захаров (​zakharov_alexey1@mail.ru​, ​Alexey.Zakharov@transas.com
)
Уровень​: бакалаврская
Описание предметной области

Manual Correction – - это карты дополнительных объектов, которые должны
визуализироваться поверх основной электронной навигационной карты. Как и основная
навигационная карта, Manual Correction визуализируется по правилам, описанным на языке
S52. Отличием Manual Correction является необходимость редактирования их
пользователем. Это вынуждает иметь два представления карты, удобное для
редактирования и удобное для применения правил визуализации. Например, с точки зрения
пользователя буй с огнем и топовой фигурой – это единый объект, а с точки зрения правил
визуализации – три отдельных объекта.
Цель работы​: Разработка формата хранения данных для навигационных карт ручной
корректуры и компонентов работы с картами данного формата.
Что следует сделать​:
● Изучить требования к функциональности ручной корректуры
● Выбрать формат хранения данных ручной корректуры.
● Реализовать компоненты чтения и записи данных в предложенном формате
● Реализовать компоненты визуализации и редактирования данных
● Исследовать и оптимизировать производительность разработанных компонентов.
● Участвовать во внедрении компонентов в бортовые навигационные системы
Транзаса

Ожидаемые результаты​: Обоснование выбора формата для хранения данных,
разработанный компонент и тестовые программы к нему, интеграция компонента в
навигационные системы Транзаса,
Требования​: Хорошие навыки разработки на C++. Поскольку в функциональности есть
прямая коммерческая потребность, интересен вариант с трудоустройством в Транзас
студента, желающего этой темой заниматься.