Основные результаты 2018

 

Главная цель проекта: разработать перспективные методы для интеллектуального анализа данных высокой размерности, оптимизированные для работы в высокой (десятки и сотни) и очень высокой (тысячи, десятки тысяч и более) размерности.

Для достижения этой цели разработаны математические основы технологии создания корректоров систем ИИ. В частности, доказаны новые теоремы о стохастической разделимости для широкого класса логарифмически-вогнутых распределений.

Получены оценки эффективности корректоров, построенных из двухнейронных систем нескоррелированных нейронов и проведено вычислительное сравнение этой системы с однонейронными корректорами.

Разработан гибкий и вычислительно эффективный подход к обобщению большинства существующих методов анализа данных, использующих квадратичную форму ошибки, на произвольную функцию ошибки с субквадратичным ростом. Разработана общая схема подхода и реализующее его программное обаспечение для задач регрессии, регуляризованной регрессии, кластер-анализа и обобщенного метода главных компонент.

Для построения моделей оптимальной сложности предлагается формальная постановка задачи о игре против наблюдателя. Приводится первая основная теорема о том, что при достаточно малой ошибке модели игра против наблюдателя приводит лишь к малой ошибке в наблюдении и идентификации системы. Проблема о игре против наблюдателя погружается в задачу оценки инфляции аттракторов при наличии возмущений.

Разработан и имплементирован новый шкалируемый и робастный метод для аппроксимации множеств данных со сложной структурой, ElPiGraph (ELastic PrIncipal Graph). ElPiGraph эффективно обрабатывает большие и сложные базы данных из разных обастей знания, от биологии, где он используется для открытия динамики функционирования генома из последовательностей РНК отдельных клеток, до астрономии, где он может быть использован для исследования сложных структур в галактиках и их распределениях.

Собрано несколько оригинальных и пополняемых коллекций данных для машинного обучения, в том числе, (1) база данных изображений поездов, проходящих мимо камеры видеонаблюдения, установленной на железнодорожной станции, (2) новая база данных аннотированных электрокардиограмм с 12 отведениями (ЭКГ), записанных с частотой 500 Гцб, (3) экспериментальная база данных по ЭМГ-паттернам во время выполнения различных жестов руки в синтетических и игровых тестах с помощью ЭМГ-интерфейса, (4) большая коллекция записей спонтанной биоэлектрической активности первичных культур клеток гиппокампа на разных этапах развития in vitro. Международные партнеры предоставили для работы обширные коллекции данных о транскриптомах отдельных клеток (scRNA-Seq данные).

Для анализа внутренней размерности данных создан принципиально новый метод, основанный на эффектах стохастической разделимости. Метод протестирован на анализе большого числа биомедицинских данных.

Коллекция ЭМГ данных обрабатывалась с помощью нейросетевых технологий (метод обратного распространения ошибки и самоорганизующиеся карты Кохонена). Выявлены факторы, лимитирующие производительность ЭМГ интерфейса. Разработан инструментарий, выявляющий проблемные жесты и испытуемых.

Исследовано, как именно ансамбль искусственных нейронных стей исправляет ошибки базовой сети на примере задачи разметки данных электрокардиограмм (ЭКГ).

Разработан и протестирован в реальных операционных условиях новый и универсальный подход к распознаванию видео информации и к поиску на захваченном видеоизображении объектов заданного типа. Проведено сравнение эффективности использования различных типов базовых признаков для кодирования изображения на примере задачи распознавания номеров железнодорожных вагонов.

Живые нейронные сети в диссоциированых нейронных культурах известны способностью генерировать устойчивые сложные пространственно-временные паттерны в экспериментальных условиях. Выведена и проанализирована новая модель сети, которая может дать объяснить появление этих паттернов. Поведение модели и ее предсказания подтверждаются эмпирическими данными.

Исследована динамика концентрации молекул - внеклеточного матрикса мозга (ВКМ) в математической модели модуляции нейронной активности, регулируемой ВКМ. Установлено, что уровни концентрации ВКМ могут иметь различные режимы активности, начиная от нейронного индуцированного зажиганием протеазнезависимого переключения между стационарными состояниями концентрации ВКМ до спонтанных колебаний ВКМ.

Изучалась роль нейротрофического фактора головного мозга (BDNF) в процессах формирования нейронных сетей in vitro. В том числе, исследованы особенности спонтанной биоэлектрической активности первичных культур гиппокампа и особенности функциональной кальциевой активности первичных культур гиппокампа на фоне хронического воздействия на систему BDNF.

Созданное новое программное обеспечение находится в открытом доступе.

Под руководством Горбаня А.Н. была проведена серия установочных семинаров и мастер-классов для участников проекта, где были обсуждены траектории развития научных исследований участников проекта, определены результаты и сроки реализации.

Опубликованно 13 статей в изданиях из коллекции Web of Science Scopus), из них 6 статей принадлежат первому квартилю (Q1) по соответствующим областям знаний. Направлено в печать 16 публикаций.

7 - 15 июля 2018 года на объединенной конференции по нейронным сетям (IJCNN) в рамках Всемирного Конгресса по Вычислительному Интеллекту (WCNN) в Рио-де-Жанейро, Бразилия была организована специальная секция Всемирного конгресса Нейронный интеллект послезавтра (Neural Intelligence After Tomorrow) для представления результатов проекта. 22 - 27 июля 2018 года на теплоходе, следующем по курсу Нижний Новгород Самара - Нижний Новгород, состоялась международная конференция Нейродинамика и искусственный интеллект (Neurodynamics and Artificial Intelligence) в рамках международного симпозиума по нейронаукам Volga Neuroscience Meeting.

Ведущий ученый и члены научного коллектива участвовали с докладами в 12 конференциях, научных семинарах, симпозиумах.

Решены задачи, поставленные на 2018 год. Результаты соответствуют требованиям задания. Достоверность результатов потверждается строгими математическими доказательствами, а также систематическим тестированием новых алгоритмов на синтетических и реальных данных из различных источников.