Top.Mail.Ru
Главная - О центре - Лаборатория перспективных методов анализа многомерных данных

Лаборатория перспективных методов анализа многомерных данных

Пакет №1

Алгоритмы доверенного и объяснимого ИИ, обеспечивающих дообучение и исправление ошибок «на лету».

Результаты:

  • Библиотека для работы с сетями элементарных корректоров;
  • Фреймворк для переноса навыков сети корректоров в большую систему;
  • Набор биомедицинских данных.

Пакет №2

Подходы для объединения потоков разнородных данных как мультиагентных систем взаимодействующих адаптивных моделей для предсказания индивидуальных траекторий здоровья и заболеваний.

Результаты:

  • Алгоритмы для ассимиляции разнородных данных с помощью сети взаимодействующих моделей. Персонализированные нейросетевые эксперты ассимилируют информацию, предсказывают риски на различных масштабах времени и прогнозируют динамику состояния пациента.

Пакет №6

Графовое представление данных, удобное для больших выборок с небольшим количеством заранее не известных связей (параметров много, и связи между ними заранее не известны).

Результаты:

  • Комбинированные методы на основе 3 разных подходов (корреляционные и синотические графы и новый подход — метод главных графов и динамических фенотипов);
  • Библиотека для представления данных в виде графов для анализа данных с внутренней структурой;
  • Набор биомедицинских данных (протеомные данные для ранней диагностики рака яичников и рака поджелудочной железы, данных по ХОБЛ, диабету, инфаркту миокарда, и различным форматам стресса, в том числе фМРТ и ЭЭГ);
  • Построение и анализ графовых моделей по данным.

ННГУ разработаны подходы к рациональной обработке ошибок искусственного интеллекта для их минимизации в будущем. Эффекты большой размерности могут не только создавать проблемы («проклятие размерности»), но и эффективно использоваться («благословение размерности»). В частности, в ННГУ разработана технология коррекции ошибок систем машинного обучения и искусственного интеллекта в многомерном пространстве, основанная на эффектах концентрации меры в многомерных пространствах (корректоры и мультикорректоры).

Дополнительная сложность обработки реальных потоков многомерных данных заключается в том, что гипотезы о статистическом порождении данных на основе регулярных распределений вероятностей зачастую не подтверждаются. Данные могут обладать сложной мелкозернистой структурой с большим количеством кластеров и локальных пиков плотности вероятности. Мультикорректоры, основанные на кластеризации ошибок, позволяют эффективно обрабатывать подобные неклассические данные.

В рамках деятельности Центра планируется доведение данных разработок от уровня теоретических исследований и исследовательского программного обеспечения до полноценных пользовательских решений для обработки многомерных данных в здравоохранении и создания систем доверенного искусственного интеллекта на основе технологии мультикорректоров.

Посмотреть презентацию R&D SBER Day по этой теме.

Разработанное программное обеспечение

Программная реализация метода динамического фенотипирования заболеваний ClinTrajAn

Программное обеспечение ClinTrajAn (Clinical Trajectory Analysis — анализ клинических траекторий) представляет собой пакет, разработанный на языке Python для анализа больших массивов клинических данных с целью описания траекторий развития заболеваний и динамического фенотипирования пациентов.

Алгоритмической основой ClinTrajAn является метод упругих главных графов, ориентированный на анализ больших наборов клинических данных со смешанными типами переменных и значительным количеством пропущенных значений.

Метод моделирует геометрическую структуру данных как «букет» расходящихся клинических траекторий с использованием эластичных главных графов и топологических грамматик.


Программная реализация метода упругих главных графов DeepFuzzyElPiGraph в скрытых пространствах

Разработанный метод основан на минимизации энергетического потенциала, включающего:

  • среднеквадратическую ошибку аппроксимации данных;
  • сумму квадратов длин ребер;
  • компоненту, минимизирующую отклонение основного вложения графа от гармоничности (обобщение линейности).

Главные графы представляют собой графовые структуры, встроенные в многомерное пространство и минимизирующие расстояние до точек данных при сохранении регулярных свойств структуры.

Структура графа формируется путем оптимального применения последовательности графовых преобразований с использованием операций предопределенной грамматики графов.

Простейшая грамматика графа:

  • «Разделить ребро пополам»;
  • «Добавить узел к узлу»

позволяет осуществлять построение главного дерева.


Все новости