Алгоритмы доверенного и объяснимого ИИ, обеспечивающих дообучение и исправление ошибок «на лету».
Подходы для объединения потоков разнородных данных как мультиагентных систем взаимодействующих адаптивных моделей для предсказания индивидуальных траекторий здоровья и заболеваний.
Графовое представление данных, удобное для больших выборок с небольшим количеством заранее не известных связей (параметров много, и связи между ними заранее не известны).
ННГУ разработаны подходы к рациональной обработке ошибок искусственного интеллекта для их минимизации в будущем. Эффекты большой размерности могут не только создавать проблемы («проклятие размерности»), но и эффективно использоваться («благословение размерности»). В частности, в ННГУ разработана технология коррекции ошибок систем машинного обучения и искусственного интеллекта в многомерном пространстве, основанная на эффектах концентрации меры в многомерных пространствах (корректоры и мультикорректоры).
Дополнительная сложность обработки реальных потоков многомерных данных заключается в том, что гипотезы о статистическом порождении данных на основе регулярных распределений вероятностей зачастую не подтверждаются. Данные могут обладать сложной мелкозернистой структурой с большим количеством кластеров и локальных пиков плотности вероятности. Мультикорректоры, основанные на кластеризации ошибок, позволяют эффективно обрабатывать подобные неклассические данные.
В рамках деятельности Центра планируется доведение данных разработок от уровня теоретических исследований и исследовательского программного обеспечения до полноценных пользовательских решений для обработки многомерных данных в здравоохранении и создания систем доверенного искусственного интеллекта на основе технологии мультикорректоров.
Посмотреть презентацию R&D SBER Day по этой теме.
Программное обеспечение ClinTrajAn (Clinical Trajectory Analysis — анализ клинических траекторий) представляет собой пакет, разработанный на языке Python для анализа больших массивов клинических данных с целью описания траекторий развития заболеваний и динамического фенотипирования пациентов.
Алгоритмической основой ClinTrajAn является метод упругих главных графов, ориентированный на анализ больших наборов клинических данных со смешанными типами переменных и значительным количеством пропущенных значений.
Метод моделирует геометрическую структуру данных как «букет» расходящихся клинических траекторий с использованием эластичных главных графов и топологических грамматик.
Разработанный метод основан на минимизации энергетического потенциала, включающего:
Главные графы представляют собой графовые структуры, встроенные в многомерное пространство и минимизирующие расстояние до точек данных при сохранении регулярных свойств структуры.
Структура графа формируется путем оптимального применения последовательности графовых преобразований с использованием операций предопределенной грамматики графов.
Простейшая грамматика графа:
позволяет осуществлять построение главного дерева.