Главная - О центре - Лаборатория перспективных методов анализа многомерных данных

Лаборатория перспективных методов анализа многомерных данных

В ННГУ разработаны подходы к рациональной обработке ошибок ИИ для их минимизации в будущем. Эффекты большой размерности могут не только создавать проблемы («проклятие»), но и эффективно использоваться («благословение размерности»). В частности, в ННГУ разработана технология коррекции ошибок систем машинного обучения и искусственного интеллекта в многомерном мире, основанная на эффектах концентрации меры в многомерных пространствах (корректоры и мультикорректоры).

Дополнительная сложность в обработке реальных потоков многомерных данных состоит в том, что никакая гипотеза о статистическом порождении данных на основе сколько-нибудь регулярного распределения вероятностей не подтверждается. Данные могут иметь богатую мелкозернистую структуру с множеством кластеров и соответствующих пиков в плотности вероятности. Мультикорректоры, основанные на кластеризации ошибок могут успешно обрабатывать неклассические данные.

В рамках работы Центра предполагается довести эти работы от теоретических результатов и исследовательского программного обеспечения до пользовательского программного обеспечения для обработки многомерных данных, возникающих в здравоохранении, и создания систем доверенного искусственного интеллекта, основанного на технологии мультикорректоров.

Презентация R&D SBER Day.

Разработанное программное обеспечение

Программная реализация метода динамического фенотипирования заболеваний ClinTrajAn.

Программное обеспечение ClinTrajAn (Clinical Trajectory Analysis – анализ клинических траекторий) является пакетом, написанном на языке Python и созданным для анализа больших наборов клинических данных с целью описания траекторий развития заболеваний и динамического фенотипирования отдельных пациентов. Алгоритмической основой ClinTrajAn является метод упругих главных графов, который ориентирован на анализ большого количества клинических данных, характеризующихся смешанными типами данных и существенным количеством пропущенных значений. Метод моделирует геометрическую структуру данных как «букет» расходящихся клинических траекторий, с применением метода эластичных главных графов и топологических грамматик.

Программная реализация метода упругих главных графов DeepFuzzyElPiGraph в скрытых пространствах.

Разработанный метод основан на минимизации энергетического потенциала, состоящего из трех частей: среднеквадратической ошибки аппроксимации данных, суммы квадратов длин ребер и члена, минимизирующего отклонение основного вложения графа от гармоничности (обобщение линейности). Главные графы — это графы, встроенные в многомерное пространство и минимизирующие расстояние до точек данных, при этом максимизирующие некоторые регулярные свойства. Структура графа вычисляется путем оптимального применения последовательности преобразований графа с использованием операций из предопределенной грамматики графа. Простейшая грамматика графа «Разделить ребро пополам», «Добавить узел к узлу» приводит к построению главного дерева.


Все новости