ЛАФ - Евгений Ильюшин. Безопасный искусственный интеллект. От теории к практике

Евгений Ильюшин. Безопасный искусственный интеллект. От теории к практике

Событие: WAW2025

Евгений Ильюшин представляет выступление на конференции "Безопасный искусственный интеллект. От теории к практике", которое освещает актуальность безопасного применения систем искусственного интеллекта. Выступление начинается с рассмотрения проблем, связанных с уязвимостями ИИ, и акцентировано на реальных примерах, как эти недостатки могут негативно сказаться на разных сферах, от финансов до автономного транспорта. Евгений поясняет, как небольшие изменения в транзакциях или данных могут незаметно обмануть детекционные системы, что ведет к мультипликативным последствиям, влияющим на критические инфраструктуры.

Выступление освещает таксономию атак на ИИ, включая атаки уклонения, отравления, инверсии моделей, извлечения данных и перепрограммирования. Например, обсуждается атака на систему компьютерного зрения автономного транспорта, где небольшой визуальный шум способен ввести машину в заблуждение. Евгений объясняет, что ковариантный сдвиг, сдвиг в метках и дрейф концепций представляют собой ключевые проблемы, подчеркивая необходимость регулярного дообучения моделей для их адаптивности к изменяющимся условиям.

Евгений подчеркивает значимость построения моделей угроз и нарушителей для оценки рисков и устранения угроз безопасности. Он делится подходами к оценке качества моделей ИИ и подчеркивает необходимость учета устойчивости к выходу из распределения и возможности устойчивой работы модели в непредвиденных условиях. Важность формальной верификации подчеркивается как средство для обеспечения корректности работы моделей на заданных распределениях.

Выступление также обращает внимание на потенциал использования сложных целевых атак с использованием ИИ для достижения злонамеренных целей. Евгений предлагает подходы к созданию безопасных и надежных ИИ-систем, предупреждая о необходимости тщательного мониторинга и регулярного дообучения моделей для предотвращения фатальных ошибок.

Объясняя концепцию безопасного ИИ, Евгений призывает к созданию надежных инструментов и технологий, которые помогут в оценке рисков, а также к разработке политики и подходов, обеспечивающих защиту информации и данных. Прикладные решения должны быть оснащены эффективными средствами защиты от возможных угроз. Евгений завершает выступление акцентом на значении укрепления кадрового потенциала в области безопасности ИИ и подчеркивает важность тесного сотрудничества международных организаций для решения глобальных вызовов безопасности искусственного интеллекта.