Monday, September 22, 2025

Бэкдоры для роботов

Политики роботизированной манипуляции всё больше расширяются за счёт больших языковых моделей (LLM) и моделей визуального языка (VLM), которые используют их возможности понимания и восприятия. В последнее время безопасность задач роботизированной манипуляции широко изучается, при этом атаки с использованием бэкдоров привлекают значительное внимание из-за их скрытности и потенциального вреда. Однако существующие попытки внедрения бэкдоров ограничиваются симуляторами и сталкиваются с трудностями при попытке отравить сторонние коммерческие реализации на основе VLM в реальных роботизированных манипуляциях. Для решения этой проблемы мы предлагаем TrojanRobot, встраивающий модуль бэкдора в модульную политику роботизированной манипуляции посредством бэкдор-связей для манипулирования путем LLM-VLM и компрометации системы, при этом наша ванильная версия использует в качестве модуля тонко настроенный бэкдор VLM. Для повышения эффективности атак мы также предлагаем базовую схему, введя концепцию LVLM-как-бэкдора, которая использует контекстное обучение инструкциям (ICIL) для управления поведением большой модели зрительного восприятия. Более того, мы разрабатываем три типа базовых атак — перестановку, стагнацию и преднамеренную — достигая гибких эффектов атак бэкдора. Обширные эксперименты в физическом мире и симуляторах на 18 задачах манипуляции реальным миром и 4 VLM подтверждают превосходство предлагаемого TrojanRobot, с видеодемонстрациями, доступными на веб-сайте ссылка https://trojanrobot.github.io. - TrojanRobot: Physical-world Backdoor Attacks Against VLM-based Robotic Manipulation

No comments: