Состязательные примеры привлекли значительное внимание в машинном обучении, но причины их существования и распространенности остаются неясными. Мы демонстрируем, что состязательные примеры могут быть напрямую отнесены к наличию ненадежных признаков: признаков (выведенных из закономерностей в распределении данных), которые являются высокопредсказательными, но хрупкими и (следовательно) непонятными для людей. После фиксации этих признаков в теоретической структуре мы устанавливаем их широкое распространение в стандартных наборах данных. Наконец, мы представляем простую настройку, в которой мы можем строго связать явления, которые мы наблюдаем на практике, с несоответствием между (определенным человеком) понятием надежности и внутренней геометрией данных. -
Adversarial Examples Are Not Bugs, They Are Features
Хорошее статистическое объяснение природы состязательных ошибок
P.S. См. также другие публикации по теме adversarial, посвященные устойчивому машинному обучению
No comments:
Post a Comment