Интересная но спорная
идея. Авторы хотят определеять отравлена модель или нет, атаковав ее в режиме черного ящика. Предполагается, что отравленные модели более чувствительны к атакам.
См. также другие публикации по теме adversarial, посвященные устойчивому машинному обучению
No comments:
Post a Comment