Интересная работа по практическому определению сдвига концепций в моделях ML
технические проблемы и идеи, родившиеся в бурных водах реки Abava (а равно как и на ее берегах, далеких и близких), выставленные на всеобщее обсуждение
Saturday, July 26, 2025
О сдвиге концепций
На сегодняшний день самой большой проблемой в обнаружении вредоносных программ на основе машинного обучения является поддержание высоких показателей обнаружения в процессе эволюции образцов. Хотя в многочисленных работах были предложены детекторы дрейфа и конвейеры с поддержкой переобучения, работающие с разумной эффективностью, ни один из этих детекторов и конвейеров в настоящее время не поддается объяснению, что ограничивает наше понимание эволюции угроз и эффективности детектора. Несмотря на предыдущие работы, в которых была представлена таксономия событий дрейфа концепций, до этой работы не существовало практического решения для объяснимого обнаружения дрейфа в конвейерах вредоносных программ. Наша идея изменить этот сценарий заключается в разделении знаний классификатора на два: (1) знания о границе между вредоносным ПО (M) и полезным ПО (G); и (2) знания о концепции классов (M и G). Таким образом, мы можем понять, изменилась ли концепция или граница классификации, измеряя изменения в этих двух областях. Мы реализуем этот подход на практике, развернув конвейер с метаклассификаторами для измерения этих подклассов основного детектора вредоносных программ. Мы демонстрируем с помощью более 5 тысяч прогонов экспериментов жизнеспособность нашего решения, (1) иллюстрируя, как оно объясняет каждую точку дрейфа в наборах данных DREBIN
и AndroZoo, и (2) как детектор объяснимого дрейфа выполняет онлайн-переобучение для достижения более высоких скоростей и требует меньшего количества точек переобучения. - Towards Explainable Drift Detection and Early Retrain in ML-based Malware Detection Pipelines
Subscribe to:
Post Comments (Atom)
No comments:
Post a Comment