Friday, December 29, 2023

Разреженные атаки черного ящика

Атаки черного ящика на модели машинного обучения обычно ассоциируются с множеством запросов, которые необходимо отправлять атакующему. Это не всегда возможно и, уж точно, совсем не практично. В данной статье рассматриваются так называемые разреженные атаки, которые ограничивают количество запросов.

См. также другие публикации по теме adversarial, посвященные устойчивому машинному обучению

Wednesday, December 27, 2023

Разведочный анализ данных

Advanced exploratory data analysis (EDA) - хорошо написанная статья и Jupyter Notebook

Fast and easy data exploration for machine-learning - пример использования библиотеки fast_eda. Помимо поиска возможных ошибок в данных и анализа пропущенных значений, этот пакет еще помогает искать утечки данных.

См. также другие публикации, посвященные EDA

О тестировании систем ML

Серия публикаций, посвященных тестированию ML

См. также другие публикации, по теме тестирование

Tuesday, December 26, 2023

Категорирование журналов ВАК

Появился новый список категорий журналов ВАК. Утвержденные категории действуют три года, начиная с с 1 января 2024 года.

Журнал INJOIT - категория K1

Monday, December 25, 2023

Обнаружение выбросов

Обнаружение выбросов — это задача машинного обучения без учителя, направленная на выявление аномалий (необычных наблюдений) в заданном наборе данных. Рассмотрены следующие алгоритмы:

Эллиптический конверт - подходит для нормально распределенных данных с низкой размерностью. Как следует из названия, он использует многомерное нормальное распределение для создания меры расстояния для отделения выбросов от нормальных значений.

Локальный фактор выбросов — это сравнение локальной плотности наблюдения с плотностью его соседей. Наблюдения с гораздо меньшей плотностью, чем у их соседей, считаются выбросами.

Одноклассовая машина опорных векторов (SVM) со стохастическим градиентным спуском (SGD) - представляет собой приблизительное решение O(n) SVM одного класса.

Изолированный лес — это древовидный подход, при котором выбросы изолируются случайным образом быстрее, чем нормальные значения.

Sunday, December 24, 2023

Friday, December 22, 2023

1000 авторов

Что вы не знали о соавторах - статья Google о Gemini. Одна тысяча авторов. Кстати, это еще и оценка стоимости создания таких систем - все эти люди на зарплате.

См. также другие публикации, посвященные LLM

Monday, December 18, 2023

Утечка данных в ML

Интересная работа по статическому анализу кода Python на предмет возможной учетки данных.

Новые стандарты ИИ

ПНСТ 870-2023 «Искусственный интеллект в переработке сельскохозяйственной продукции и производстве пищевой продукции. Варианты использования для автоматизации управления процессами»;
ПНСТ 861-2023 «Искусственный интеллект. Системы операционной аналитики потоков пространственно-временных данных на основе искусственного интеллекта. Основные положения»;
ПНСТ 862-2023 «Искусственный интеллект. Системы операционной аналитики потоков пространственно-временных данных на основе искусственного интеллекта. Термины и определения»;
ПНСТ 838-2023 «Искусственный интеллект. Структура описания систем искусственного интеллекта, использующих машинное обучение»;
ПНСТ 839-2023 «Искусственный интеллект. Смещенность в системах искусственного интеллекта и при принятии решений с помощью искусственного интеллекта»;
ПНСТ 841-2023 «Системная и программная инженерия. Требования и оценка качества систем и программного обеспечения (SQuaRE). Руководство по оценке качества систем искусственного интеллекта»;
ПНСТ 843-2023 «Информационные технологии. Стратегическое управление информационными технологиями. Последствия влияния стратегического управления при использовании искусственного интеллекта организациями»;
ПНСТ 844-2023 «Искусственный интеллект. Методология оценки разработки программного обеспечения для глубокого обучения».

Saturday, December 09, 2023

Атаки нулевой динамики

Кибербезопасность киберфизических систем: Zero-Dynamics Attack на ветровые турбины

Павшие на измену

Отравленные отклики в Reinforcement Learning для обучения LLM. Магическим образом они изменяют поведение LLM :)

См. также другие публикации, посвященные LLM

Friday, December 08, 2023

Wednesday, December 06, 2023

Хмм ...

Простая иллюстрация работы HMM (Hidden Markov Model). Код на Python.

Граф знаний и LLM

Перекачивание графа знаний в LLM. Neo4J позиционирует себя как основной продукт для knowledge graph. См. также следующую публикацию

См. также другие публикации, посвященные LLM

Tuesday, December 05, 2023

Кругом вода

О кибербезопасности систем водоснабжения

О социальной динамике

Когда-то с подобных работ начинались проекты по краудсенсингу. В социальной динамике исследовались перемещения людей на основе треков их мобильных устройств (оригинально - в MIT). Вот современное состояние - анализ сегрегации жителей города

Friday, December 01, 2023

Аудит и сертификация систем машинного обучения

Презентация, посвященная аудиту систем машинного обучения. Аудит должен быть обязательной процедурой для промышленных систем ИИ.