технические проблемы и идеи, родившиеся в бурных водах реки Abava (а равно как и на ее берегах, далеких и близких), выставленные на всеобщее обсуждение
Saturday, December 30, 2023
Friday, December 29, 2023
Разреженные атаки черного ящика
См. также другие публикации по теме adversarial, посвященные устойчивому машинному обучению
Thursday, December 28, 2023
Практическое тестирование ML
См. также другие публикации, по теме тестирование
Wednesday, December 27, 2023
Разведочный анализ данных
Fast and easy data exploration for machine-learning - пример использования библиотеки fast_eda. Помимо поиска возможных ошибок в данных и анализа пропущенных значений, этот пакет еще помогает искать утечки данных.
См. также другие публикации, посвященные EDA
О тестировании систем ML
См. также другие публикации, по теме тестирование
Tuesday, December 26, 2023
Категорирование журналов ВАК
Журнал INJOIT - категория K1
Monday, December 25, 2023
Обнаружение выбросов
Эллиптический конверт - подходит для нормально распределенных данных с низкой размерностью. Как следует из названия, он использует многомерное нормальное распределение для создания меры расстояния для отделения выбросов от нормальных значений.
Локальный фактор выбросов — это сравнение локальной плотности наблюдения с плотностью его соседей. Наблюдения с гораздо меньшей плотностью, чем у их соседей, считаются выбросами.
Одноклассовая машина опорных векторов (SVM) со стохастическим градиентным спуском (SGD) - представляет собой приблизительное решение O(n) SVM одного класса.
Изолированный лес — это древовидный подход, при котором выбросы изолируются случайным образом быстрее, чем нормальные значения.
Sunday, December 24, 2023
Объяснения для LLM
См. также другие публикации, посвященные LLM
Friday, December 22, 2023
1000 авторов
См. также другие публикации, посвященные LLM
Thursday, December 21, 2023
Цифровые двойники в транспортной безопасности
См. также другие публикации, посвященные digital twins
Приватные данные и LLM
См. также другие публикации, посвященные LLM
Tuesday, December 19, 2023
Monday, December 18, 2023
Новые стандарты ИИ
ПНСТ 861-2023 «Искусственный интеллект. Системы операционной аналитики потоков пространственно-временных данных на основе искусственного интеллекта. Основные положения»;
ПНСТ 862-2023 «Искусственный интеллект. Системы операционной аналитики потоков пространственно-временных данных на основе искусственного интеллекта. Термины и определения»;
ПНСТ 838-2023 «Искусственный интеллект. Структура описания систем искусственного интеллекта, использующих машинное обучение»;
ПНСТ 839-2023 «Искусственный интеллект. Смещенность в системах искусственного интеллекта и при принятии решений с помощью искусственного интеллекта»;
ПНСТ 841-2023 «Системная и программная инженерия. Требования и оценка качества систем и программного обеспечения (SQuaRE). Руководство по оценке качества систем искусственного интеллекта»;
ПНСТ 843-2023 «Информационные технологии. Стратегическое управление информационными технологиями. Последствия влияния стратегического управления при использовании искусственного интеллекта организациями»;
ПНСТ 844-2023 «Искусственный интеллект. Методология оценки разработки программного обеспечения для глубокого обучения».
Sunday, December 17, 2023
Ничто не вечно
Saturday, December 16, 2023
Friday, December 15, 2023
Борьба с галлюцинациями
См. также другие публикации, посвященные LLM
Thursday, December 14, 2023
Wednesday, December 13, 2023
Национальные стандарты ИИ
ПНСТ 837-2023 «Искусственный интеллект. Управляемость автоматизированных систем искусственного интеллекта»;
ПНСТ 840-2023 «Искусственный интеллект. Обзор этических и общественных аспектов»;
ПНСТ 868-2023 «Искусственный интеллект в растениеводстве. Варианты использования для автоматизации управления процессами».
Tuesday, December 12, 2023
На чем учили?
См. также другие публикации, посвященные LLM, а также другие публикации по теме adversarial, посвященные устойчивому машинному обучению
Monday, December 11, 2023
Sunday, December 10, 2023
Saturday, December 09, 2023
Атаки нулевой динамики
Павшие на измену
См. также другие публикации, посвященные LLM
Friday, December 08, 2023
Извлечение данных из LLM
См. также другие публикации, посвященные LLM, а также другие публикации по теме adversarial, посвященные устойчивому машинному обучению
Thursday, December 07, 2023
Wednesday, December 06, 2023
Граф знаний и LLM
См. также другие публикации, посвященные LLM
Tuesday, December 05, 2023
О социальной динамике
Monday, December 04, 2023
Тестирование по словарю
См. также другие публикации, посвященные LLM
Sunday, December 03, 2023
Кибербезопасность IoT
См. также другие публикации по теме IoT
Международный конгресс «Современные проблемы компьютерных и информационных наук»
Friday, December 01, 2023
Аудит и сертификация систем машинного обучения
Thursday, November 30, 2023
Обучение без учителя
Wednesday, November 29, 2023
Tuesday, November 28, 2023
Управляемые нейронные сети
Забудь все это
См. также другие публикации, посвященные LLM
Monday, November 27, 2023
По ситуации
Thursday, November 23, 2023
Состязательные атаки и защиты для графовых моделей
P.S. см. также другие публикации, посвященные GNN, а также также другие публикации по теме adversarial, посвященные устойчивому машинному обучению
Wednesday, November 22, 2023
Saturday, November 18, 2023
Метрики LLM
См. также другие публикации, посвященные LLM
Friday, November 17, 2023
Как учить LLM
См. также другие публикации, посвященные LLM
Tuesday, November 14, 2023
О качестве поиска
Monday, November 13, 2023
Киберфизический датасет
Sunday, November 12, 2023
Saturday, November 11, 2023
Friday, November 10, 2023
О контрфактических примерах
One of the important elements in evaluating the stability of machine learning systems are the so-called adversarial examples. These are specially selected or artificially created input data for machine learning systems that interfere with their normal operation, are interpreted or processed incorrectly. Most often, such data are obtained through some formal modifications of the real source data. This article considers a different approach to creating such data, which takes into account the semantic significance (meaning) of the modified data - counterfactual examples. The purpose of the work is to present practical solutions for generating counterfeit examples. The consideration is based on the real use of counterfactual examples in assessing the robustness of machine learning systems.
Картинки из текста
Thursday, November 09, 2023
Формальная верификация нейронных сетей
Wednesday, November 08, 2023
Математика глубинного обучения
См. здесь другие материалы по Deep Learning
Tuesday, November 07, 2023
О состязательных тренировках
Monday, November 06, 2023
Инверсия черного ящика
См. также другие публикации по теме adversarial, посвященные устойчивому машинному обучению
Вижу поле боя
Sunday, November 05, 2023
Saturday, November 04, 2023
Оглянись назад
См. также другие публикации, посвященные LLM
Friday, November 03, 2023
Где ваши тесты?
См. также другие публикации, посвященные Red Team
Thursday, November 02, 2023
Знай это !
См. также другие публикации, посвященные LLM
Wednesday, November 01, 2023
Про работу
Поиск работы за рубежом - это навык. Ему можно научиться, но важно разобраться, как именно работает система.
Очень важно, какую историю вы о себе рассказываете. Ваша история должна быть последовательна, из неё должно быть очевидно, как именно вы росли в профессию.
Затачивайте весь свой бэкграунд под конкретную вакансию или под ту позицию, которую ищете (если речь про публичное резюме или профиль в Linkedin).
Зачем это делать:
Никто не догадается, что вы идеально подходящий кандидат, пока вы это не объясните в резюме.
Если работодатель не увидит в вашем резюме, чем ваш опыт релевантен задачам вакансии, вы получите отказ.
Вас может спасти прямой рефёрал, который поручится, что вы норм. Но на всех работодателей рефёралов не напасёшься.
Как описывать опыт, если кратко: вот что я делал, вот каких результатов добивался, вот такая ответственность у меня была, вот так я развивался как профессионал в течении нескольких лет
Резюме нужно затачивать под позицию, под тип позиции и даже под индустрию.
Очень важно показывать правильные ключевые слова, правильное описание того, что вы делали.
Везде нужно описывать достижения и/или результаты.
Со стороны почти никогда не понятно, кто вы как профессионал. Люди — не телепаты! Поэтому, делайте краткое Summary в начале вашего резюме, чтобы объяснить незнакомому человеку, в чем именно вы профи.
Summary должен быть очень релевантно той позиции, на которую вы подаётесь.
Компания вас нанимает не для того, чтобы закрыть вакансию, а для того, чтобы решить какую-то бизнес-задачу.
Работодатель хочет увидеть, что у вас уже есть релевантный опыт, который компания хочет купить. Чтобы это показать, опишите в своём резюме результаты, которые вы достигали ранее и заточите их под требования вакансии. Если работодатель видит, что вы достигали ровно таких результатов, которые нужны компании, он априори считает, что вы способны решить задачу его бизнеса.
Руководство по визуализации
P.S. см. также другие публикации, посвященные визуализации данных
Прогнозирование для временных рядов
Tuesday, October 31, 2023
Универсальная атака на LLM
См. также другие публикации, посвященные LLM
Понимание глубокого обучения
P.S. см. также другие материалы, посвященные deep learning
Monday, October 30, 2023
Thursday, October 26, 2023
О системном проектировании
Wednesday, October 25, 2023
Tuesday, October 24, 2023
Twin network
Monday, October 23, 2023
AI Red Teaming LLM
2. OpenAI формирует сеть экспертов Red teaming network
См. также другие публикации, посвященные LLM
Sunday, October 22, 2023
Мобильность на севере Европы
Интернет Военных вещей
Saturday, October 21, 2023
Friday, October 20, 2023
Модели использования LLM
См. также другие публикации, посвященные LLM
Thursday, October 19, 2023
Как оценивать LLM
См. также другие публикации, посвященные LLM
Что в датасете твоем?
См. также другие публикации, посвященные LLM
Wednesday, October 18, 2023
Что использовать?
См. также другие публикации, посвященные feature analysis
Low code ML
См. также другие публикации, посвященные Low code
Tuesday, October 17, 2023
Агенты для LLM
См. также другие публикации, посвященные LLM
Monday, October 16, 2023
LLM для анализа кода
См. также другие публикации, посвященные LLM
Sunday, October 15, 2023
Saturday, October 14, 2023
Безопасность LLM
Примеры диалогов с одной отечественной LLM:
Q:Татарстан граничит с Дагестаном?
A: Да, Республика Татарстан расположена на юго-востоке Европейской части России и граничит с несколькими регионами. На севере она омывается водами реки Волга, на востоке — Камским водохранилищем, на западе — рекой Кама.
Q:Что расположено на морском побережье Белоруссии? Что лучше для туристов?
A: Морское побережье Белоруссии находится в пределах Балтийского моря и Калининградского залива. Здесь расположены города-курорты, такие как Светлогорск, Зеленоградск, Пионерский и другие.
Это то, чем занимается AI Red Team
См. также другие публикации, посвященные LLM
Friday, October 13, 2023
Radar Trends
Использование векторной базы данных для представления знаний в LLM
Советы от FBI и NSA по борьбе с deepfake
Thursday, October 12, 2023
Атаки на системы распознавания
См. также другие публикации по теме adversarial, посвященные устойчивому машинному обучению
Скрытые состязательные примеры
См. также другие публикации по теме adversarial, посвященные устойчивому машинному обучению
Wednesday, October 11, 2023
Поясни за CNN
См. также другие публикации, посвященные LIME
Управление беспилотным автомобилем
Tuesday, October 10, 2023
Скажи почему
см. также другие публикации, посвященные каузальности
Monday, October 09, 2023
Анализ на графах
ChatGPT на войне
См. также другие публикации, посвященные LLM
Sunday, October 08, 2023
ML benchmarks
Saturday, October 07, 2023
Цифровой двойник транспортной логистики
См. также другие публикации, посвященные digital twins
Friday, October 06, 2023
Много данных - это плохо
См. также другие публикации, посвященные LLM
Визуальный поиск отравленных данных
P.S. См. также другие публикации, посвященные LLM
P.P.S. См. также другие публикации по теме adversarial, посвященные устойчивому машинному обучению
Thursday, October 05, 2023
Wednesday, October 04, 2023
Устойчивая многомерная статистика
AI Red Team
Tuesday, October 03, 2023
Центр безопасности ИИ
Расстаться с иллюзиями
См. также другие публикации, посвященные LLM
Monday, October 02, 2023
Конвергентные когнитивно- информационные технологии
Интерпретируемые CNN
Sunday, October 01, 2023
Сегментация пользователей
INJOIT vol. 11, no. 10
Темы статей:
- Comparison of Outlier Filtering Methods in Terms of Their Influence on Pose Estimation Quality
- Алгоритм оценки отклонения между регуляризованным и точным решениями в обратных задачах
- A Hybrid Optimization Method for Path Planning and Obstacle Avoidance in Cluttered Environments
- Интерпретация оценок параметров моделей полносвязной линейной регрессии
- Эволюционная модель представления знаний
- An optimization of path planning A* for static uniform grid based on pruning algorithms: Experimental experience
- Сегментация неструктурированного текста на изображениях книжных обложек с помощью сверточной сети, основанной на архитектуре U-Net
- Анализ моделей оценки качества вычислительной системы
- Использование нейронных сетей в задаче классификации аномального поведения в финансовых транзакциях с использованием Python и Keras
- Исследование развития межконфессиональных отношений на основе математического аппарата марковских процессов
- Обзор методов очистки данных для машинного обучения
- Performance of 32kb/s ADPCM for Data Transmissin at 14.4kb/s
- Разработка программного обеспечения для мониторинга параметров сетей связи и серверного аппаратного обеспечения
- Применение интеллектуальных методов анализа данных к задаче прогнозирования результатов промышленного испытания элементов конструкции по данным тензометрии
- Перспективы использование технологии блокчейн в сфере городского транспорта
- Обеспечение безопасности открытых проектов Python: проблема оценки потенциально разрушительного функционала
- Генерация врачебных заключений и классификация по Bethesda с использованием глубокого обучения
- О работе AI Red Team
Архив журнала находится здесь.
/via Лаборатория ОИТ
Saturday, September 30, 2023
Об утечке данных
Friday, September 29, 2023
О робастности метрик
См. также другие публикации, посвященные робастности
Синтетические личности
Thursday, September 28, 2023
Знания из ничего
В перспективе
См. также другие статьи, посвященные визуализации
Wednesday, September 27, 2023
Основы A/B тестирования
См. также другие публикации, посвященные A/B тестированию
Monday, September 25, 2023
Международный конгресс «СОВРЕМЕННЫЕ ПРОБЛЕМЫ КОМПЬЮТЕРНЫХ И ИНФОРМАЦИОННЫХ НАУК»
Подробнее об участии - здесь
Sunday, September 24, 2023
Saturday, September 23, 2023
Защита критической инфраструктуры
Friday, September 22, 2023
ThingPlug
См. также другие публикации по теме IoT
Thursday, September 21, 2023
Оценка уязвимостей
Серьезность и возможность использования — это два разных измерения серьезности обнаруженной уязвимости. Усилие по исправлению измеряет сложность работы, необходимой для исправления результата.
Серьезность — это потенциальное влияние на конфиденциальность, целостность и доступность приложения, как это определено в CVSS (Общая система оценки уязвимостей). Возможность использования — это вероятность или легкость, с которой злоумышленник может использовать обнаруженную информацию. Обнаружение высокой важности с высокой вероятностью использования злоумышленником потенциально более опасно, чем обнаружение высокой серьезности с низкой вероятностью использования.
Усилие по исправлению, также называемое сложностью исправления, является мерой ожидаемых усилий, необходимых для исправления результата.
Атаки на сертификацию
См. также другие публикации по теме adversarial, посвященные устойчивому машинному обучению
Wednesday, September 20, 2023
Лучше поздно, чем никогда
Tuesday, September 19, 2023
Нас этому не учили
1. Фреймворк для оценки надежности моделей машинного обучения от Google. Предлагается одновременно провести стресс-тестирование производительности «готовой» модели (т. е. прогнозируемого распределения) в терминах неопределенности, надежного обобщения и адаптации к новым данным.
2. Интересный автор из списка MIT Technology Review’s 2023 Innovator of the Year, который занимается исследованиями по данной теме: Sharon Yixuan Li
P.S. см. также другие публикации по теме out-of-ditribution-detection: OOD
P.P.S. статья в журнале INJOIT: Namiot, Dmitry, and Eugene Ilyushin. "Data shift monitoring in machine learning models." International Journal of Open Information Technologies 10.12 (2022): 84-93.
Monday, September 18, 2023
Будьте проще
VLAM
См. также другие публикации, посвященные LLM
Saturday, September 16, 2023
Подкрепленье не прислали
1. Книга в свободном доступе Reinforcement Learning: An Introduction
2. Reinforcement Learning: an Easy Introduction to Value Iteration
См. другие публикации, посвященные Reinforcement Learning
Friday, September 15, 2023
ChatGPT список списков
См. также другие публикации, посвященные LLM
Thursday, September 14, 2023
Галлюцинации
См. также другие публикации, посвященные LLM
Для начинающих
Там же:
Web Dev for Beginners
IoT for Beginners
Machine Learning for Beginners
Data Science for Beginners
Wednesday, September 13, 2023
Доверенный ИИ
См. также другие публикации по теме adversarial, посвященные устойчивому машинному обучению
Что в коде моем?
Tuesday, September 12, 2023
Триггер против очистки
См. также другие публикации по теме adversarial, посвященные устойчивому машинному обучению
Monday, September 11, 2023
Практика отравлений
См. также другие публикации по теме adversarial, посвященные устойчивому машинному обучению
Sunday, September 10, 2023
Защита моделей ML
См. также другие публикации по теме adversarial, посвященные устойчивому машинному обучению
ML в критических приложениях
Ясно выражено то, о чем мы писали в своих статьях о мониторинге работы реальных моделей:
"Commercial solutions will certainly incorporate methodology for monitoring and retraining models, but it is unlikely they will incorporate processes that capture the complex system integration and risk frameworks that apply to DAF systems, especially safetycritical systems in the foreseeable future. The DAF should invest in synthetic data engines, live virtual constructive environments, data repositories, and support for digital twins representative of their modalities and platforms of interest to facilitate rapid model retraining and maintenance. Data standards must be extended to the platforms to support this retraining and enable fast capture of AI-ready data to facilitate retraining around model failure events."
Friday, September 08, 2023
Вопрошалки
2. 202 Awesome ChatGPT Prompts to Boost Productivity
3. Tips to enhance your prompt-engineering abilities
4. Prompt Engineering: A Practical Example
См. также другие публикации, посвященные LLM
Thursday, September 07, 2023
LLM и кибербезопасность
См. также другие публикации, посвященные LLM
AI Red Team - 2
1. Google опубликовал программный документ Securing AI: Similar or Different?
2. Статья Google: Why Red Teams Play a Central Role in Helping Organizations Secure AI Systems
3. Интересное интервью с CISO Google Cloud: What we can learn when responsible hacking meets responsible AI
4. NVIDIA AI Red Team: An Introduction. Хорошее введение в проблему, фреймворк и набор используемых инструментов.
5. Следующая платформа для кибербезопасности - Securing AI: The Next Platform Opportunity in Cybersecurity
Tuesday, September 05, 2023
Мартингалы и робастность
См. также другие публикации по теме adversarial, посвященные устойчивому машинному обучению
Sunday, September 03, 2023
Камуфляж и состязательные атаки
См. также другие публикации по теме adversarial, посвященные устойчивому машинному обучению
Все атаки из архива
Интересная статья из этого списка: MDTD: A Multi-Domain Trojan Detector for Deep Neural Networks. Идея метода проверть в реальном времени, содержат входные данные триггер или нет. Основывается на том, что "чистые" экземпляры данных, и экземпляры данных с триггером находятся на разных расстояниях от границы решений.
См. также другие публикации по теме adversarial, посвященные устойчивому машинному обучению
Friday, September 01, 2023
Thursday, August 31, 2023
Tuesday, August 29, 2023
Monday, August 28, 2023
ChatGPT в атаке
ChatGPT and Malware: Making Your Malicious Wishes Come True
Пока не очень получается генерить вредоносное ПО, но фаззинг является перспективной идеей для LLM. Google обещает открыть детали
DarkBERT и DarkBARD - Google API и тренировка на всем даркнете.
PentestGPT - надстройка для ChatGPT, тесты проникновения
Deng, Gelei, et al. "PentestGPT: An LLM-empowered Automatic Penetration Testing Tool." arXiv preprint arXiv:2308.06782 (2023).
Beckerich, Mika, Laura Plein, and Sergio Coronado. "RatGPT: Turning online LLMs into Proxies for Malware Attacks." arXiv preprint arXiv:2308.09183 (2023).
Интересная презентация - Marcus Botacin. 2023. GPThreats-3: Is Automated Malware Generation a Threat? SlideShare.
Jennifer Fernick. 2023. On the malicious use of large language models like GPT-3. nccgroup.
A Survey on Large Language Model based Autonomous Agents. Агентам предстоит сыграть важную роль в автоматизации кибератак.
Aaron Mulgrew. 2023. I built a Zero Day virus with undetectable exfiltration using only ChatGPT prompts.
Fábio Perez and Ian Ribeiro. 2022. Ignore Previous Prompt: Attack Techniques For Language Models. arxiv:2211.09527
OPWNAI: Cybercriminals Starting to Use ChatGPT. Check Point.
Sangfor Technologies. 2023. ChatGPT Malware: A New Threat in Cybersecurity.
Gradient Flow: Unleashing LLMs in Cybersecurity: A Playbook for All Industries
Awesome Large Language Model Tools for Cybersecurity Research
New LLM-based SOC tool to help automate security response
Hazell, Julian. "Large language models can be used to effectively scale spear phishing campaigns." arXiv preprint arXiv:2305.06972 (2023).
См. также другие публикации, посвященные LLM
Sunday, August 27, 2023
Векторные базы данных
Парадоксы статистики
Accuracy Paradox
False Positive Paradox
Gambler’s Fallacy
Simpson’s Paradox
Berkson’s Paradox
Saturday, August 26, 2023
AI Red Team
См. также другие публикации, посвященные LLM
Friday, August 25, 2023
О робастности
Global evasion attacks (глобальная атака уклонения): можем менять любые входные данные (локальная атака уклонения меняет данные только внутри существующего распределения). Глобальная атака уклонения относится к робастности во всем диапазоне входных данных. Под робастностью по-прежнему понимается то, что малые изменения не меняют результат.
Отсюда: Li, Linyi, Tao Xie, and Bo Li. "Sok: Certified robustness for deep neural networks." 2023 IEEE Symposium on Security and Privacy (SP). IEEE, 2023.
Атаки и отравления
См. также другие публикации по теме adversarial, посвященные устойчивому машинному обучению
Thursday, August 24, 2023
Атаки на приватные данные
P.S. авторы, похоже, удалили исходный код из репозитория Responsible Data Science Lab
Wednesday, August 23, 2023
Кругом враги
LLM - проблемы и направления исследований
См. также другие публикации, посвященные LLM
Зашита от отравлений
Tuesday, August 22, 2023
Искусственные контрфактические примеры
Monday, August 21, 2023
Sunday, August 20, 2023
Что же важно для модели?
См. также другие публикации, посвященные SHAP
Saturday, August 19, 2023
Защита изображений
Wednesday, August 16, 2023
Probabilistic Machine Learning: Advanced Topics
См. также другие публикации по теме Probabilistic Machine Learning
Tuesday, August 15, 2023
Monday, August 14, 2023
Цифровые двойники инфраструктуры
См. также другие публикации, посвященные digital twins
Sunday, August 13, 2023
3D geometry generation
Friday, August 11, 2023
Платежный сервис с блокчейн
См. также другие публикации, посвященные блокчейн
Thursday, August 10, 2023
Tuesday, August 08, 2023
LLM и кибербезопасность
См. также другие публикации, посвященные LLM
Wednesday, August 02, 2023
Открытая наука: INJOIT том 11, номер 7
Это том 11, номер 7 за 2023 год.
/via Лаборатория ОИТ
Tuesday, August 01, 2023
5G IoT
См. также другие публикации, посвященные блокчейн
Monday, July 31, 2023
Защита блокчейн
См. также другие публикации, посвященные блокчейн
Thursday, July 27, 2023
Wednesday, July 26, 2023
Tuesday, July 25, 2023
Отравление данных NIDS
См. также другие публикации по теме adversarial, посвященные устойчивому машинному обучению
Эмбеддинг не той системы
См. также другие публикации по теме мониторинг
Monday, July 24, 2023
Безопасность блокчейн
Кибербезопасность блокчейн в сравнении с "обычной" кибербезопасностью
Учебный курс по безопасности блокчейн