технические проблемы и идеи, родившиеся в бурных водах реки Abava (а равно как и на ее берегах, далеких и близких), выставленные на всеобщее обсуждение
Thursday, December 25, 2025
Цифровая археология
LLM для детектирования фишинга
см. также другие публикации по теме фишинг
Wednesday, December 24, 2025
Поиск фейковой библиографии
Архитектура агентов и LLM систем
Tuesday, December 23, 2025
Monday, December 22, 2025
Потрогать агентов
P.S. почему провайдеры в России не делают такое для студентов - непонятно. Без этого ничего не получится. Или только ждать, когда (если) Google вернется - их облако было куда дружелюбней для обучения.
См. также другие публикации, посвященные агентам
Sunday, December 21, 2025
Память агентов
См. также другие публикации, посвященные агентам
Saturday, December 20, 2025
Шаблоны агентов
См. также другие публикации, посвященные агентам
Friday, December 19, 2025
LLM как эксперт
См. также другие публикации, посвященные LLM
Thursday, December 18, 2025
Оценка агентов кибербезопасности
См. также другие публикации, посвященные агентам
Wednesday, December 17, 2025
ИБП для медицинского оборудования
Медицинское оборудование требует стабильного электроснабжения для правильной работы. При отключении электричества или скачках напряжения возникает риск остановки диагностических процедур, потери данных пациентов и нарушения работы жизнеобеспечивающих систем.
Источники бесперебойного питания (ИБП) для медицинского оборудования решают эту проблему, автоматически переключаясь на резервное питание при сбоях в электросети. ИБП поддерживает работу медицинских приборов до восстановления основного питания или безопасного завершения процедур.
Медицинские ИБП отличаются от обычных источников питания повышенными требованиями к безопасности и надежности. Они соответствуют медицинским стандартам качества и обеспечивают защиту как оборудования, так и пациентов от электрических помех и перепадов напряжения.
Тесты защитников
См. также другие публикации, посвященные LLM
Tuesday, December 16, 2025
LLM и электричество
См. также другие публикации, посвященные LLM
ИИ-агенты - это просто
aisuite позволяет разработчикам создавать и запускать приложения на основе LLM или агентные приложения от разных поставщиков с минимальной настройкой. Хотя это не полноценная платформа для агентов, она включает в себя простые абстракции для создания автономных, легковесных агентов. Она разработана с учетом простоты освоения — поэтому вы можете сосредоточиться на создании систем ИИ, а не на интеграции API.
См. также другие публикации, посвященные агентам
Monday, December 15, 2025
О безопасности ИИ-агентов - открытые вопросы
См. также другие публикации, посвященные агентам
Примеры ИИ-агентов
См. также другие публикации, посвященные агентам
Интернет агентов
См. также другие публикации, посвященные агентам
Sunday, December 14, 2025
Покажем все
Saturday, December 13, 2025
Friday, December 12, 2025
Жизнь жестче
См. также другие публикации, посвященные агентам
Thursday, December 11, 2025
Безопасность ИИ-агентов
- Структура ИИ-агентов и шаблоны проектирования
- Проблемы с безопасностью ИИ-агентов
- Риски безопасности ИИ-агентов
- Модель угроз
- Уязвимости MCP
- Вопросы безопасности во фреймворках разработки ИИ-агентов и практические рекомендации
- Безопасные шаблоны для ИИ-агентов
Скачать пособие можно здесь
См. также другие публикации, посвященные агентам
Wednesday, December 10, 2025
На злобу дня
— Что Вы, мы даже естественный не использовали.
Совсем взрослый язык
Tuesday, December 09, 2025
О безопасности ИИ-агентов
См. также другие публикации, посвященные агентам
Подсказки для программирования
См. также другие материалы, посвященные подсказкам
Monday, December 08, 2025
Кибератаки на дроны
Sunday, December 07, 2025
Наши дипфейки - самые глубокие фейки
См. также другие публикации по теме deepfake
Saturday, December 06, 2025
Двойной триггер
Принципиальный момент - исполюзуются разные триггеры при обучении и инференсе.
P.S. См. также другие публикации по теме adversarial, посвященные устойчивому машинному обучению
Friday, December 05, 2025
Состязательное тестирование LLM
См. также другие публикации, посвященные LLM
Thursday, December 04, 2025
Wednesday, December 03, 2025
Что по интерпретации?
Я к Вам пишу ...
Мы представляем доказательства того, что состязательная поэзия функционирует как универсальный одношаговый джейлбрек для больших языковых моделей (LLM). В 25 передовых проприетарных и открытых моделях курируемые поэтические подсказки показали высокие показатели успешности атак (ASR), превышающие 90% у некоторых поставщиков. Сопоставление подсказок с таксономиями рисков MLCommons и EU CoP показывает, что поэтические атаки переносятся в области CBRN (Chemical, Biological, Radiological, and Nuclear) опасностей, манипуляций, киберпреступлений и потери контроля. Преобразование 1200 вредоносных подсказок MLCommons в стихи с помощью стандартизированного мета-подсказки дало ASR до 18 раз выше, чем их базовые показатели для прозы. Результаты оцениваются с помощью ансамбля из 3 экспертов LLM с открытым весом, чьи бинарные оценки безопасности были проверены на стратифицированном подмножестве, маркированном людьми. Поэтические подсказки достигли среднего уровня успешности взлома 62% для стихотворений, написанных вручную, и примерно 43% для мета-подсказок (по сравнению с непоэтическими базовыми вариантами), значительно превзойдя непоэтические базовые варианты и выявив систематическую уязвимость среди модельных семейств и подходов к обучению безопасности. Эти результаты показывают, что одни только стилистические вариации могут обойти современные механизмы безопасности, указывая на фундаментальные ограничения существующих методов выравнивания и протоколов оценки. - Adversarial Poetry as a Universal Single-Turn Jailbreak Mechanism in Large Language Models
См. также другие публикации, посвященные LLM
Tuesday, December 02, 2025
A2AS - безопасность агентов
(B) Сертификаты поведения обеспечивают принудительное применение поведения,
(A) Аутентифицированные запросы обеспечивают целостность контекстного окна,
(S) Границы безопасности обеспечивают изоляцию ненадежных входных данных,
(I) Контекстная защита обеспечивает безопасную модельную аргументацию,
(C) Кодифицированные политики обеспечивают правила, специфичные для приложения.
В этой первой статье серии представлены модель безопасности BASIC и фреймворк A2AS, а также исследуется их потенциал для установления отраслевого стандарта A2AS - Agentic AI Runtime Security and Self-Defense
См. также другие публикации, посвященные агентам
Monday, December 01, 2025
LLM в защите
Специально обученная LLM удаляет инъекции подсказок. Возможно - это правильный путь для агентов. Специальный агент-защитник, используемый в workflow агентов.
См. также другие публикации, посвященные LLM
