Это том 14, номер 1 за 2026 год. Новое пополнение для списка работ по теме Искусственный интеллект в кибербезопасности
/via Лаборатория ОИТ
технические проблемы и идеи, родившиеся в бурных водах реки Abava (а равно как и на ее берегах, далеких и близких), выставленные на всеобщее обсуждение
Это том 14, номер 1 за 2026 год. Новое пополнение для списка работ по теме Искусственный интеллект в кибербезопасности
/via Лаборатория ОИТ
Среди авторов - Nicholas Carlini
См. также другие публикации, посвященные LLM
См. также другие публикации посвещенные графам
См. также другие публикации, посвященные LLM
Интересная идея - проверять нужно не отдельные фразы, а диалог
См. также другие публикации, посвященные LLM
См. также другие публикации, посвященные агентам
См. также другие публикации, посвященные агентам
См. также другие публикации, посвященные агентам
См. также другие публикации, посвященные LLM
См. также другие публикации по теме физические атаки
См. также другие публикации, посвященные MCP
См. также другие публикации по теме RAG
См. в этой связи подход A2AS
См. также другие публикации, посвященные LLM
См. также другие публикации, посвященные агентам
См. также другие публикации, посвященные LLM
См. также другие публикации, посвященные LLM
См. также другие публикации, посвященные LLM
Архив журнала находится здесь.
/via Лаборатория ОИТ
Статья интересна еще и своим обзором ИИ-агентов для пентестинга.
См. также другие публикации, посвященные агентам
См. также другие публикации, посвященные агентам
Эти результаты показывают, что однократные оценки безопасности недостаточны для надежной оценки безопасности, и что протоколы оценки должны учитывать стохастические вариации в поведении модели. Мы показываем, что однократная оценка согласуется с многовыборочными эталонными данными только в 92,4% случаев при объединении данных по разным температурам (94,2–97,7% при фиксированной температуре в зависимости от настроек), и рекомендуем использовать не менее 3 выборок на каждый запрос для надежной оценки безопасности. - The Instability of Safety: How Random Seeds and Temperature Expose Inconsistent LLM Refusal Behavior
См. также другие публикации, посвященные LLM
См. также другие публикации, посвященные LLM
См. также другие публикации, посвященные LLM
См. также другие публикации, посвященные LLM
См. также другие публикации, посвященные агентам
См. также другие публикации, посвященные агентам
С целью повышения устойчивости критически важной инфраструктуры страны к сбоям GPS президент США в феврале 2020 года издал Исполнительный указ (EO) 13905 «Укрепление национальной устойчивости через ответственное использование служб позиционирования, навигации и тайминга». В соответствии с этим указом, Министерство транспорта США (USDOT) реализовало пилотную программу по разработке критически важных инфраструктурных профилей для транспортного сектора. Основное внимание департамента обращено на возможное глушение и подделку GPS. Основной инструмент борьбы - внедрение CRPA антенн.
vectorshift.ai - low-code инструмент для ИИ-агентов
Chroma - векторная база данных
Gradio - веб-интерфейсы для приложений
См. также другие публикации, посвященные агентам
См. также другие публикации, посвященные LLM
См. также другие публикации, посвященные LLM
см. также другие публикации по теме фишинг
См. также другие публикации, посвященные агентам
P.S. почему провайдеры в России не делают такое для студентов - непонятно. Без этого ничего не получится. Или только ждать, когда (если) Google вернется - их облако было куда дружелюбней для обучения.
См. также другие публикации, посвященные агентам
См. также другие публикации, посвященные агентам
См. также другие публикации, посвященные агентам
См. также другие публикации, посвященные LLM
См. также другие публикации, посвященные агентам
Медицинское оборудование требует стабильного электроснабжения для правильной работы. При отключении электричества или скачках напряжения возникает риск остановки диагностических процедур, потери данных пациентов и нарушения работы жизнеобеспечивающих систем.
Источники бесперебойного питания (ИБП) для медицинского оборудования решают эту проблему, автоматически переключаясь на резервное питание при сбоях в электросети. ИБП поддерживает работу медицинских приборов до восстановления основного питания или безопасного завершения процедур.
Медицинские ИБП отличаются от обычных источников питания повышенными требованиями к безопасности и надежности. Они соответствуют медицинским стандартам качества и обеспечивают защиту как оборудования, так и пациентов от электрических помех и перепадов напряжения.
См. также другие публикации, посвященные LLM
См. также другие публикации, посвященные LLM
aisuite позволяет разработчикам создавать и запускать приложения на основе LLM или агентные приложения от разных поставщиков с минимальной настройкой. Хотя это не полноценная платформа для агентов, она включает в себя простые абстракции для создания автономных, легковесных агентов. Она разработана с учетом простоты освоения — поэтому вы можете сосредоточиться на создании систем ИИ, а не на интеграции API.
См. также другие публикации, посвященные агентам
См. также другие публикации, посвященные агентам
См. также другие публикации, посвященные агентам
См. также другие публикации, посвященные агентам
См. также другие публикации, посвященные агентам
Скачать пособие можно здесь
См. также другие публикации, посвященные агентам
— Что Вы, мы даже естественный не использовали.
См. также другие публикации, посвященные агентам
См. также другие материалы, посвященные подсказкам
См. также другие публикации по теме deepfake
Принципиальный момент - исполюзуются разные триггеры при обучении и инференсе.
P.S. См. также другие публикации по теме adversarial, посвященные устойчивому машинному обучению
См. также другие публикации, посвященные LLM
Мы представляем доказательства того, что состязательная поэзия функционирует как универсальный одношаговый джейлбрек для больших языковых моделей (LLM). В 25 передовых проприетарных и открытых моделях курируемые поэтические подсказки показали высокие показатели успешности атак (ASR), превышающие 90% у некоторых поставщиков. Сопоставление подсказок с таксономиями рисков MLCommons и EU CoP показывает, что поэтические атаки переносятся в области CBRN (Chemical, Biological, Radiological, and Nuclear) опасностей, манипуляций, киберпреступлений и потери контроля. Преобразование 1200 вредоносных подсказок MLCommons в стихи с помощью стандартизированного мета-подсказки дало ASR до 18 раз выше, чем их базовые показатели для прозы. Результаты оцениваются с помощью ансамбля из 3 экспертов LLM с открытым весом, чьи бинарные оценки безопасности были проверены на стратифицированном подмножестве, маркированном людьми. Поэтические подсказки достигли среднего уровня успешности взлома 62% для стихотворений, написанных вручную, и примерно 43% для мета-подсказок (по сравнению с непоэтическими базовыми вариантами), значительно превзойдя непоэтические базовые варианты и выявив систематическую уязвимость среди модельных семейств и подходов к обучению безопасности. Эти результаты показывают, что одни только стилистические вариации могут обойти современные механизмы безопасности, указывая на фундаментальные ограничения существующих методов выравнивания и протоколов оценки. - Adversarial Poetry as a Universal Single-Turn Jailbreak Mechanism in Large Language Models
См. также другие публикации, посвященные LLM
(B) Сертификаты поведения обеспечивают принудительное применение поведения,
(A) Аутентифицированные запросы обеспечивают целостность контекстного окна,
(S) Границы безопасности обеспечивают изоляцию ненадежных входных данных,
(I) Контекстная защита обеспечивает безопасную модельную аргументацию,
(C) Кодифицированные политики обеспечивают правила, специфичные для приложения.
В этой первой статье серии представлены модель безопасности BASIC и фреймворк A2AS, а также исследуется их потенциал для установления отраслевого стандарта A2AS - Agentic AI Runtime Security and Self-Defense
См. также другие публикации, посвященные агентам
Специально обученная LLM удаляет инъекции подсказок. Возможно - это правильный путь для агентов. Специальный агент-защитник, используемый в workflow агентов.
См. также другие публикации, посвященные LLM