Статья интересна еще и своим обзором ИИ-агентов для пентестинга.
См. также другие публикации, посвященные агентам
технические проблемы и идеи, родившиеся в бурных водах реки Abava (а равно как и на ее берегах, далеких и близких), выставленные на всеобщее обсуждение
Статья интересна еще и своим обзором ИИ-агентов для пентестинга.
См. также другие публикации, посвященные агентам
См. также другие публикации, посвященные агентам
Эти результаты показывают, что однократные оценки безопасности недостаточны для надежной оценки безопасности, и что протоколы оценки должны учитывать стохастические вариации в поведении модели. Мы показываем, что однократная оценка согласуется с многовыборочными эталонными данными только в 92,4% случаев при объединении данных по разным температурам (94,2–97,7% при фиксированной температуре в зависимости от настроек), и рекомендуем использовать не менее 3 выборок на каждый запрос для надежной оценки безопасности. - The Instability of Safety: How Random Seeds and Temperature Expose Inconsistent LLM Refusal Behavior
См. также другие публикации, посвященные LLM
См. также другие публикации, посвященные LLM
См. также другие публикации, посвященные LLM
См. также другие публикации, посвященные LLM
См. также другие публикации, посвященные агентам