См. также другие публикации, посвященные LLM
технические проблемы и идеи, родившиеся в бурных водах реки Abava (а равно как и на ее берегах, далеких и близких), выставленные на всеобщее обсуждение
Wednesday, July 31, 2024
Большая языковая ложь
Friday, July 26, 2024
Обманчивая диффузия
См. также другие публикации по теме adversarial, посвященные устойчивому машинному обучению
Thursday, July 25, 2024
Про фишинг
См. также другие публикации по теме adversarial, посвященные устойчивому машинному обучению
Wednesday, July 24, 2024
Невиданные атаки
со страницы Jacob Steinhardt
См. также другие публикации по теме adversarial, посвященные устойчивому машинному обучению
AI агенты для LLM
См. также другие публикации, посвященные LLM
Tuesday, July 23, 2024
Доменные атаки LLM
См. также другие публикации, посвященные LLM
Под атакой
См. также другие публикации по теме adversarial, посвященные устойчивому машинному обучению
Monday, July 22, 2024
Sunday, July 21, 2024
Проверь себя
См. также другие публикации, посвященные Python
Saturday, July 20, 2024
Большая болтовня
См. также другие публикации, посвященные LLM
Объяснимость, интерпретируемость и наблюдаемость
Три ключевых термина — объяснимость, интерпретируемость и наблюдаемость — широко признаны как составляющие прозрачности модели машинного обучения.
Объяснимость не имеет стандартного определения, а скорее общепринято относится к «движению, инициативам и усилиям, предпринимаемым в ответ на проблемы прозрачности и доверия ИИ». Объяснимая модель должна быть способна «(i) [предоставлять] основные функции, используемые для принятия решения, (ii) [предоставлять] все обработанные функции, ( iii) [предоставить] исчерпывающее объяснение решения и (iv) [обеспечить] понятное представление всей модели». Они определили объяснительность как предоставление «значимой информации о том, как принимается конкретное решение», что требует «хода мыслей, который может сделать решение значимым для пользователя (т. е. чтобы решение имело для него смысл)». Таким образом, объяснимость относится к пониманию внутренней логики и механики модели, лежащей в основе решения.
Интерпретируемость часто считается аналогом объяснимости и обычно используется как синоним. Однако широко распространено мнение, что интерпретируемость означает способность понять общее решение на основе входных данных, не требуя полного понимания того, как модель произвела выходные данные. Таким образом, интерпретируемость считается более широким термином, чем объяснимость. Интерпретируемость - «способность объяснять или представлять человеку в понятных терминах». Другое популярное определение интерпретируемости — это «степень, в которой человек может понять причину решения»
На практике интерпретируемая модель может быть такой, которая способна предсказать, что изображения домашних питомцев являются животными на основании идентифицируемых закономерностей и особенностей (например, наличия меха). Однако этой модели не хватает человеческого понимания внутренней логики или процессов, которые сделали бы модель объяснимой.
Хотя многие исследователи используют понятность и объяснимость в одном и том же контексте, объяснимость обычно относится к более глубокому пониманию внутренней работы модели.
Наблюдаемость машинного обучения — это понимание того, насколько хорошо модель машинного обучения работает в производстве. Наблюдаемость - «средство измерения и понимания состояния системы посредством выходных данных системы», это «необходимая практика для эксплуатации системы и инфраструктуры, от которых будет зависеть надежность». Наблюдение направлено на решение основной проблемы, заключающейся в том, что модель, которая отлично работает в исследованиях и разработках, может быть не такой точной при развертывании. Это несоответствие часто связано с такими факторами, как различия между реальными данными, с которыми сталкивается модель, и историческими данными, на которых она изначально обучалась. Поэтому крайне важно поддерживать непрерывный мониторинг вводимых данных и производительности модели. В отраслях, где решаются важные вопросы, гарантия того, что модель будет работать так, как ожидается, является важнейшим условием ее внедрения.
Наблюдаемость — ключевой аспект поддержания производительности модели в реальных условиях.
Наблюдаемость состоит из двух основных методов: мониторинга и объяснимости.
Friday, July 19, 2024
Бэкдоры в LLM - 2
См. также другие публикации, посвященные LLM
Thursday, July 18, 2024
MLL
Wednesday, July 17, 2024
Чужое лицо
См. также другие публикации по теме adversarial, посвященные устойчивому машинному обучению
Tuesday, July 16, 2024
Бэкдоры с чистой меткой
См. также другие публикации по теме adversarial, посвященные устойчивому машинному обучению
Monday, July 15, 2024
Оранжевая книга ML
Tuesday, July 09, 2024
Надежность ML моделей
Monday, July 08, 2024
INJOIT в Ленинке
Sunday, July 07, 2024
LLM в кибербезопасности
См. также другие публикации, посвященные LLM
Thursday, July 04, 2024
INJOIT том 12, номер 7
Темы статей:
- Гибридные модели предиктивной аналитики в креативной индустрии
- Semantic Data Fragmentation for Identification of Covariant Conceptual Drift in Machine Learning Models
- Prod2Query: решение проблемы холодного старта продаж для электронной коммерции с помощью генеративного языкового моделирования
- Hybrid Naive Bayes TF-IDF Algorithm and Lexicon Approach for Sentiment Analysis of Reviews
- On the optimal scheme of the possible three predictors in discrete optimization problems using decision-making algorithms
- Метод Построения Модели Пространства Автономных Транспортных Средств
- Анализ LSTM и GRU моделей для построения прогнозов временных рядов
- О болезни Паркинсона и ее математических моделях
- Применение нейронных сетей для обнаружения аномального трафика в сетях Интернета вещей
- On the possibility of increasing the noise immunity of OFDM telecommunication systems using fractional Fourier transforms
- Оптимальное распределение вычислительных ресурсов для реализации сервисов цифровых валют центральных банков
- A Framework for Cloud Migration in Academic Institutions
- Метод полной интуиционистской нечеткой кластеризации C-средних
- Данные телеметрии как фактор минимизации экологических последствий лесозаготовок
- Biometric Based Recognition Systems - An Overview
- Анализ тенденций развития цифровых двойников нового поколения
- Toward Eradication of Phishing Attacks in E-government Systems
- Состязательные атаки для автономных транспортных средств
/via Лаборатория ОИТ
Архив журнала находится здесь.
Wednesday, July 03, 2024
Состязательные атаки на беспилотный транспорт
Паттерны движения
Tuesday, July 02, 2024
Атака для защиты
См. также другие публикации по теме adversarial, посвященные устойчивому машинному обучению
Monday, July 01, 2024
Автоматизация атак вывода
См. также другие публикации по теме adversarial, посвященные устойчивому машинному обучению