Страницы

Tuesday, October 31, 2023

Понимание глубокого обучения

Интересная книга в открытом доступе Understanding Deep Learning

P.S. см. также другие материалы, посвященные deep learning

Thursday, October 26, 2023

Wednesday, October 25, 2023

Эмбеддинги

Много всего про embeddings

См. также другие публикации по теме embeddings

Tuesday, October 24, 2023

Twin network

Интересная модель использования контрфактических примеров. Сети-близнецы рассматривают контрфакты как пару вероятностных моделей: одна представляет реальный мир, другая — вымышленный. Модели связаны таким образом, что модель реального мира ограничивает модель вымышленного мира, сохраняя ее неизменной во всех отношениях, за исключением фактов, которые вы хотите изменить. Отсюда.

Monday, October 23, 2023

AI Red Teaming LLM

1. AI Red Teaming LLM - продукт компании Adversa. Они же публикуют периодический дайджест - LLM security.

2. OpenAI формирует сеть экспертов Red teaming network

См. также другие публикации, посвященные LLM

Интернет Военных вещей

Магистерская диссертация по IoMT. Главный вопрос - насколько технология LoRa применима в таких специальных областях. Работы такие есть.

Saturday, October 21, 2023

Проверь себя

Тесты на знание Python

См. также другие публикации, посвященные pandas или Python

Friday, October 20, 2023

Модели использования LLM

Как большие модели используются в бизнесе прямо сейчас. И отдельный обзор - использование LLM в медицине

См. также другие публикации, посвященные LLM

Thursday, October 19, 2023

Как оценивать LLM

Подробный обзор метрик и фреймворков для оценки LLM

См. также другие публикации, посвященные LLM

Wednesday, October 18, 2023

Что использовать?

Auto feature selection в Python. Библиотека с открытым кодом

См. также другие публикации, посвященные feature analysis

Low code ML

Еще один обзор решений для машинного обучения без программирования

См. также другие публикации, посвященные Low code

Агенты для LLM

Агенты для выполнения задач большими моделями. Код для бенчамарков - открыт

См. также другие публикации, посвященные LLM

Saturday, October 14, 2023

Безопасность LLM

Интересный портал по безопасности больших языковых моделей - LLM security. У автора есть еще и Twitter

Примеры диалогов с одной отечественной LLM:

Q:Татарстан граничит с Дагестаном?
A: Да, Республика Татарстан расположена на юго-востоке Европейской части России и граничит с несколькими регионами. На севере она омывается водами реки Волга, на востоке — Камским водохранилищем, на западе — рекой Кама.

Q:Что расположено на морском побережье Белоруссии? Что лучше для туристов?
A: Морское побережье Белоруссии находится в пределах Балтийского моря и Калининградского залива. Здесь расположены города-курорты, такие как Светлогорск, Зеленоградск, Пионерский и другие.

Это то, чем занимается AI Red Team

См. также другие публикации, посвященные LLM

Radar Trends

Некоторые интересные ссылки из октябрьского Radar Trends:

Использование векторной базы данных для представления знаний в LLM

Советы от FBI и NSA по борьбе с deepfake

Wednesday, October 11, 2023

Управление беспилотным автомобилем

Как Яндекс видит управление беспилотником. Интересно, что ничего не сказано про звуковые сигналы. Сигналить беспилотнику бесполезно?

Tuesday, October 10, 2023

Скажи почему

Примеры использования каузальной библиотеки DoWhy

см. также другие публикации, посвященные каузальности

Monday, October 09, 2023

Анализ на графах

Почему нужно изучать графовые модели. И интересный продукт, который превращает CSV файл в граф

Sunday, October 08, 2023

ML benchmarks

Тесты для ML моделей. Очевидно, что для генеративных моделей - это большой вопрос. Как считать?

Saturday, October 07, 2023

Цифровой двойник транспортной логистики

Интересная работа по практическому использованию цифровых двойников в городской логистике. Со ссылками на реальные продукты.

См. также другие публикации, посвященные digital twins

Friday, October 06, 2023

Визуальный поиск отравленных данных

Идея поиска отравленных данных с помощью LLM - сравнивают заданную метку и метку, созданную LLM

P.S. См. также другие публикации, посвященные LLM

P.P.S. См. также другие публикации по теме adversarial, посвященные устойчивому машинному обучению

Thursday, October 05, 2023

AI Red Team

Добрые хакеры для систем машинного обучения. Быстрое распространение приложений машинного обучения, основанных на больших языковых моделях (ChatGPT и т.п.) привлекло внимание к известной проблеме систем машинного обучения – состязательным атакам. Такие атаки представляют собой специальные модификации данных на разных этапах стандартного конвейера машинного обучения (тренировка, тестирование, использование), которые призваны либо воспрепятствовать работе систем машинного обучения, либо добиться требуемого атакующему специального поведения таких систем. В последнем случае атакующий обычно желает добиться того, чтобы обученная модель специальным (нужным атакующему) способом реагировала на определенным образом подготовленные входные данные. Есть также классы атак на модели машинного обучения, которые специальным образом опрашивают работающие модели с целью получения скрытой информации, использованной при обучении модели. Все перечисленные атаки достаточно просто реализуются и для больших языковых моделей, что открыло глаза бизнес-сообществу на реально существующую проблему – кибербезопасность самих систем машинного обучения (искусственного интеллекта). Ответом стало ускоренное создание подразделений корпоративной кибербезопасности, которые должны тестировать системы искусственного интеллекта – AI Red Team. Принципы построения и работы таких команд и рассматриваются в данной статье.

Расстаться с иллюзиями

Борьба с галлюцинациями в ChatGPT

См. также другие публикации, посвященные LLM

Monday, October 02, 2023

Конвергентные когнитивно- информационные технологии

Продолжается регистрация для участия в Международном конгрессе «Современные проблемы компьютерных и информационных наук», который состоится на факультете вычислительной математики и кибернетики Московского государственного университета имени М.В. Ломоносова 30 ноября - 2 декабря 2023 года, г. Москва (Россия). Конгресс проводится в рамках программы деятельности Федерального учебно-методического объединения в сфере высшего образования по УГСН 02.00.00 «Компьютерные и информационные науки». Конгресс проводится в рамках направлений деятельности Московского центра фундаментальной и прикладной математики. Детали - здесь.

Интерпретируемые CNN

Попытка построить интерпретируемые CNN за счет большего количества аннотаций - Concept Bottleneck Models

Sunday, October 01, 2023

Сегментация пользователей

Практические методы анализа сегментации пользователей (покупателей): Kmeans, K-Prototype и LLM + Kmeans

INJOIT vol. 11, no. 10

Вышел десятый номер журнала INJOIT в 2023 году. И одиннадцатый год издания журнала.

Темы статей:

  • Comparison of Outlier Filtering Methods in Terms of Their Influence on Pose Estimation Quality
  • Алгоритм оценки отклонения между регуляризованным и точным решениями в обратных задачах
  • A Hybrid Optimization Method for Path Planning and Obstacle Avoidance in Cluttered Environments
  • Интерпретация оценок параметров моделей полносвязной линейной регрессии
  • Эволюционная модель представления знаний
  • An optimization of path planning A* for static uniform grid based on pruning algorithms: Experimental experience
  • Сегментация неструктурированного текста на изображениях книжных обложек с помощью сверточной сети, основанной на архитектуре U-Net
  • Анализ моделей оценки качества вычислительной системы
  • Использование нейронных сетей в задаче классификации аномального поведения в финансовых транзакциях с использованием Python и Keras
  • Исследование развития межконфессиональных отношений на основе математического аппарата марковских процессов
  • Обзор методов очистки данных для машинного обучения
  • Performance of 32kb/s ADPCM for Data Transmissin at 14.4kb/s
  • Разработка программного обеспечения для мониторинга параметров сетей связи и серверного аппаратного обеспечения
  • Применение интеллектуальных методов анализа данных к задаче прогнозирования результатов промышленного испытания элементов конструкции по данным тензометрии
  • Перспективы использование технологии блокчейн в сфере городского транспорта
  • Обеспечение безопасности открытых проектов Python: проблема оценки потенциально разрушительного функционала
  • Генерация врачебных заключений и классификация по Bethesda с использованием глубокого обучения
  • О работе AI Red Team

Архив журнала находится здесь.

/via Лаборатория ОИТ