Sunday, May 19, 2024

Распределенные системы

Хороший учебный курс от TU Deft - Современные распределенные системы

Не все так просто

Это системный промпт (запрос) в LLM Claude 3. Эпоха коротких запросов подошла к концу. Короткие запросы, возможно, будут в начале сеанса, чтобы понять, что вообще модель знает. А дальше диалог будет включать уже запросы с подробными инструкциями.

Вот интересная статья, в которой обсуждается ситуация - можно ли с последовательностью уточняющих запросов добиться такого же эффекта, как и при специальной настройке модели.

См. также другие публикации, посвященные LLM

Thursday, May 16, 2024

Доктор Gemini

On the popular MedQA (USMLE) benchmark, our best-performing Med-Gemini model achieves SoTA performance of 91.1% accuracy. Это точность работы модели на тестах для врачебной лицензии США. USMLE - United States Medical Licensing Examination. При сдаче экзамена человеком его защитывают при 75%, если что. Отсюда.

Anomaly Detection Dataset

Датасет с атаками на киберфизические системы

Wednesday, May 15, 2024

Цена данных

Интересное исследование - как определить цену данных. Если продукт - это некоторый датасет, то что определяет его стоимость?

Большой фишинг

Использование LLM для генерации фишингового контента

См. также другие публикации, посвященные LLM

Friday, May 10, 2024

Переносимость атак

Хорошая статья по практической переносимости состязательных атак. Как с ограниченным бюджетом (ограниченным количеством запросов к атакуемой модели) построить теневую модель, и построить на ней атаки. Доступен исходный код.

См. также другие публикации по теме adversarial, посвященные устойчивому машинному обучению

Wednesday, May 08, 2024