Thursday, May 16, 2024

Доктор Gemini

On the popular MedQA (USMLE) benchmark, our best-performing Med-Gemini model achieves SoTA performance of 91.1% accuracy. Это точность работы модели на тестах для врачебной лицензии США. USMLE - United States Medical Licensing Examination. При сдаче экзамена человеком его защитывают при 75%, если что. Отсюда.

Anomaly Detection Dataset

Датасет с атаками на киберфизические системы

Wednesday, May 15, 2024

Цена данных

Интересное исследование - как определить цену данных. Если продукт - это некоторый датасет, то что определяет его стоимость?

Большой фишинг

Использование LLM для генерации фишингового контента

См. также другие публикации, посвященные LLM

Friday, May 10, 2024

Переносимость атак

Хорошая статья по практической переносимости состязательных атак. Как с ограниченным бюджетом (ограниченным количеством запросов к атакуемой модели) построить теневую модель, и построить на ней атаки. Доступен исходный код.

См. также другие публикации по теме adversarial, посвященные устойчивому машинному обучению

Wednesday, May 08, 2024

Monday, May 06, 2024

Шпаргалки по LLM - 2

Компактное изложение: LLM fine-tuning

См. также другие публикации, посвященные LLM

Sunday, May 05, 2024

Атаки на сегментацию

Состязательные атаки на сегментацию изображений

См. также другие публикации по теме adversarial, посвященные устойчивому машинному обучению

Friday, May 03, 2024

Доверенные LLM

Интересные решения от CleanLab (MIT) по доверенным LLM

См. также другие публикации, посвященные LLM

Thursday, May 02, 2024