Wednesday, July 28, 2021

Об устойчивом машинном обучении

Базовая проблема для систем машинного обучения: данные на этапе тренировки модели и при практической эксплуатации - разные. И не похожи друг на друга. Другое распределение - distributional shift. Что же делать?

Соревнование от Яндекса: Если сдвиг распределения данных в реальном мире значителен относительно обучающей выборки (например, модель машинного перевода, которая училась на классической литературе, вдруг возьмется переводить твиты), недостаточно надежные модели будут ошибаться. Поэтому, попадая в реальный мир, модели должны быть готовы справляться со сдвигом, который их там ждет.

Этим, однако, дело не ограничивается. Чтобы модель работала эффективно и безошибочно, о вероятности ошибки лучше знать заранее: следовательно, модель должна давать оценку неопределенности относительно своих решений. Поэтому мы хотим добиться от моделей, с одной стороны, устойчивой работы при сдвиге распределения, а с другой — умения оценивать неопределенность.

Это часть NeurIPS 2021 Competition Track. Вот оригинальная страница Shifts Challenge

См. также другие публикации по теме мониторинг моделей машинного обучения

Все о регрессии

Большая регрессионная книга. Примеры на Python и R

Tuesday, July 20, 2021

Объявляется прием на программу "Разработчик компьютерных технологий"

Объявляется прием на программы профессиональной переподготовки для получения дополнительной квалификации «Разработчик профессионально-ориентированных компьютерных технологий»
(очно-заочная и дистанционная формы обучения) с 14 июля по 20 сентября 2021 г.

Сроки обучения – 2 года
Форма обучения – вечерняя (очно-заочная) и дистанционная.
Обучение осуществляется на договорной основе (50 000 руб. за 1 семестр, вся программа – 200 000 руб.)
Выпускники получают Диплом о профессиональной переподготовке с присвоением дополнительной квалификации установленного образца.

Прием документов и подробная информация на сайте


Зачисление производится приемной комиссией факультета по факту оплаты за 1й семестр.
Телефон для справок: 8(910)553-6487, dpovmk@cs.msu.ru Якушин Алексей Валериевич

/via Магистратура ВМК МГУ

Thursday, July 15, 2021

Долой SQL

Довольно интересная атака на SQL. И бурная дискуссия на YC

Wednesday, July 14, 2021

Copilot

Обзор текущего состояния системы Copilot (генеративная модель для генерации кода). Пока получается не очень хорошо.

Вам, Юлиеводы

Коллекция алгоритмов data science, реализованных на языке Julia

P.S. см. также другие публикации, посвященные языку Julia

Saturday, July 10, 2021

Открытая наука, том 9, номер 7

Очередной номер журнала INJOIT появился на сайте Киберленинка

Это том 9, номер 6 за 2021 год. По данным elibrary.ru, журнал INJOIT занимает второе место в разделе Кибернетика и второе в разделе Автоматика и вычислительная техника

/via Лаборатория ОИТ

Wednesday, July 07, 2021

NLP курс

Интересный курс по NLP, целиком реализованный на Google Collab

Fake Detector

Это не его лицо - fake face detector всего с 40 000 параметров

Вот здесь подробнее об этой и других похожих работах