Страницы

Friday, April 29, 2022

StyleGAN

Натренированный генератор фотографий. Довольно изощренный инструмент для генерации фейков.

MDS

Modern Data Stack - современное состояние того, что раньше просто называлось базами данных

Saturday, April 23, 2022

ML notebooks

Серия примеров кода для всевозможных задач и приложений машинного обучения. Например, построение контрфактических примеров

О статистических выводах

Improving Your Statistical Inferences - хорошая книга в открытом доступе

Содержание:


1 Using p-values to test a hypothesis
2 Error control
3 Likelihoods
4 Bayesian statistics
5 Asking Statistical Questions
6 Effect Sizes
7 Confidence Intervals
8 Sample Size Justification
9 Equivalence Testing and Interval Hypotheses
10 Sequential Analysis
11 Meta-analysis
12 Bias detection
13 Preregistration and Transparency
14 Computational Reproducibility

Thursday, April 21, 2022

Заполнить пропуски

Языковая модель BERT способна заполнять пробелы в неполных предложениях, основанных на Wikipedia и нескольких других сетях (ConceptNet иSQuAD). Например, заполнить пропуск в предложении “The theory of relativity was developed by ___.” Основная идея была в том, чтобы использовать общую модель, а не специально обученную для данного класса задач. Главный вывод - большие предварительно обученные языковые модели могут собирать и воспроизводить почти столько же информации — по крайней мере, из некоторых наборов данных — сколько и специально разработанные модели ответов на вопросы. Эти знания могут позволить им выполнять различные языковые задачи, включая заполнение пропусков, без специальной подготовки.

И вместе с тем, если таких пропусков несколько, то с "интеллектом" все становится хуже.

Новые медицинские тесты

Цифровой двойник для медицинских клинических испытаний

См. также другие публикации, посвященные digital twins

Wednesday, April 20, 2022

Нетрадиционные источники данных

Что еще может влиять на цену недвижимости? Это то, где ИИ может помочь в поиске и анализе шаблонов.

Открытая наука, том 10, номер 4

Очередной номер журнала INJOIT появился на сайте Киберленинка.

Это том 10, номер 4 за 2022 год. По данным elibrary.ru, журнал INJOIT занимает второе место в разделе Кибернетика и второе в разделе Автоматика и вычислительная техника

/via Лаборатория ОИТ

Tuesday, April 19, 2022

Цифра в российской медицине

Инвестиции в цифровое здравоохранение России. Довольно большие цифры, на самом деле. Интересно, а что с результатами?

Monday, April 18, 2022

Практика ранжирования

Практические примеры использования ранжирования P.S. см. также публикацию про модели ранжирования

Friday, April 15, 2022

Модели ранжирования

Обучение ранжированию в информационном поиске (IR) — это задача по автоматизации построения ранжирующей модели на основе обучающих данных, так, чтобы модель смогла может сортировать новые объекты по степени их значимости, предпочтения или важности. Многие проблемы IR по своей природе есть ранговые проблемы.

Учебник по построению моделей ранжирования в открытом доступе и практический пример - алгоримизация рекламных предложений.

Tuesday, April 12, 2022

Беспроводные сети как радары

Использование WiFi/4G/5G как сканирующих устройств. Интересная статья с массой примеров приложений.

Saturday, April 09, 2022

Wednesday, April 06, 2022

IoT в кризисной ситуации

Аналитика больших данных и Интернет Вещей в кризисных ситуациях - толковый обзор

Про секвестр

"В связи со сложным макроэкономическим положением, обусловленным введением незаконных ограничений в отношении нашей страны со стороны недружественных стран, Правительство Российской Федерации поручило главным распорядителям бюджетных средств (в том числе СПбГУ) подготовить и представить к 15.03.2022 предложения по сокращению бюджетных ассигнований, предусмотренных указанным распорядителям в соответствии с законом о федеральном бюджете на 2022 год, в размере не менее 10 % от общего объема бюджетного обеспечения, за исключением публичных обязательств, к которым относятся оплата труда, стипендиальные выплаты и выплаты детям-сиротам." - отсюда.

"Справочно: по таким главным распорядителям бюджетных средств, как Минобрнауки России, РФФИ и Государственный Эрмитаж итоговые размеры секвестра составили 17047,8 млн руб., 1153,3 млн руб. и 410,1 млн руб. соответственно. При этом некоторые главные распорядители бюджетных средств (в том числе МГУ) не представили предложений, что привело к инициированию Правительством Российской Федерации в их отношении процедуры принудительной оптимизации в 10 %, без предоставления дополнительной поддержки."

и далее: "... в преддверии возможных секвестров второй и третьей очереди."

Sunday, April 03, 2022

Сдвиг концепции

Одна из самых больших проблем для устойчивости систем машинного обучения - сдвиг концепции. Что с этим делать - интересная работа, посвященная concept shift

См. также другие публикации по теме мониторинг моделей машинного обучения.

Friday, April 01, 2022

Самоизоляция

Похоже, что elibrary.ru больше не индексируется в Google Scholar. С 2022 года Google Scholar не видит выпуски журнала INJOIT в elibrary. Или это уже все не актуально?

NeurIPS

Обзор статей, принятых на конференцию NeurIPS - 2020 и NeurIPS - 2021