технические проблемы и идеи, родившиеся в бурных водах реки Abava (а равно как и на ее берегах, далеких и близких), выставленные на всеобщее обсуждение
Страницы
Friday, December 31, 2021
Thursday, December 30, 2021
Wednesday, December 29, 2021
VR на практике
Tuesday, December 28, 2021
Расстояние в анализе данных
Monday, December 27, 2021
Состязательные атаки - демонстрация
См. также другие публикации по теме adversarial, посвященные устойчивому машинному обучению
Этюды на Python
См. также другие публикации, посвященные Python
Friday, December 24, 2021
Чем сердце успокоится
Вот, что про это думает Google: Five Principles for Machine Learning to Go Mainstream
Все должно превратиться в нормальное программное обеспечение.
Wednesday, December 22, 2021
Графовые сети
См. также другие публикации, посвященные графовым нейронным сетям
Sunday, December 19, 2021
Интерпретируемые модели
Интерпретируемые модели в машинном обучении - 2
Интерпретируемые модели в машинном обучении - 3
См. также другие публикации, посвященные ответу на вопрос почему для систем машинного обучения
Saturday, December 18, 2021
Как машины видят нас
Здесь есть пример сегментации и датасет для тестирования
Friday, December 17, 2021
Thursday, December 16, 2021
Поездки на метро
Wednesday, December 15, 2021
В живом режиме
См. также другие публикации об интерактивных моделях
Моделирование сдвига данных
Tuesday, December 14, 2021
Измерение причины
См. также другие публикации, посвященные каузальности
Качество систем машинного обучения
Friday, December 10, 2021
102-й пример машинного обучения
Thursday, December 09, 2021
Дети цветов
Вот здесь есть видео с процессом.
Tuesday, December 07, 2021
Что они собираются делать?
Monday, December 06, 2021
Темная сторона ML
FSOD
Sunday, December 05, 2021
Как все это объяснить?
101 пример - машинное обучение на практике
Saturday, December 04, 2021
GLOM
Wednesday, December 01, 2021
Качество данных
Monday, November 29, 2021
Больше пояснений
Перестановки характеристик (Permutation Feature Importance)
ParSHAP - какие из характеристик вызывают перетренированность
См. также другие публикации, посвященные SHAP и ответу на вопрос "почему" для моделей машинного обучения
Friday, November 26, 2021
Данные, а не модели
feature engineering - это главное в машинном обучении
Thursday, November 25, 2021
Wednesday, November 24, 2021
Monday, November 22, 2021
Разъяснения по состояниям ИИ
Моделирование неопределенности
См. также предыдущие публикации, посвященные работе с неопределенностью
Friday, November 19, 2021
Tuesday, November 16, 2021
Нарисовать текст
Monday, November 15, 2021
Открытая наука том 9, номер 11
Это том 9, номер 11 за 2021 год. По данным elibrary.ru, журнал INJOIT занимает второе место в разделе Кибернетика и второе в разделе Автоматика и вычислительная техника
/via Лаборатория ОИТ
См. также другие публикации по теме adversarial, посвященные устойчивому машинному обучению
Friday, November 12, 2021
Overfitting
Вот здесь можно посмотреть другие публикации, посвященные SHAP
Wednesday, November 10, 2021
Пример платформы данных
Tuesday, November 09, 2021
Цифровой двойник для беспилотников
См. также другие публикации, посвященные digital twins
ИИ в 2021
Пара интересных работ:
DefakeHop: A Light-Weight High-Performance Deepfake Detector
Мы уже представляли эту работу здесь
The Cocktail Fork Problem: Three-Stem Audio Separation for Real-World Soundtracks
Вы когда-нибудь настраивались на видео или телешоу, и актеры были совершенно не слышны, или музыка была слишком громкой? Что ж, эта проблема, также называемая проблемой коктейльной вечеринки, может больше никогда не повториться. Mitsubishi и Университет Индианы только что опубликовали новую модель, а также новый набор данных, решающий задачу определения правильного саундтрека. Например, если мы возьмем тот же аудиоклип, который мы только что запустили, со слишком громкой музыкой, вы можете просто увеличить или уменьшить звуковую дорожку, которую хотите придать речи больше, чем музыке.
Проблема здесь в том, чтобы изолировать любой независимый источник звука от сложной акустической сцены, такой как сцена из фильма или видео на YouTube, где некоторые звуки не сбалансированы. Иногда вы просто не слышите некоторых актеров из-за музыки, взрывов или других звуков на заднем плане. Что ж, если вы успешно изолировали разные категории в саундтреке, это означает, что вы также можете повышать или понижать только одну из них, например, немного приглушить музыку, чтобы правильно слышать всех других актеров. Именно этого и добились исследователи. И получилась довольно ясная архитектура
Sunday, November 07, 2021
Данные, данные - 2
Анализатор датасетов. Вот здесь есть информация об этом продукте
Saturday, November 06, 2021
Дрифт данных
Friday, November 05, 2021
Missing Data
У автора статьи есть целая книга в свободном доступе, где рассматривается именно такой итеративный процесс, когда пропущенные значения вычисляются как функция от других значений в датасете.
Внимательный телезритель
Как это работает: авторы разделили шесть миллионов видеороликов YouTube на 180 миллионов отдельных кадров, каждый из которых соединен с соответствующим текстом из расшифровки стенограммы.
Во время предварительного обучения ResNet-50 (кодировщик изображений на иллюстрации выше) генерировал начальное представление каждого кадра.
Трансформер (кодировщик только для языка) произвел представление связанного текста (с учетом всей транскрипции до этого момента). Функция потерь поощряла совпадение кадров и текстовых представлений быть похожими, а несоответствия - несхожими.
Другой трансформер получил представление каждого кадра и соответствующий ему текст (но не текстовое представление). Он научился угадывать замаскированные слова в тексте, а также правильный порядок кадров.
Результаты: MERLOT установил новый уровень достижимых результатов для 14 задач, которые включали ответы на вопросы об отдельных кадрах, ответы на вопросы о последовательностях кадров и упорядочивание неупорядоченных кадров. Особенно хорошо он справился с задачами с ответами на вопросы, предназначенными для проверки пространственных и временных рассуждений на GIF-файлах с Tumblr. Например, MERLOT ответил на вопросы с несколькими вариантами ответов о действии, выполняемом в клипе, с точностью 94,0 процента по сравнению с предыдущим лучшим результатом в 82,8 процента точности. В других областях улучшение было менее значительным. Например, в Drama-QA (датасет для тренировки понимания видео-историй) он ответил на вопросы с несколькими вариантами ответов об истории в клипах телешоу с точностью 81,4 процента по сравнению с предыдущим лучшим результатом в 81,0 процента.
Почему это важно: MERLOT научился упаковывать ряд важной информации о видеоизображениях, сопроводительном тексте и порядке кадров в создаваемые им представления. Количество неразмеченных видео и аудио данных - огромно, и такие алгоритмы обучения с самоконтролем, как этот, могут раскрыть огромную ценность таких данных.
А зависимость от публичных м легко модицируемых датасетов является хорошим примеров для иллюстрации проблем кибербезопасности. Текстовые описания для видео никто ведь не проверяет ...
Thursday, November 04, 2021
Лицедейство в браузере
Wednesday, November 03, 2021
Машинное обучение на потоке
Не все так просто
См. публикацию о физических атаках на системы машинного обучения.
Tuesday, November 02, 2021
Физические атаки на системы машинного обучения
Весьма богатая тема. Естественные изменения для лиц используются как состязательные примеры. Здесь "одевают" маску.
Другие варианты:
маска с изображением другого лица (такой метод маскировки использовался в военном флоте - на борту корабля рисовали контур другого, более мелкого)
очки
повороты головы
кепка с козырьком
наушники
серьги
косметика
См. также другие публикации по теме adversarial, посященные устойчивому машинному обучению
Данные, данные
Google также выпустил руководство по сбору и оценке данных - PAIR AI Guidebook, предназначенное для разработчиков и дизайнеров машинного обучения.
Monday, November 01, 2021
Deep fake космоснимков
См. также другие публикации по теме adversarial и deepfake
Sunday, October 31, 2021
Ленивая загрузка
content-visibility: auto гарантирует максимальный возможный прирост производительности рендеринга страницы при минимальных усилиях.
Saturday, October 30, 2021
Состязательные атаки на системы машинного обучения
См. также другие публикации по теме adversarial, посвященные устойчивому машинному обучению
Friday, October 29, 2021
GNN - введение
См. также другие публикации, посвященные графовым нейронным сетям
Thursday, October 28, 2021
Печатные новости
Физический браузер: концепция и обзор существующих решений API - как использовать в веб-браузере информацию о физическом обружении. Например, различать с помощью JavaScript, открыта страница магазина (торгового центра и т.п.) в обычном десктоп-браузере, или же это мобильный веб-браузер и пользователь находится сейчас в помещении магазина.
Устойчивое машинное обучение - почему это стало самым важным.
Wednesday, October 27, 2021
Теория вероятностей для анализа данных
Tuesday, October 26, 2021
О дип фейках
См. также другие публикации, посвященные GAN
Monday, October 25, 2021
Sunday, October 24, 2021
Тренды в машинном обучении
Более развитые библиотеки компонентов, которые можно комбинировать.
Снижение ручных усилий: позвольте инструментам выполнять настройку гиперпараметров за вас или даже использовать AutoML, чтобы выполнить всю машинную обработку за вас.
Использование облака для массового параллельного обучения и конвейеров машинного обучения.
Развертывание моделей в TensorFlow Lite и TensorFlow.js.
про то, что все идет к AutoML, мы уже однократно писали
Saturday, October 23, 2021
Causal Inference и Python
Поиск причин - Causal discovery
см. также другие публикации, посвященные каузальности
Friday, October 22, 2021
Тайные общества
Водяные знаки
Thursday, October 21, 2021
Анализ логов
Wednesday, October 20, 2021
Вейвлеты
Tuesday, October 19, 2021
Почему - по версии Netflix
см. также другие публикации, посвященные каузальности
Sunday, October 17, 2021
Обогащение данных
Saturday, October 16, 2021
Наше общее детство прошло на одних букварях
Открытая наука, том 9, номер 10
Это том 9, номер 10 за 2021 год. По данным elibrary.ru, журнал INJOIT занимает второе место в разделе Кибернетика и второе в разделе Автоматика и вычислительная техника
/via Лаборатория ОИТ
См. также другие публикации по теме adversarial, посвященные устойчивому машинному обучению
Friday, October 15, 2021
Интерпретация результатов машинного обучения
Отчет Cloudera Fast forward labs - Interpretability
См. также другие публикации на тему "почему"
Thursday, October 14, 2021
State of AI
Ключевые темы отчета за 2021 год включают:
ИИ развивается более конкретными способами, в том числе применяется в критически важной инфраструктуре, такой как национальные электрические сети, и в автоматизированной оптимизации складских помещений в супермаркетах во время пандемий.
Подходы, ориентированные на ИИ, взяли штурмом биологию благодаря более быстрому моделированию клеточных механизмов человека (белков и РНК). Это может изменить открытие новых лекарств и здравоохранение.
Трансформеры появились как архитектура общего назначения для машинного обучения, превзойдя современные достижения во многих областях, включая НЛП, компьютерное зрение и даже предсказание структуры белков.
Инвесторы обратили на ИИ внимание: рекордное финансирование в этом году стартапов в области ИИ и два первых в истории IPO компаний, занимающихся открытием новых лекарств, а также блокбастерные IPO для компаний, занимающихся инфраструктурой данных и кибербезопасностью, которые помогают предприятиям переоснащаться для перехода на эру ИИ.
Недостаточные ресурсы усилий по согласованию ИИ со стороны ключевых организаций, которые продвигают ИИ в целом, а также озабоченность по поводу наборов данных, используемых для обучения моделей ИИ, и предвзятость в контрольных показателях оценки моделей поднимают важные вопросы о том, как лучше всего отображать прогресс ИИ.
ИИ теперь представляет собой настоящую гонку вооружений, а не фигуральную форму. Исследователи ИИ традиционно рассматривали гонку вооружений ИИ как образную - имитированные воздушные бои между конкурирующими системами ИИ, проводимые в лабораториях, - но это меняется с сообщениями о недавнем использовании автономного оружия различными вооруженными силами.
В рамках соперничества между США и Китаем примечателен рост качества исследований и подготовки талантов Китая, при этом китайские институты теперь опережают наиболее известные западные. Зависимость мира от полупроводниковой промышленности Тайваня, которая производит микросхемы искусственного интеллекта для глобальных технологических гигантов, является центральной точкой геополитической напряженности.
Как и в случае с другими аспектами так называемого «фрагментированного интернета», происходит появление и национализация крупных языковых моделей.
См. также публикации про альманах искусственного интеллекта
Монография по Байесовской оптимизации
См. также другие публикации по теме Байес
Wednesday, October 13, 2021
Tuesday, October 12, 2021
Monday, October 11, 2021
За пояснить
Saturday, October 09, 2021
Всех не просканируешь
Friday, October 08, 2021
Использование SHAP
См. также другие ссылки по теме "почему"
Академия графов
См. также другие публикации, посвященные Neo4j
Thursday, October 07, 2021
Wednesday, October 06, 2021
ML поисковик
Tuesday, October 05, 2021
Wi-Fi sensing
См. также другие публикации, посвященные Wi-Fi
Monday, October 04, 2021
Устойчивое машинное обучение
См. также другие публикации по теме adversarial, посвященные устойчивому машинному обучению
Реальный ИИ
См. также предыдущую публикацию по этой теме
Sunday, October 03, 2021
Печальная реальность
Saturday, October 02, 2021
"Жидкие" нейронные сети
Friday, October 01, 2021
Online ML
Thursday, September 30, 2021
Состязательная косметика
Состязательный макияж. Что нового: исследователи из Университета Бен-Гуриона и NEC разработали систему для нанесения естественного макияжа, который делает людей неузнаваемыми по моделям распознавания лиц.
Как это выглядит: работая с 20 добровольцами, исследователи использовали FaceNet, которая изучает сопоставление изображений лиц с компактным евклидовым пространством, для создания тепловых карт, показывающих, какие области лица наиболее важны для идентификации.
Они использовали приложение для виртуального преобразования потребительского уровня YouCam Makeup, чтобы преобразовать тепловые карты в цифровые шаблоны макияжа, наложенные на изображение каждого добровольца. Они скармливали FaceNet копии этих цифровых снимков лица до тех пор, пока объект не стал неузнаваемым. Затем визажист физически нанес эти узоры на настоящие лица в нейтральных тонах.
Добровольцы шли по коридору, сначала без макияжа, а затем с макияжем, пока их снимали две камеры, которые транслировали свои снимки на распознаватель лиц ArcFace. Результаты: ArcFace распознал участников с нанесенным макияжем в 1,2% кадров. Он распознал тех, кто не использовал макияж в 47,6 процентах кадров видео, и тех, кто использовал случайный рисунок макияжа в 33,7 процента кадров.
Почему это важно: эта новая техника требует только обычного ненавязчивого макияжа и отказа от аксессуаров, которые могут вызвать подозрения у сотрудников службы безопасности. Он предлагает, пожалуй, самый простой способ для обычных людей помешать распознаванию лиц - по крайней мере, до тех пор, пока алгоритмы не приспособятся (то есть будут обучены распознавать такие случаи).
См. также другие публикации по теме adversarial, посященные устойчивому машинному обучению
И о статистике
Wednesday, September 29, 2021
Распределитель
Евро IoT
Tuesday, September 28, 2021
Ученый рейтинг
Аппроксимация по перцентилям
Sunday, September 26, 2021
МЭМС
Saturday, September 25, 2021
Friday, September 24, 2021
Анализ причинных связей
См. также другие публикации, посвященные каузальности
Thursday, September 23, 2021
Ноу криминалити
Данные - отсюда
Байесовская оптимизация
P.S. см. также другие публикации по теме Байес
Wednesday, September 22, 2021
Правило использования ML
When you have a problem, build two solutions - a deep Bayesian transformer running on multicloud Kubernetes and a SQL query built on a stack of egregiously oversimplifying assumptions. Put one on your resume, the other in production. Everyone goes home happy.
Отсюда: Первое правило для машинного обучения - попробуйте без него
Кстати, Google говорит о том же: Rule #1: Don’t be afraid to launch a product without machine learning.
Tuesday, September 21, 2021
Monday, September 20, 2021
Как испортить изображение
Sunday, September 19, 2021
HMM vs LSTM
В сообществе специалистов по науке о данных есть тенденция отдавать предпочтение вариантам машинного обучения, таким как LSTM. Хотя эти инструменты довольно мощные, они также заведомо сложны и трудны для понимания. В результате вы часто видите, как специалисты по обработке данных изо всех сил пытаются использовать сложный подход, когда простой будет работать лучше.
Saturday, September 18, 2021
Friday, September 17, 2021
Thursday, September 16, 2021
Wednesday, September 15, 2021
CLTC UC Berkeley
Tuesday, September 14, 2021
О маленьком Интернете
Открытая наука том 9, номер 9
Это том 9, номер 9 за 2021 год. По данным elibrary.ru, журнал INJOIT занимает второе место в разделе Кибернетика и второе в разделе Автоматика и вычислительная техника
/via Лаборатория ОИТ
Monday, September 13, 2021
Инциденты с ИИ
Вот здесь есть описание проекта от авторов
Являясь центральным систематизированным хранилищем проблем, возникающих в реальном мире в результате применения ИИ, эта краудсорсинговая база данных может помочь специалистам в области ИИ смягчить или избежать повторения плохих результатов в будущем. Откройте для себя ранее предоставленные отчеты об инцидентах или отправьте свои собственные сегодня.
Sunday, September 12, 2021
Обобщение в нейронных сетях
Что нового: психологи называют такое мышление систематическим рассуждением. Исследователи из DeepMind, Стэнфордского университета и Университетского колледжа Лондона изучали эту способность в моделях глубокого обучения с подкреплением, обученных взаимодействовать с окружающей средой и выполнять задачу.
Ключевой вывод: Феликс Хилл и его коллеги обучили модель помещать объект 1 в точку 1 с примером выполняемого действия. Во время тестирования они попросили модель поместить объект 2 в позицию 2. Объекта 2 и позиции 2 не было в обучающей выборке, поэтому способность модели выполнять задачу указывает на общее понимание того, как положить.
Как это работает: модель получает представление об окружающей среде вместе с описанием задачи (инструкцией по размещению или поиску данного объекта). Модель обрабатывает эти элементы по отдельности, а затем объединяет свое понимание каждого из них, чтобы определить серию действий для выполнения задачи.
Модель состоит из трех компонентов (обычный выбор для обработки изображений, понимания текста и решений последовательности): CNN обрабатывает представление среды, LSTM интерпретирует описание задачи, а выходы CNN и LSTM объединяются в скрытом слое LSTM для отслеживания прогресса. к выполнению задачи.
Модель учится связывать различные объекты с их именами, выполняя задачи put [object] или find [object]. Исследователи разделяют объекты на тестовые и обучающие наборы. Затем они обучают модель ставить или поднимать предметы в обучающую выборку. Чтобы измерить систематичность рассуждений, они просят его поднять или положить предметы в набор для тестирования.
Результаты: исследователи обучили копии модели в смоделированных 2D и 3D средах. В любом случае более 91% удалось поднять новые объекты. Однако успешность размещения новых объектов упала примерно до 50 процентов в обеих средах.
Да, но: удаление описания задачи и компонента LSTM не сильно повлияло на производительность. То есть, хотя такие слова, как положить и найти, могут помочь людям понять, как нейронные сети работают систематически, язык, по-видимому, не имеет решающего значения для их работы.
Почему это важно: нейронные сети могут делать обобщения, но наше понимание того, как они это делают, неполно. Это исследование предлагает способ оценить роль систематических рассуждений. Результаты предполагают, что модели, которые рассуждают систематически, с большей вероятностью будут обобщать.
Вывод: недавняя серия предварительно обученных языковых моделей приобретает знания, которые позволяют им выполнять различные задачи без переобучения с нуля. Понимание систематических рассуждений в нейронных сетях может привести к повышению производительности в областях, отличных от естественного языка.
Saturday, September 11, 2021
Friday, September 10, 2021
Thursday, September 09, 2021
Кто это сделал?
См. также другие статьи, посвященные CNN
ML ресурсы
https://paperswithcode.com - соответствует названию. Статьи, изложение которых сопровождается кодом. Cвежие решения задач, ссылки на тестирование проектов на разных референсных датасетах.
https://distill.pub - журнал по ML с хорошо иллюстрированными статьями
https://ruder.io - блог NLP разработчика из DeepMind (Sebastian Ruder)
http://colah.github.io - еще один блог (Christopher Olah) с объяснениями разных прооблем ML
Tuesday, September 07, 2021
Friday, September 03, 2021
Сравнение AutoML продуктов
См. также другие публикации по теме AutoML
Thursday, September 02, 2021
О неопределенности в машинном обучении
Wednesday, September 01, 2021
Дрифты в машинном обучении
Monday, August 30, 2021
И это все?
И еще о pandas
См. также другие публикации, посвященные pandas
Friday, August 27, 2021
Больше учебных программ по ИИ
Thursday, August 26, 2021
Современные проблемы компьютерных и информационных наук
Конгресс проводится в рамках программы деятельности Федерального учебно-методического объединения в системе высшего образования по укрупненной группе специальностей и направлений подготовки 02.00.00 «Компьютерные и информационные науки».
Основная программа научных мероприятий Конгресса включает проведение:
VI Международной научной конференции «Конвергентные когнитивно-информационные технологии»;
XVI Международной научно-практической конференции «Современные информационные технологии и ИТ-образование»;
XI Международной конференции-конкурса «Инновационные информационно-педагогические технологии в системе ИТ-образования» – ИП-2021.
Материалы принимаются только в электронном виде через англоязычную или русскоязычную web-форму. Для прикрепления материалов требуется регистрация на сайте конференции.
Рабочими языками Конгресса являются английский или русский.
По результатам работы VI Международной научной конференции «Конвергентные когнитивно-информационные технологии» и XVI Международной научно-практической конференции «Современные информационные технологии и ИТ-образование» научные доклады, рекомендованные программным комитетом, будут опубликованы в Международном научном журнале «Современные информационные технологии и ИТ-образование» (ISSN 2411-1473), который включён в Перечень ВАК Минобрнауки РФ, и проиндексированы в РИНЦ, EBSCO, DOAJ, Ulrichsweb Global Serials Directory, European Reference Index for the Humanities and the Social Sciences (ERIH PLUS), Index Copernicus International.
С целью повышения видимости публикаций конференций для международного научного сообщества избранные научные доклады VI Международной научной конференции «Конвергентные когнитивно-информационные технологии» и XVI Международной научно-практической конференции «Современные информационные технологии и ИТ-образование» будут опубликованы в издательстве Springer в виде отдельных книг (выпусков) в серии Communications in Computer and Information Science (CCIS) и проиндексированы в базе Scopus.
И о моделях
Все не так хорошо с натренированными моделями машинного обучения. А что плохо - описано здесь. Спойлер - проблема с устойчивостью (как и везде в современном машинном обучении).
Wednesday, August 25, 2021
Рекомендации в реальном времени
См. также другие публикации, посвященные анализу данных в реальном времени и сессионным рекомендательным системам
Sunday, August 22, 2021
R и анализ данный
См. также другие публикации, посвященные языку R
Saturday, August 21, 2021
Интеллектуальные двойники
См. также другие публикации, посвященные digital twins
Friday, August 20, 2021
BIM-блог
См. также другие публикации, посвященные BIM
Анализ динамических взаимодействий
Thursday, August 19, 2021
Куда дальше?
Современные системы машинного обучения основаны на гипотезе независимо и одинаково распределенных (IID - independently and identically distributed) данных. По сути, алгоритмы машинного обучения работают лучше всего, когда их обучающие и тестовые данные относятся к одному и тому же распределению. Это предположение может хорошо работать в простых средах, таких как подбрасывание монет и бросание игральных костей. Но реальный мир запутан, и распределения почти никогда не бывают однородными.
«Когда мы это делаем, мы уничтожаем важную информацию об изменениях в распределении, которые присущи собираемым нами данным», - сказал Yoshua Bengio. «Вместо того, чтобы уничтожать эту информацию, мы должны использовать ее, чтобы узнать, как меняется мир».
Интеллектуальные системы должны иметь возможность делать выводы для различных распределений данных, точно так же, как человеческие дети учатся приспосабливаться к изменениям своего тела и окружающей среды. «Нам нужны системы, которые могут справиться с этими изменениями и осуществлять непрерывное обучение, обучение на протяжении всей жизни и так далее», - сказал Yoshua Bengio в своем выступлении на NeurIPS. «Это давняя цель машинного обучения, но мы еще не нашли решения этой проблемы».
BIM и IoT
Monday, August 16, 2021
Робастные модели
См. также другие публикации по теме adversarial, посвященные устойчивому машинному обучению
Friday, August 13, 2021
Отбор признаков
См. также другие инструменты для выбора признаков
Thursday, August 12, 2021
Статистическое обучение
Tuesday, August 10, 2021
Python для ленивых
См. также другие публикации, посвященные Python
Saturday, August 07, 2021
Вас здесь не звучало
Интерпретируемый K-means
Friday, August 06, 2021
Проще - лучше
Open Source школа от Самсунг
Разработчики смогут это сделать в школе COMMoN! Участники проведут 4 недели, обучаясь у опытных контрибьюторов и работая над своим собственным коммитом в один из трех известных open source проектов: ROS, Arenadata DB, DeepPavlov.
И это не всё, лучшие решения получат награду от компаний-партнеров треков.
Сроки работы онлайн школы: 16 августа – 10 сентября 2021 г.
Возраст участников не ограничен. Как поступить: https://sosconrussia.net/common_ru
Thursday, August 05, 2021
Как устроены CNN
P.S. см. также другие публикации, посвященные CNN
Листая старые страницы
и интересная статья о построении гиперлокальной сети Интернет
Wednesday, August 04, 2021
Карты значимости
Monday, August 02, 2021
Friday, July 30, 2021
Wednesday, July 28, 2021
Об устойчивом машинном обучении
Соревнование от Яндекса: Если сдвиг распределения данных в реальном мире значителен относительно обучающей выборки (например, модель машинного перевода, которая училась на классической литературе, вдруг возьмется переводить твиты), недостаточно надежные модели будут ошибаться. Поэтому, попадая в реальный мир, модели должны быть готовы справляться со сдвигом, который их там ждет.
Этим, однако, дело не ограничивается. Чтобы модель работала эффективно и безошибочно, о вероятности ошибки лучше знать заранее: следовательно, модель должна давать оценку неопределенности относительно своих решений. Поэтому мы хотим добиться от моделей, с одной стороны, устойчивой работы при сдвиге распределения, а с другой — умения оценивать неопределенность.
Это часть NeurIPS 2021 Competition Track. Вот оригинальная страница Shifts Challenge
См. также другие публикации по теме мониторинг моделей машинного обучения
Friday, July 23, 2021
Системные архитектуры
P.S. тут у автора еще есть интересные материалы по программной инженерии
Tuesday, July 20, 2021
Объявляется прием на программу "Разработчик компьютерных технологий"
(очно-заочная и дистанционная формы обучения) с 14 июля по 20 сентября 2021 г.
Сроки обучения – 2 года
Форма обучения – вечерняя (очно-заочная) и дистанционная.
Обучение осуществляется на договорной основе (50 000 руб. за 1 семестр, вся программа – 200 000 руб.)
Выпускники получают Диплом о профессиональной переподготовке с присвоением дополнительной квалификации установленного образца.
Прием документов и подробная информация на сайте
Зачисление производится приемной комиссией факультета по факту оплаты за 1й семестр.
Телефон для справок: 8(910)553-6487, dpovmk@cs.msu.ru Якушин Алексей Валериевич
/via Магистратура ВМК МГУ
Thursday, July 15, 2021
Wednesday, July 14, 2021
Copilot
Вам, Юлиеводы
P.S. см. также другие публикации, посвященные языку Julia
Saturday, July 10, 2021
Открытая наука, том 9, номер 7
Это том 9, номер 6 за 2021 год. По данным elibrary.ru, журнал INJOIT занимает второе место в разделе Кибернетика и второе в разделе Автоматика и вычислительная техника
/via Лаборатория ОИТ
Wednesday, July 07, 2021
Fake Detector
Вот здесь подробнее об этой и других похожих работах
Thursday, July 01, 2021
Wednesday, June 30, 2021
Tuesday, June 29, 2021
О безопасном ИИ
Манифест от CMU, посвященный устойчивому машинному обучению. С интересной библиографией
См. также другие публикации по теме adversarial, посвященные устойчивому машинному обучению
Sunday, June 27, 2021
Friday, June 25, 2021
Thursday, June 24, 2021
Локальный хэш
И интересная дискуссия на YC
См. также другие публикации с темой хэш
Wednesday, June 23, 2021
О работе в машинном обучении
2. Как работать - анализ опросов разработчиков на Kaggle. Чем занимаются, какие инструменты используют работающие в области ML
См. также другие публикации, посвященные интервью при приеме на работу
Tuesday, June 22, 2021
О важности очистки данных
См. также другие публикации о системах очистки данных
Monday, June 21, 2021
Sunday, June 20, 2021
Байесовские модели и R
См. также дркгие публикации по теме Байес
Friday, June 18, 2021
Thursday, June 17, 2021
Tuesday, June 15, 2021
Промышленные рекомендации
См. также другие публикации про рекомендательные системы
Практический анализ данных
По шагам - что делать с данными. Все сопровождается кодами на Python.
Wednesday, June 09, 2021
Низкая степень риска
При этом среди документов, поданных для проведения экспертизы такого ПО, должны быть фотографии электронного носителя ПО и фото интерфейса ПО размером не менее 18 х 24 см. Отсюда
P.S. вспомнилось, как смеялись над фотографией, где следователи картинку на экране рассматривали через увеличительное стекло. Вот, чтобы такого не было - 18x24 ...
Генераторы Gesan
Мобильность и оперативность подключения также не относятся к достоинствам сетей общего пользования. Подобные задачи способны решать лишь полностью автономные источники электропитания — электростанции, работающие на бензине или дизельном топливе.
Распродажа: генераторные установки Gesan из Европы в наличии на складе в Москве
Холодный душ
Кризис доверия к AI в медицине
Кажется, что понимание фундаментальных проблем машинного обучения (а именно это сейчас - искусственный интеллект) с робастностью растет.
Tuesday, June 08, 2021
Low code ML
О машинном обучении
Вот его версия в arxiv
Monday, June 07, 2021
Короткие рекомендации
См. также следующую публикацию
P.S. см. другие исследования от Cloudera Fast forward labs
Sunday, June 06, 2021
Машинное обучение на войне
Первая война с использованием ИИ. Системы ИИ в армии Израиля.
Военный ИИ в Евросоюзе. Например: детектор взрывчатых веществ, военный робот
Открытая наука, том 9, номер 6
Это том 9, номер 6 за 2021 год. По данным elibrary.ru, журнал INJOIT занимает второе место в разделе Кибернетика и второе в разделе Автоматика и вычислительная техника
/via Лаборатория ОИТ
Saturday, June 05, 2021
Stanford CS Curriculum 2021
P.S. не все - вот здесь обсуждение и недостающие ссылки
Friday, June 04, 2021
ИБП для медицины
И распродажа генераторов со склада в Москве.
По такой то причине
см. также другие публикации, посвященные каузальности
Фаззинг, как он есть
Monday, May 31, 2021
Bluetooth proximity API
Наши идеи по network proximity завоевывают мир