Страницы

Wednesday, November 28, 2018

О, bias

Подборка инструментов для оценки смещения в результатах машинного обучения:

Pymetrics Audit AI

AI Fairness 360 toolkit

Google What-If Tool

Docker и ML

Машинное обучение от начала до конца: построение модели, обучение и использование построенной системы

См. также другие публикации, посвященные machine learning

А что внутри?

Интересное исследование от Google, касающееся объяснения того, как нейронная сеть распознает объекты на изображениях. Вот еще статья в NYT об этом.

Friday, November 23, 2018

Thursday, November 22, 2018

Не о деньгах

Поскольку криптовалюты выходят из моды, то самое время вернуться к истокам блокчейн - распределенному регистру

См. также другие публикации, посвященные blockchain

Карта знаний

Что должны знать домохозяйки менеджеры о data science - MindMap

Wednesday, November 21, 2018

Практика Python

Несколько интересных ссылок

1. Визуализация на Python. Интересная классификация инструментов.

2. Statsmodels. Статистика в Python.

3. учебник по Sci-Kit. Возможно, самый простой в использовании пакет для машинного обучения.

Monday, November 19, 2018

Saturday, November 17, 2018

Friday, November 16, 2018

kNN

Простое введение в k-Nearest-Neighbors

См. также другие публикации по теме кластеризация

Структуры данных

Вопросы на интервью для программистов по структурам данных и алгоритмам

См. также другие публикации по теме интервью

Thursday, November 15, 2018

SNN

Spiking Neural Networks - интересная модель для обработки spatio-temporal данных

Kafka SQL

Потоковый SQL для Kafka

См. также другие публикации, посвященные Kafka

Wednesday, November 14, 2018

Keras - в жизнь

Пара примеров использования Keras:

CNN в Keras

RNN в Keras

См. также другие работы, посвященные Keras или deep learning

Как это было?

Как сделали Трампа? О том, как работала компания Cambridge Analytica, которой и приписывается успех Трампа на выборах.

P.S. то, что данные, по их словам, были собраны одним небольшим приложением, которое пользователи загружали добровольно - это, конечно, смех. Данные, очевидно, продал FB. Это бизнес, ничего личного.

Tuesday, November 13, 2018

Ган

Введение в GAN.

См. также другие публикации, посвященные Generative Adversarial Networks

Friday, November 09, 2018

Что в тренде?

Что писать в резюме по data science? Наиболее востребованные навыки, если судить по объявлениям о найме.

P.S. а вот здесь можно узнать как на самом деле читают резюме рекрутеры.

Thursday, November 08, 2018

О вере

Толковая статья: In blockchain we trust. Здесь именно речь о распределенном регистре.

Великолепная десятка

Еще один набор базовых алгоритмов машинного обучения. Со ссылками на учебники.

См. также другие публикации по теме machine learning

Wednesday, November 07, 2018

Азы ML

Основные алгоритмы машинного обучения. Привлекает краткостью и ясностью изложения.

См. также другие публикации по теме machine learning

INJOIT vol. 6, no. 11

Вышел новый номер журнала INJOIT. Это одиннадцатый номер в 2018 году. Тема года - цифровая экономика. Также ожидаем много статей по транспортной тематике.

Темы статей:

  • An approach to the classification of the loops of finite automata. Part II: The classification of the states based on the loops
  • Tree Traversal to Achieve Generalization for Data De-identification
  • Об усложнении дискретного логарифмирования в полях характеристики 2
  • Оптимизационная методика выбора частот для получения RGB-представления результатов спектральной декомпозиции
  • Виртуализация сетевых функций NVF как аналог параллельных сетей в эпоху коммутации каналов
  • Экспериментальное исследование трех вариантов реализации метода неравномерных покрытий для систем с общей памятью
  • Цифровая трансформация процессов нормативного регулирования: тенденции, подходы и решения
  • Построение онтологических связей в области знаний на основании поиска и анализа текстовых ссылок
  • Концептуализация понятий, используемых в исследованиях «умного города» и «электронного управления»: опыт наукометрического анализа
  • Системно-комплексный подход при накоплении знаний в предметной области биомедицины
  • Онтологизация данных Европейского союза как переход от экономики данных к экономике знаний
  • Онтологии системы систем в национальных стандартах цифровой железной дороги Великобритании

Архив журнала находится здесь.

/via Лаборатория ОИТ

Apache Beam

Универсальная модель обработки данных - Apache Beam

Tuesday, November 06, 2018

Умные грабли

Утвержден паспорт ведомственного проекта «Умный город». А архитектуры так и нет. Снова банк решений. Кейсов, как менеджеры любят говорить. То есть, каждое решение будет реализовывать свою базу данных, свою среду передачи, свою систему безопасности и т.д. Потом откроется, что данные нужно объединять, а все попарно разное и так далее. Все как всегда.

Monday, November 05, 2018

На что положиться?

Выбор признаков в задачах машинного обучения. В двух частях: работа с цифровыми данными и работа с категориями.

См. также другие публикации, посвященные feature selection

Sunday, November 04, 2018

Friday, November 02, 2018

Super Cron

Apache Airflow - управление потоками работ по ациклическому графу