Friday, December 28, 2018

Разные потоки

Сравнение Kafka и RabitMQ

См. также другие публикации, посвященные Kafka

На службе закона

Где рванет?. Модель для предсказания следующего места совершения преступления.

См. также другие публикации по схожей тематике: spatio-temporal models

Tuesday, December 25, 2018

И снова о причинах

Интересная книга (черновик) в открытом доступе: Causal Inference

Мы сравниваем (обычно только мысленно) результат при выполнении действия с результатом, когда действие не выполняется. Если два результата отличаются, мы говорим, что действие имеет причинный эффект (влияет, воздействует) на исход. В противном случае мы говорим, что действие не имеет причинного исхода. Эпидемиологи, статистики, экономисты и социологи действие часто называют вмешательством, воздействием или лечением.

IT в Москве

Презентации демо-дня от ICT Moscow. Довольно симпатичное событие получилось, и интересные компании были представлены. Даже выступление Микрософт (видимо, спонсора) было вполне по делу.

Sunday, December 23, 2018

О Tensorflow

Еще один учебный материал: Easy TensorFlow

См. также другие публикации, посвященные Tensorflow

C'est la vie

«Умные» города в РФ могут быть созданы на базе сотен разрозненных цифровых платформ

Минстрой России не планирует вводить какой-либо единой платформы для реализации федерального проекта «Умный город» в российских муниципалитетах, сообщают СМИ со ссылкой на замглавы ведомства Андрея Чибиса. По его словам, хотя участникам будут предложены варианты готовых цифровых решений, однако, у каждого города будет возможность развивать свои виртуальные системы для имеющейся городской инфраструктуры.

«Спустить городам какую-то единую платформу — это ошибка. Мы не будем настаивать на единой платформе. Мы сформулируем, что функционально должно быть, и сразу предложим, чтобы протокол обмена данными позволял эти данные отправлять наверх», — цитирует замминистра ТАСС.

К слову, Минстрой намерен сделать участие в «smart»-программе обязательным для городов с населением свыше 100 тысяч человек, сообщает Интерфакс со ссылкой на материалы профильной конференции, состоявшейся в ведомстве 20 декабря. По данным переписи населения 2010 года, в России насчитывалось 163 таких города.

Отсюда

Все, что вы хотели знать о стандартизации в России, но боялись спросить ...

Sunday, December 16, 2018

Wednesday, December 12, 2018

Говно-QIWI

Все, что нужно знать о российских финансовых сервисах:

Уважаемый клиент!

Уведомляем Вас о том, что, в соответствии с п. 5.4.4 Публичной Оферты, Киви Банк (АО) имеет право, в случае, если Клиент не использует ЭДС в течение 1 (одного) календарного года, расторгнуть Договор, заключенный с Клиентом в одностороннем порядке и по истечению 2 (двух) календарных недель с момента присвоения Банком данному ЭСП статуса Неактивного признать остаток ЭДС в качестве дохода Банка. На основании данного пункта Оферты Ваш кошелек xxxxxxxx был блокирован, денежные средства в сумме 0.31 руб. 11.12.2018 г. списаны в доход Киви Банк (АО).

Регистрировался когда-то в Рапида, а теперь это какие-то говенные Киви

Ну хоть теперь у банка пойдут дела?

3D генерация

Интересная статья о создании 3D изображений. Как живые.

См. также другие публикации, посвященные GAN

Sunday, December 09, 2018

INJOIT vol. 6, no. 12

Вышел новый номер журнала INJOIT. Это двенадцатый номер в 2018 году. Тематический выпуск: избранные статьи конференции ИТМО.

Темы статей:

  • Противодействие скрытому деструктивному воздействию в роях беспилотных летательных аппаратов
  • Анализ и прогнозирование для рынков труда на основе онлайн-данных
  • Некоторые вопросы функционирования и построения сенсорных вопросно-ответных систем
  • Формализация определения связей показателей в модели оценивания качества сложных объектов
  • Проблемы и перспективы профессиональной подготовки лингвотехнолога
  • Конвергентный синтез когнитивной модели на основе глубокого обучения и квантовых семантик
  • Применение методов количественной обработки цифровых данных в науковедческих исследованиях (на примере исследования влияния научных идей Г.Ф. Гаузе на развитие науки)
  • Исследование терминологической базы междисциплинарного научного направления «цифровая экономика» с использованием инструментов контекстного анализа
  • Цифровая культура как область междисциплинарных исследований: методологические подходы и тенденции развития
  • Информационная карта как основа информационно-аналитической системы обеспечения сохранности библиотечных коллекций
  • Development of Corpus-Based Tatar-Russian Socio-Political Dictionary of Collocations
  • Критерии отбора ИТ-проектов с опорой на концепцию общественных ценностей
  • Метод определения русскоязычных фейковых новостей с использованием элементов искусственного интеллекта
  • Модель электронного управления как система обратной связи с гражданами в концепции «Умный город»
  • Анализ социальной эффективности портала «Наш Город Москва»

Архив журнала находится здесь.

/via Лаборатория ОИТ

Умный город

Saturday, December 08, 2018

И ты, Брут ...

Facebook предоставлял некоторым разработчикам прямой доступ к пользовательским данным. Всем остальным - рассказывали про написание "умных" приложений, которые, якобы, и собирали данные.

Вот здесь еще окно в ад, из которого можно многое узнать по существу вопроса

P.S. Как писали классики, все крупные современные состояния нажиты самым бесчестным путем ...

Космоснимки

Friday, December 07, 2018

Wednesday, November 28, 2018

Thursday, November 22, 2018

Не о деньгах

Поскольку криптовалюты выходят из моды, то самое время вернуться к истокам блокчейн - распределенному регистру

См. также другие публикации, посвященные blockchain

Карта знаний

Что должны знать домохозяйки менеджеры о data science - MindMap

Wednesday, November 21, 2018

Практика Python

Несколько интересных ссылок

1. Визуализация на Python. Интересная классификация инструментов.

2. Statsmodels. Статистика в Python.

3. учебник по Sci-Kit. Возможно, самый простой в использовании пакет для машинного обучения.

P & R

Friday, November 16, 2018

Wednesday, November 14, 2018

Keras - в жизнь

Пара примеров использования Keras:

CNN в Keras

RNN в Keras

См. также другие работы, посвященные Keras или deep learning

Как это было?

Как сделали Трампа? О том, как работала компания Cambridge Analytica, которой и приписывается успех Трампа на выборах.

P.S. то, что данные, по их словам, были собраны одним небольшим приложением, которое пользователи загружали добровольно - это, конечно, смех. Данные, очевидно, продал FB. Это бизнес, ничего личного.

Thursday, November 08, 2018

Wednesday, November 07, 2018

Азы ML

Основные алгоритмы машинного обучения. Привлекает краткостью и ясностью изложения.

См. также другие публикации по теме machine learning

INJOIT vol. 6, no. 11

Вышел новый номер журнала INJOIT. Это одиннадцатый номер в 2018 году. Тема года - цифровая экономика. Также ожидаем много статей по транспортной тематике.

Темы статей:

  • An approach to the classification of the loops of finite automata. Part II: The classification of the states based on the loops
  • Tree Traversal to Achieve Generalization for Data De-identification
  • Об усложнении дискретного логарифмирования в полях характеристики 2
  • Оптимизационная методика выбора частот для получения RGB-представления результатов спектральной декомпозиции
  • Виртуализация сетевых функций NVF как аналог параллельных сетей в эпоху коммутации каналов
  • Экспериментальное исследование трех вариантов реализации метода неравномерных покрытий для систем с общей памятью
  • Цифровая трансформация процессов нормативного регулирования: тенденции, подходы и решения
  • Построение онтологических связей в области знаний на основании поиска и анализа текстовых ссылок
  • Концептуализация понятий, используемых в исследованиях «умного города» и «электронного управления»: опыт наукометрического анализа
  • Системно-комплексный подход при накоплении знаний в предметной области биомедицины
  • Онтологизация данных Европейского союза как переход от экономики данных к экономике знаний
  • Онтологии системы систем в национальных стандартах цифровой железной дороги Великобритании

Архив журнала находится здесь.

/via Лаборатория ОИТ

Apache Beam

Универсальная модель обработки данных - Apache Beam

Tuesday, November 06, 2018

Практическое применение анализа текстов

Вполне практическое применение машинного обучения в анализе текстов - определение фальшивых заявлений в полиции

Умные грабли

Утвержден паспорт ведомственного проекта «Умный город». А архитектуры так и нет. Снова банк решений. Кейсов, как менеджеры любят говорить. То есть, каждое решение будет реализовывать свою базу данных, свою среду передачи, свою систему безопасности и т.д. Потом откроется, что данные нужно объединять, а все попарно разное и так далее. Все как всегда.

Monday, November 05, 2018

Аномальности

Определение аномалий с помощью Apache MXNet

См. также другие публикации, посвященные MXNet

На что положиться?

Выбор признаков в задачах машинного обучения. В двух частях: работа с цифровыми данными и работа с категориями.

См. также другие публикации, посвященные feature selection

Wednesday, October 31, 2018

Соседская уведомлялка

Интересная идея: уведомления внутри маленьких групп горожан, когда кто-то группы находится в выбранном месте (например, в парке). Смысл - побудить собраться вместе.

Меняем вывеску

Deep Learning -> Differentiable Programming

P.S. "В однобортном? Да вы что? Не знаете, что в однобортном сейчас уже никто не воюет? Безобразие! Война у порога, а мы не готовы! Нет, мы не готовы ... "

Friday, October 26, 2018

Курс ML на русском

Материалы открытого курса от OpenDataScience по машинному обучению

См. также другие публикации по machine learning и поиск онлайн курсов

От А до Я

Пример machine learning pipeline. Полный проект - от сбора данных до получения результата. И интересное обсуждение на YC

См. также другие публикации по теме machine learning

Предсказатель

Как Google, но только для предиктивной аналитики - Endor. Вот здесь есть история продукта.

Tuesday, October 23, 2018

OpenReview

Еще один хороший источник с текстами статей - OpenReview. В частности, много материалов с NIPS.

Музыкальная пауза

Глубинное обучение для тегирования музыкальных файлов. Описание моделей и тексты на Python.

См. также другие публикации, посвященные deep learning

Sunday, October 21, 2018

Думай по-Байесовски

Think Bayes: Bayesian Statistics Made Simple - хорошая книга в открытом доступе

См. также другие публикации о доступных книгах

P.S. И интересная дискуссия на YC

Saturday, October 20, 2018

Поиск ботов в Twitter

Определение ботов в Twitter. Как классифицирующий признак использовали регулярность отправки сообщений и статичность (похожесть) текстов. Исходные датасеты доступны. Ну и понятно, какие боты в итоге были определены.

Thursday, October 18, 2018

Пространственно-временные прогнозы

Как прогнозируют в Uber

Вообще, инженерный отдел компании выпускает довольно много интересных работ. См. другие публикации, посвященные анализу данных в Uber

Рекомендации нового

Очень интересная статья по рекомендательным системам - не порекомендовать что-то из имеющегося, а порекомендовать, что создать нового.

Monday, October 08, 2018

INJOIT vol. 6, no. 10

Вышел новый номер журнала INJOIT. Это десятый номер в 2018 году. Тема года - цифровая экономика. Также ожидаем много статей по транспортной тематике.

Темы статей:

  • О проблеме замыкания пространственных моментов в модели стационарных биологических сообществ
  • Алгоритм решения задачи обратного стресс-тестирования кредитного портфеля банка на основе системно-динамических моделей заемщиков
  • Оценка пассажиропотока для новых линий железной дороги в Московском регионе
  • Применение параллельных алгоритмов решения проблемы булевой выполнимости для криптоанализа сжимающего и самосжимающего генераторов ключевого потока
  • Сравнительный анализ генераторов псевдослучайных чисел для решения задач рендеринга методом Монте-Карло
  • Особенности защиты информации в Интернете вещей
  • Агрокультура 4.0: синергия системы - систем, онтологии, интернета вещей и космических технологий

Архив журнала находится здесь.

GNN

Thursday, September 27, 2018

Deep Learning на практике

Интересный практический пример использования deep learning для определения сердечных патологий на изображениях. Много интересных моментов, включая обучение сети на очень малом количестве изображений.

См. также другие публикации по теме deep learning

О Кассандре

Краткое описание Cassandra

См. также другие записи, посвященные Cassandra

Saturday, September 22, 2018

Бег по кругу

Цифровой экономики нет и не будет. Все, что нужно знать о профильном министре и Аналитическом центре правительства (откуда этот министр и вышел) - в этой заметке. "Данные бывают разных видов: медицинские, промышленные, мультимедиа, естественного языка, данные устройств и сенсоров – все они разные, имеют различную природу" - какие уж тут цифровые платформы ...

Friday, September 21, 2018

Tuesday, September 18, 2018

Auto ML

Автоматизация машинного обучения от RapidMiner. Регрессия и дерево решений для набора данных без программирования. Просто в браузере.

ICT.Moscow

Инфо-коммуникационные технологии в Москве - события

Friday, September 14, 2018

Шаблоны во временных рядах

Конвергентные технологии 2018

Продолжается прием научных докладов для участия в высокорейтинговой III Международной научной конференции «Конвергентные когнитивно-информационные технологии», которая состоится 22-25 ноября 2018 года на базе факультета ВМК Московского государственного университета имени М.В.Ломоносова.

По результатам работы конференции отобранные тексты докладов будут опубликованы в Международном научном журнале «Современные информационные технологии и ИТ-образование» (ISSN 2411-1473), который включен в Перечень ВАК Минобрнауки РФ. С целью повышения видимости публикаций конференции для международного научного сообщества избранные научные доклады конференции будут опубликованы в издательстве Springer в виде отдельной книги (выпуска) в серии Communications in Computer and Information Science (CCIS) и проиндексированы базах Web of Science и Scopus.

Представленные статьи, не включённые в журнал или в сборник избранных научных трудов, индексируемый в Web of Science и SCOPUS, по решению Программного комитета будут опубликованы в электронном сборнике научных трудов конференции и проиндексированы в РИНЦ.

Для участия в конференции необходимо заполнить регистрационную форму (Тип регистрации и варианты регистрации) для авторов в срок до 30 сентября 2018 года

ЗАГРУЗКА финальных версий научных докладов на сайт конференции продлена до 30 сентября 2018 года.

С уважением, Оргкомитет

Thursday, September 13, 2018

Визуальный анализ данных

Facets - инструментарий визуализации данных для машинного обучения. Визуальный подбор признаков. Совместное производство Google и PAIR. Вот есть еще описание на русском языке.

См. также другие публикации визуализации

Большие деревья

Tuesday, September 11, 2018

Компьютерное зрение

Бизнес-приложения для computer vision

Нейро-эволюция

Neuroevolution - другой взгляд на deep learning. Кто сказал, что архитектура сети должна быть фиксирована? Ее также нужно подбирать.

См. также другие публикации по deep learning

Tuesday, September 04, 2018

AML

Airbnb об автоматизации задач машинного обучения. Реально, автоматизация - это будущее для machine learning

INJOIT vol. 6, no. 9

Вышел новый номер журнала INJOIT. Это девятый номер в 2018 году. Тема года - цифровая экономика. Также ожидаем много статей по транспортной тематике.

Темы статей:

  • On the extension of the finite automata class for context-free languages specification
  • An approach to the classification of the loops of finite automata. Part I: Long corresponding loops
  • Riemann-Liouville fractional operators with generalized Bessel-Maitland function as its kernel
  • Direct Manipulation of B-Spline
  • Об одной задаче, возникающей при применении метода повторного квантования к линейным дифференциальным уравнениям с голоморфными коэффициентами
  • Выбор математической модели: баланс между сложностью и близостью к измерениям
  • Разработка прогрессивного web-приложения для системы управления push-уведомлениями

Архив журнала находится здесь.

/via Лаборатория ОИТ

Saturday, September 01, 2018

Вероятностные графические модели

Материалы к Стенфордскому курсу CS-288. И живое обсуждение этой темы на YC

См. также другие публикации по курсам из Стенфорда

Информационное моделирование

Как выглядит информационное моделирование на практике. Компания АСЭ - один мировых лидеров в этом направлении.

См. также другие статьи, посвященные BIM

Friday, August 31, 2018

Facebook-читатель

FastText - библиотека классификации текстов от Facebook. И натренированные шаблоны для 90 языков.

IoT Big Data

Стандарт GSMA для обработки больших данных в IoT. Вот здесь есть информация о запуске проекта. А вот здесь есть проектные онтологии.

Wednesday, August 29, 2018

Что будет?

Стратегия Google (русский перевод аналитического обзора)

Все для пользователей

Как Uber использует искусственный интеллект в поддержке пользователей. Автоматический анализ пользовательских запросов. Вот здесь есть еще о применении AI в customer care: 1 & 2.

См. также другие публикации по теме AI

Весь Гарвард

На одной странице: все лекции курса CS50 - основы программирования. На русском языке.

Tuesday, August 28, 2018

Monday, August 27, 2018

Friday, August 24, 2018

Бордюры 2.0

Это идея, которая должна быть хорошо воспринята в Москве. Изменяемые модульные тротуары. Идея перекладки бордюров, доведенная до технического совершенства.

Обработка временных рядов

Хороший практический пример анализа временных рядов на Python

См. также другие публикации по теме time series

Tuesday, August 21, 2018

Байесовский вывод

Хорошее объяснение: How Bayesian inference works

P.S. Баейс в блоге Abava

Sci-Kit A-Z

Пример использования SciKit. Полный цикл для системы машинного обучения - от очистки данных до сравнения моделей.

Monday, August 20, 2018

Tuesday, August 14, 2018

*SQL

Терминология - это наше все. Был SQL, затем NoSQL, теперь вот NewSQL

Monday, August 13, 2018

Умное г*вно

Именно так. Стартапы, которые оценивают здоровье в Умном городе по отборам образцов из канализации.

100 российских журналов - июль 2018

По данным Google Scholar: самые популярные статьи в журнале INJOIT

А сам журнал INJOIT входит в 100 ведущих российских журналов. Сейчас это позиция 48: Международный журнал открытых информационных технологий

В 2016 году мы были на 62 месте

Sunday, August 12, 2018

Вы пишите

И вам зачтется. Сбербанк предлагает писать стихи. За деньги.

Интересно, что вот здесь, например, описана довольно точная поэтическая модель. Читают ли участники литературу по специальности? Кстати, вполне могут. И сейчас смеются над Сбербанком.

Чужие данные

Friday, August 10, 2018

Каждый так может

Использование машинного обучения для "повседневных" задач. Ну не знаю. Нужно, мне кажется, отметить, что раньше трава была зеленее использованию регрессии не придавалось столько пафоса ...

P.S. Вот и в дискуссии на YC с этим соглашаются

Анализ данных в торговле

Толковое описание Top 10 Data Science Use Cases in Retail

Thursday, August 09, 2018

Monday, August 06, 2018

С трезвым крестьянским рассудком

Почему документооборот на блокчейн лишен смысла. Хотя, на мой взгляд, точка зрения несколько экстремистская. Правильно было бы сказать - юридически-значимый лишен смысла, пока государство это не признает. А если участники договорились признавать, то почему нет.

P.S. другие публикации по теме блокчейн

Велопрокат 2.0

В следующем поколении систем велопроката нет станций. Велосипед можно взять там, где его оставил предыдущий пользователь. Кстати, совсем поменяются и математические модели

Friday, August 03, 2018

Словарь анализа данных

Полезный материал на Kaggle: Glossary of data science models, techniques and tools shared on kaggle kernels. Примеры кода для моделей, подходов и инструментальных средств.

См. также другие публикации, посвященные Kaggle

Анализ логов

Хороший практический пример анализа веб-логов. Что можно извлечь из статистики скачиваний.

Thursday, August 02, 2018

Что будет?

Рекуррентные сети для предсказания поведения пользователей

См. также другие публикации по RNN

III Международная научная конференция «Конвергентные когнитивно-информационные технологии»


Московский государственный университет имени М.В. Ломоносова
November 22, 2018 – November 25, 2018

Международная научная конференция «Конвергентные когнитивно-информационные технологии» предназначена для интеграции усилий ученых и специалистов разных стран с целью повышения эффективности исследовательской деятельности и ускорения практического освоения научного и технологического потенциала когнитивно-информационных технологий в науке, технологиях, экономики, подготовке научных кадров.

Задачи конференции:

способствовать научным исследованиям в области теоретической информатики, прикладной математики и компьютерных наук, направленным на развитие научных основ когнитивно-информационных технологий; способствовать развитию научно-исследовательской и инновационной деятельности в области конвергентных когнитивно-информационных технологий и их приложений; способствовать интеграции усилий в исследовательской деятельности, а также в разработке стандартов в таких «горячих» направлениях, как Интернет вещей, Большие данные, умные города, технологии цифровой экономики.
Научная программа конференции предполагает работу по следующим тематическим направлениям:

Секция 1. Теоретические вопросы информатики, вычислительной математики, компьютерных наук и когнитивно-информационных технологий.

Секция 2. Параллельное и распределенное программирование, грид-технологии, программирование на графических процессорах.

Секция 3. Когнитивные информационные технологии в системах управления.

Секция 4. Большие данные и приложения.

Секция 5. Интернет вещей (Internet of Things - IoT): стандарты, коммуникационные и информационные технологии, сетевые приложения.

Секция 6. Умные города (Smart Cities): стандарты, когнитивно-информационные технологии и их приложения.

Секция 7. Когнитивно-информационные технологии в цифровой экономике.

Секция 8. Цифровая трансформация транспорта.

Секция 9. Прикладные проблемы оптимизации.

Срок подачи работ - 10 сентября. Детали - здесь

Wednesday, August 01, 2018

INJOIT vol. 6, no. 8

Вышел новый номер журнала INJOIT. Это восьмой номер в 2018 году. Тема года - цифровая экономика. Также ожидаем много статей по транспортной тематике.

Темы статей:

  • Применение метода ветвей и границ в задаче восстановления матрицы расстояний между цепочками ДНК
  • Классификационная характеристика для задач обработки разнородных данных
  • Об использовании компьютерных моделей при изучении автоволновых процессов
  • Change 2D to 3D In Image Processing Biotechnology
  • Перспективы внедрения технологии блокчейн в современную систему образования
  • BIM и инженерные формализованные онтологии на цифровой железной дороге Европы в объединении EULYNX - экономика данных
  • К вопросу об эффектах применения формализованных онтологий в экономике данных – опыт ЕС

Архив журнала находится здесь.

/via Лаборатория ОИТ

Отречемся от старого мира

JQuery - на слом. Github.com отказывается от использования jQuery и переходит на чистый JavaScript