Friday, December 28, 2018

Разные потоки

Сравнение Kafka и RabitMQ

См. также другие публикации, посвященные Kafka

На службе закона

Где рванет?. Модель для предсказания следующего места совершения преступления.

См. также другие публикации по схожей тематике: spatio-temporal models

Tuesday, December 25, 2018

И снова о причинах

Интересная книга (черновик) в открытом доступе: Causal Inference

Мы сравниваем (обычно только мысленно) результат при выполнении действия с результатом, когда действие не выполняется. Если два результата отличаются, мы говорим, что действие имеет причинный эффект (влияет, воздействует) на исход. В противном случае мы говорим, что действие не имеет причинного исхода. Эпидемиологи, статистики, экономисты и социологи действие часто называют вмешательством, воздействием или лечением.

IT в Москве

Презентации демо-дня от ICT Moscow. Довольно симпатичное событие получилось, и интересные компании были представлены. Даже выступление Микрософт (видимо, спонсора) было вполне по делу.

Sunday, December 23, 2018

О Tensorflow

Еще один учебный материал: Easy TensorFlow

См. также другие публикации, посвященные Tensorflow

C'est la vie

«Умные» города в РФ могут быть созданы на базе сотен разрозненных цифровых платформ

Минстрой России не планирует вводить какой-либо единой платформы для реализации федерального проекта «Умный город» в российских муниципалитетах, сообщают СМИ со ссылкой на замглавы ведомства Андрея Чибиса. По его словам, хотя участникам будут предложены варианты готовых цифровых решений, однако, у каждого города будет возможность развивать свои виртуальные системы для имеющейся городской инфраструктуры.

«Спустить городам какую-то единую платформу — это ошибка. Мы не будем настаивать на единой платформе. Мы сформулируем, что функционально должно быть, и сразу предложим, чтобы протокол обмена данными позволял эти данные отправлять наверх», — цитирует замминистра ТАСС.

К слову, Минстрой намерен сделать участие в «smart»-программе обязательным для городов с населением свыше 100 тысяч человек, сообщает Интерфакс со ссылкой на материалы профильной конференции, состоявшейся в ведомстве 20 декабря. По данным переписи населения 2010 года, в России насчитывалось 163 таких города.

Отсюда

Все, что вы зотели знать о стандартизации в России, но боялись спросить ...

Wednesday, December 12, 2018

Говно-QIWI

Все, что нужно знать о российских финансовых сервисах:

Уважаемый клиент!

Уведомляем Вас о том, что, в соответствии с п. 5.4.4 Публичной Оферты, Киви Банк (АО) имеет право, в случае, если Клиент не использует ЭДС в течение 1 (одного) календарного года, расторгнуть Договор, заключенный с Клиентом в одностороннем порядке и по истечению 2 (двух) календарных недель с момента присвоения Банком данному ЭСП статуса Неактивного признать остаток ЭДС в качестве дохода Банка. На основании данного пункта Оферты Ваш кошелек xxxxxxxx был блокирован, денежные средства в сумме 0.31 руб. 11.12.2018 г. списаны в доход Киви Банк (АО).

Регистрировался когда-то в Рапида, а теперь это какие-то говенные Киви

Ну хоть теперь у банка пойдут дела?

3D генерация

Интересная статья о создании 3D изображений. Как живые.

См. также другие публикации, посвященные GAN

Sunday, December 09, 2018

INJOIT vol. 6, no. 12

Вышел новый номер журнала INJOIT. Это двенадцатый номер в 2018 году. Тематический выпуск: избранные статьи конференции ИТМО.

Темы статей:

  • Противодействие скрытому деструктивному воздействию в роях беспилотных летательных аппаратов
  • Анализ и прогнозирование для рынков труда на основе онлайн-данных
  • Некоторые вопросы функционирования и построения сенсорных вопросно-ответных систем
  • Формализация определения связей показателей в модели оценивания качества сложных объектов
  • Проблемы и перспективы профессиональной подготовки лингвотехнолога
  • Конвергентный синтез когнитивной модели на основе глубокого обучения и квантовых семантик
  • Применение методов количественной обработки цифровых данных в науковедческих исследованиях (на примере исследования влияния научных идей Г.Ф. Гаузе на развитие науки)
  • Исследование терминологической базы междисциплинарного научного направления «цифровая экономика» с использованием инструментов контекстного анализа
  • Цифровая культура как область междисциплинарных исследований: методологические подходы и тенденции развития
  • Информационная карта как основа информационно-аналитической системы обеспечения сохранности библиотечных коллекций
  • Development of Corpus-Based Tatar-Russian Socio-Political Dictionary of Collocations
  • Критерии отбора ИТ-проектов с опорой на концепцию общественных ценностей
  • Метод определения русскоязычных фейковых новостей с использованием элементов искусственного интеллекта
  • Модель электронного управления как система обратной связи с гражданами в концепции «Умный город»
  • Анализ социальной эффективности портала «Наш Город Москва»

Архив журнала находится здесь.

/via Лаборатория ОИТ

Умный город

Saturday, December 08, 2018

И ты, Брут ...

Facebook предоставлял некоторым разработчикам прямой доступ к пользовательским данным. Всем остальным - рассказывали про написание "умных" приложений, которые, якобы, и собирали данные.

Вот здесь еще окно в ад, из которого можно многое узнать по существу вопроса

P.S. Как писали классики, все крупные современные состояния нажиты самым бесчестным путем ...

Космоснимки

Friday, December 07, 2018

Wednesday, November 28, 2018

Thursday, November 22, 2018

Не о деньгах

Поскольку криптовалюты выходят из моды, то самое время вернуться к истокам блокчейн - распределенному регистру

См. также другие публикации, посвященные blockchain

Карта знаний

Что должны знать домохозяйки менеджеры о data science - MindMap

Wednesday, November 21, 2018

Практика Python

Несколько интересных ссылок

1. Визуализация на Python. Интересная классификация инструментов.

2. Statsmodels. Статистика в Python.

3. учебник по Sci-Kit. Возможно, самый простой в использовании пакет для машинного обучения.

P & R

Friday, November 16, 2018

Wednesday, November 14, 2018

Keras - в жизнь

Пара примеров использования Keras:

CNN в Keras

RNN в Keras

См. также другие работы, посвященные Keras или deep learning

Как это было?

Как сделали Трампа? О том, как работала компания Cambridge Analytica, которой и приписывается успех Трампа на выборах.

P.S. то, что данные, по их словам, были собраны одним небольшим приложением, которое пользователи загружали добровольно - это, конечно, смех. Данные, очевидно, продал FB. Это бизнес, ничего личного.

Thursday, November 08, 2018

Wednesday, November 07, 2018

Азы ML

Основные алгоритмы машинного обучения. Привлекает краткостью и ясностью изложения.

См. также другие публикации по теме machine learning

INJOIT vol. 6, no. 11

Вышел новый номер журнала INJOIT. Это одиннадцатый номер в 2018 году. Тема года - цифровая экономика. Также ожидаем много статей по транспортной тематике.

Темы статей:

  • An approach to the classification of the loops of finite automata. Part II: The classification of the states based on the loops
  • Tree Traversal to Achieve Generalization for Data De-identification
  • Об усложнении дискретного логарифмирования в полях характеристики 2
  • Оптимизационная методика выбора частот для получения RGB-представления результатов спектральной декомпозиции
  • Виртуализация сетевых функций NVF как аналог параллельных сетей в эпоху коммутации каналов
  • Экспериментальное исследование трех вариантов реализации метода неравномерных покрытий для систем с общей памятью
  • Цифровая трансформация процессов нормативного регулирования: тенденции, подходы и решения
  • Построение онтологических связей в области знаний на основании поиска и анализа текстовых ссылок
  • Концептуализация понятий, используемых в исследованиях «умного города» и «электронного управления»: опыт наукометрического анализа
  • Системно-комплексный подход при накоплении знаний в предметной области биомедицины
  • Онтологизация данных Европейского союза как переход от экономики данных к экономике знаний
  • Онтологии системы систем в национальных стандартах цифровой железной дороги Великобритании

Архив журнала находится здесь.

/via Лаборатория ОИТ

Apache Beam

Универсальная модель обработки данных - Apache Beam

Tuesday, November 06, 2018

Практическое применение анализа текстов

Вполне практическое применение машинного обучения в анализе текстов - определение фальшивых заявлений в полиции

Умные грабли

Утвержден паспорт ведомственного проекта «Умный город». А архитектуры так и нет. Снова банк решений. Кейсов, как менеджеры любят говорить. То есть, каждое решение будет реализовывать свою базу данных, свою среду передачи, свою систему безопасности и т.д. Потом откроется, что данные нужно объединять, а все попарно разное и так далее. Все как всегда.

Monday, November 05, 2018

Аномальности

Определение аномалий с помощью Apache MXNet

См. также другие публикации, посвященные MXNet

На что положиться?

Выбор признаков в задачах машинного обучения. В двух частях: работа с цифровыми данными и работа с категориями.

См. также другие публикации, посвященные feature selection

Wednesday, October 31, 2018

Соседская уведомлялка

Интересная идея: уведомления внутри маленьких групп горожан, когда кто-то группы находится в выбранном месте (например, в парке). Смысл - побудить собраться вместе.

Меняем вывеску

Deep Learning -> Differentiable Programming

P.S. "В однобортном? Да вы что? Не знаете, что в однобортном сейчас уже никто не воюет? Безобразие! Война у порога, а мы не готовы! Нет, мы не готовы ... "

Friday, October 26, 2018

Курс ML на русском

Материалы открытого курса от OpenDataScience по машинному обучению

См. также другие публикации по machine learning и поиск онлайн курсов

От А до Я

Пример machine learning pipeline. Полный проект - от сбора данных до получения результата. И интересное обсуждение на YC

См. также другие публикации по теме machine learning

Предсказатель

Как Google, но только для предиктивной аналитики - Endor. Вот здесь есть история продукта.

Tuesday, October 23, 2018

OpenReview

Еще один хороший источник с текстами статей - OpenReview. В частности, много материалов с NIPS.

Музыкальная пауза

Глубинное обучение для тегирования музыкальных файлов. Описание моделей и тексты на Python.

См. также другие публикации, посвященные deep learning

Sunday, October 21, 2018

Думай по-Байесовски

Think Bayes: Bayesian Statistics Made Simple - хорошая книга в открытом доступе

См. также другие публикации о доступных книгах

P.S. И интересная дискуссия на YC

Saturday, October 20, 2018

Поиск ботов в Twitter

Определение ботов в Twitter. Как классифицирующий признак использовали регулярность отправки сообщений и статичность (похожесть) текстов. Исходные датасеты доступны. Ну и понятно, какие боты в итоге были определены.

Thursday, October 18, 2018

Пространственно-временные прогнозы

Как прогнозируют в Uber

Вообще, инженерный отдел компании выпускает довольно много интересных работ. См. другие публикации, посвященные анализу данных в Uber

Рекомендации нового

Очень интересная статья по рекомендательным системам - не порекомендовать что-то из имеющегося, а порекомендовать, что создать нового.

Monday, October 08, 2018

INJOIT vol. 6, no. 10

Вышел новый номер журнала INJOIT. Это десятый номер в 2018 году. Тема года - цифровая экономика. Также ожидаем много статей по транспортной тематике.

Темы статей:

  • О проблеме замыкания пространственных моментов в модели стационарных биологических сообществ
  • Алгоритм решения задачи обратного стресс-тестирования кредитного портфеля банка на основе системно-динамических моделей заемщиков
  • Оценка пассажиропотока для новых линий железной дороги в Московском регионе
  • Применение параллельных алгоритмов решения проблемы булевой выполнимости для криптоанализа сжимающего и самосжимающего генераторов ключевого потока
  • Сравнительный анализ генераторов псевдослучайных чисел для решения задач рендеринга методом Монте-Карло
  • Особенности защиты информации в Интернете вещей
  • Агрокультура 4.0: синергия системы - систем, онтологии, интернета вещей и космических технологий

Архив журнала находится здесь.

GNN

Thursday, September 27, 2018

Deep Learning на практике

Интересный практический пример использования deep learning для определения сердечных патологий на изображениях. Много интересных моментов, включая обучение сети на очень малом количестве изображений.

См. также другие публикации по теме deep learning

О Кассандре

Краткое описание Cassandra

См. также другие записи, посвященные Cassandra

Saturday, September 22, 2018

Бег по кругу

Цифровой экономики нет и не будет. Все, что нужно знать о профильном министре и Аналитическом центре правительства (откуда этот министр и вышел) - в этой заметке. "Данные бывают разных видов: медицинские, промышленные, мультимедиа, естественного языка, данные устройств и сенсоров – все они разные, имеют различную природу" - какие уж тут цифровые платформы ...

Friday, September 21, 2018

Tuesday, September 18, 2018

Auto ML

Автоматизация машинного обучения от RapidMiner. Регрессия и дерево решений для набора данных без программирования. Просто в браузере.

ICT.Moscow

Инфо-коммуникационные технологии в Москве - события

Friday, September 14, 2018

Шаблоны во временных рядах

Конвергентные технологии 2018

Продолжается прием научных докладов для участия в высокорейтинговой III Международной научной конференции «Конвергентные когнитивно-информационные технологии», которая состоится 22-25 ноября 2018 года на базе факультета ВМК Московского государственного университета имени М.В.Ломоносова.

По результатам работы конференции отобранные тексты докладов будут опубликованы в Международном научном журнале «Современные информационные технологии и ИТ-образование» (ISSN 2411-1473), который включен в Перечень ВАК Минобрнауки РФ. С целью повышения видимости публикаций конференции для международного научного сообщества избранные научные доклады конференции будут опубликованы в издательстве Springer в виде отдельной книги (выпуска) в серии Communications in Computer and Information Science (CCIS) и проиндексированы базах Web of Science и Scopus.

Представленные статьи, не включённые в журнал или в сборник избранных научных трудов, индексируемый в Web of Science и SCOPUS, по решению Программного комитета будут опубликованы в электронном сборнике научных трудов конференции и проиндексированы в РИНЦ.

Для участия в конференции необходимо заполнить регистрационную форму (Тип регистрации и варианты регистрации) для авторов в срок до 30 сентября 2018 года

ЗАГРУЗКА финальных версий научных докладов на сайт конференции продлена до 30 сентября 2018 года.

С уважением, Оргкомитет

Thursday, September 13, 2018

Визуальный анализ данных

Facets - инструментарий визуализации данных для машинного обучения. Визуальный подбор признаков. Совместное производство Google и PAIR. Вот есть еще описание на русском языке.

См. также другие публикации визуализации

Большие деревья

Tuesday, September 11, 2018

Компьютерное зрение

Бизнес-приложения для computer vision

Нейро-эволюция

Neuroevolution - другой взгляд на deep learning. Кто сказал, что архитектура сети должна быть фиксирована? Ее также нужно подбирать.

См. также другие публикации по deep learning