Wednesday, November 21, 2018

Практика Python

Несколько интересных ссылок

1. Визуализация на Python. Интересная классификация инструментов.

2. Statsmodels. Статистика в Python.

3. учебник по Sci-Kit. Возможно, самый простой в использовании пакет для машинного обучения.

P & R

Friday, November 16, 2018

Wednesday, November 14, 2018

Keras - в жизнь

Пара примеров использования Keras:

CNN в Keras

RNN в Keras

См. также другие работы, посвященные Keras или deep learning

Как это было?

Как сделали Трампа? О том, как работала компания Cambridge Analytica, которой и приписывается успех Трампа на выборах.

P.S. то, что данные, по их словам, были собраны одним небольшим приложением, которое пользователи загружали добровольно - это, конечно, смех. Данные, очевидно, продал FB. Это бизнес, ничего личного.

Thursday, November 08, 2018

Wednesday, November 07, 2018

Азы ML

Основные алгоритмы машинного обучения. Привлекает краткостью и ясностью изложения.

См. также другие публикации по теме machine learning

INJOIT vol. 6, no. 11

Вышел новый номер журнала INJOIT. Это одиннадцатый номер в 2018 году. Тема года - цифровая экономика. Также ожидаем много статей по транспортной тематике.

Темы статей:

  • An approach to the classification of the loops of finite automata. Part II: The classification of the states based on the loops
  • Tree Traversal to Achieve Generalization for Data De-identification
  • Об усложнении дискретного логарифмирования в полях характеристики 2
  • Оптимизационная методика выбора частот для получения RGB-представления результатов спектральной декомпозиции
  • Виртуализация сетевых функций NVF как аналог параллельных сетей в эпоху коммутации каналов
  • Экспериментальное исследование трех вариантов реализации метода неравномерных покрытий для систем с общей памятью
  • Цифровая трансформация процессов нормативного регулирования: тенденции, подходы и решения
  • Построение онтологических связей в области знаний на основании поиска и анализа текстовых ссылок
  • Концептуализация понятий, используемых в исследованиях «умного города» и «электронного управления»: опыт наукометрического анализа
  • Системно-комплексный подход при накоплении знаний в предметной области биомедицины
  • Онтологизация данных Европейского союза как переход от экономики данных к экономике знаний
  • Онтологии системы систем в национальных стандартах цифровой железной дороги Великобритании

Архив журнала находится здесь.

/via Лаборатория ОИТ

Apache Beam

Универсальная модель обработки данных - Apache Beam

Tuesday, November 06, 2018

Практическое применение анализа текстов

Вполне практическое применение машинного обучения в анализе текстов - определение фальшивых заявлений в полиции

Умные грабли

Утвержден паспорт ведомственного проекта «Умный город». А архитектуры так и нет. Снова банк решений. Кейсов, как менеджеры любят говорить. То есть, каждое решение будет реализовывать свою базу данных, свою среду передачи, свою систему безопасности и т.д. Потом откроется, что данные нужно объединять, а все попарно разное и так далее. Все как всегда.

Monday, November 05, 2018

Аномальности

Определение аномалий с помощью Apache MXNet

См. также другие публикации, посвященные MXNet

На что положиться?

Выбор признаков в задачах машинного обучения. В двух частях: работа с цифровыми данными и работа с категориями.

См. также другие публикации, посвященные feature selection

Wednesday, October 31, 2018

Соседская уведомлялка

Интересная идея: уведомления внутри маленьких групп горожан, когда кто-то группы находится в выбранном месте (например, в парке). Смысл - побудить собраться вместе.

Меняем вывеску

Deep Learning -> Differentiable Programming

P.S. "В однобортном? Да вы что? Не знаете, что в однобортном сейчас уже никто не воюет? Безобразие! Война у порога, а мы не готовы! Нет, мы не готовы ... "

Friday, October 26, 2018

Курс ML на русском

Материалы открытого курса от OpenDataScience по машинному обучению

См. также другие публикации по machine learning и поиск онлайн курсов

От А до Я

Пример machine learning pipeline. Полный проект - от сбора данных до получения результата. И интересное обсуждение на YC

См. также другие публикации по теме machine learning

Предсказатель

Как Google, но только для предиктивной аналитики - Endor. Вот здесь есть история продукта.

Tuesday, October 23, 2018

OpenReview

Еще один хороший источник с текстами статей - OpenReview. В частности, много материалов с NIPS.

Музыкальная пауза

Глубинное обучение для тегирования музыкальных файлов. Описание моделей и тексты на Python.

См. также другие публикации, посвященные deep learning

Sunday, October 21, 2018

Думай по-Байесовски

Think Bayes: Bayesian Statistics Made Simple - хорошая книга в открытом доступе

См. также другие публикации о доступных книгах

P.S. И интересная дискуссия на YC

Saturday, October 20, 2018

Поиск ботов в Twitter

Определение ботов в Twitter. Как классифицирующий признак использовали регулярность отправки сообщений и статичность (похожесть) текстов. Исходные датасеты доступны. Ну и понятно, какие боты в итоге были определены.

Thursday, October 18, 2018

Пространственно-временные прогнозы

Как прогнозируют в Uber

Вообще, инженерный отдел компании выпускает довольно много интересных работ. См. другие публикации, посвященные анализу данных в Uber

Рекомендации нового

Очень интересная статья по рекомендательным системам - не порекомендовать что-то из имеющегося, а порекомендовать, что создать нового.

Monday, October 08, 2018

INJOIT vol. 6, no. 10

Вышел новый номер журнала INJOIT. Это десятый номер в 2018 году. Тема года - цифровая экономика. Также ожидаем много статей по транспортной тематике.

Темы статей:

  • О проблеме замыкания пространственных моментов в модели стационарных биологических сообществ
  • Алгоритм решения задачи обратного стресс-тестирования кредитного портфеля банка на основе системно-динамических моделей заемщиков
  • Оценка пассажиропотока для новых линий железной дороги в Московском регионе
  • Применение параллельных алгоритмов решения проблемы булевой выполнимости для криптоанализа сжимающего и самосжимающего генераторов ключевого потока
  • Сравнительный анализ генераторов псевдослучайных чисел для решения задач рендеринга методом Монте-Карло
  • Особенности защиты информации в Интернете вещей
  • Агрокультура 4.0: синергия системы - систем, онтологии, интернета вещей и космических технологий

Архив журнала находится здесь.

GNN

Thursday, September 27, 2018

Deep Learning на практике

Интересный практический пример использования deep learning для определения сердечных патологий на изображениях. Много интересных моментов, включая обучение сети на очень малом количестве изображений.

См. также другие публикации по теме deep learning

О Кассандре

Краткое описание Cassandra

См. также другие записи, посвященные Cassandra

Saturday, September 22, 2018

Бег по кругу

Цифровой экономики нет и не будет. Все, что нужно знать о профильном министре и Аналитическом центре правительства (откуда этот министр и вышел) - в этой заметке. "Данные бывают разных видов: медицинские, промышленные, мультимедиа, естественного языка, данные устройств и сенсоров – все они разные, имеют различную природу" - какие уж тут цифровые платформы ...

Friday, September 21, 2018

Tuesday, September 18, 2018

Auto ML

Автоматизация машинного обучения от RapidMiner. Регрессия и дерево решений для набора данных без программирования. Просто в браузере.

ICT.Moscow

Инфо-коммуникационные технологии в Москве - события

Friday, September 14, 2018

Шаблоны во временных рядах

Конвергентные технологии 2018

Продолжается прием научных докладов для участия в высокорейтинговой III Международной научной конференции «Конвергентные когнитивно-информационные технологии», которая состоится 22-25 ноября 2018 года на базе факультета ВМК Московского государственного университета имени М.В.Ломоносова.

По результатам работы конференции отобранные тексты докладов будут опубликованы в Международном научном журнале «Современные информационные технологии и ИТ-образование» (ISSN 2411-1473), который включен в Перечень ВАК Минобрнауки РФ. С целью повышения видимости публикаций конференции для международного научного сообщества избранные научные доклады конференции будут опубликованы в издательстве Springer в виде отдельной книги (выпуска) в серии Communications in Computer and Information Science (CCIS) и проиндексированы базах Web of Science и Scopus.

Представленные статьи, не включённые в журнал или в сборник избранных научных трудов, индексируемый в Web of Science и SCOPUS, по решению Программного комитета будут опубликованы в электронном сборнике научных трудов конференции и проиндексированы в РИНЦ.

Для участия в конференции необходимо заполнить регистрационную форму (Тип регистрации и варианты регистрации) для авторов в срок до 30 сентября 2018 года

ЗАГРУЗКА финальных версий научных докладов на сайт конференции продлена до 30 сентября 2018 года.

С уважением, Оргкомитет

Thursday, September 13, 2018

Визуальный анализ данных

Facets - инструментарий визуализации данных для машинного обучения. Визуальный подбор признаков. Совместное производство Google и PAIR. Вот есть еще описание на русском языке.

См. также другие публикации визуализации

Большие деревья

Tuesday, September 11, 2018

Компьютерное зрение

Бизнес-приложения для computer vision

Нейро-эволюция

Neuroevolution - другой взгляд на deep learning. Кто сказал, что архитектура сети должна быть фиксирована? Ее также нужно подбирать.

См. также другие публикации по deep learning

Tuesday, September 04, 2018

AML

Airbnb об автоматизации задач машинного обучения. Реально, автоматизация - это будущее для machine learning

INJOIT vol. 6, no. 9

Вышел новый номер журнала INJOIT. Это девятый номер в 2018 году. Тема года - цифровая экономика. Также ожидаем много статей по транспортной тематике.

Темы статей:

  • On the extension of the finite automata class for context-free languages specification
  • An approach to the classification of the loops of finite automata. Part I: Long corresponding loops
  • Riemann-Liouville fractional operators with generalized Bessel-Maitland function as its kernel
  • Direct Manipulation of B-Spline
  • Об одной задаче, возникающей при применении метода повторного квантования к линейным дифференциальным уравнениям с голоморфными коэффициентами
  • Выбор математической модели: баланс между сложностью и близостью к измерениям
  • Разработка прогрессивного web-приложения для системы управления push-уведомлениями

Архив журнала находится здесь.

/via Лаборатория ОИТ

Saturday, September 01, 2018

Вероятностные графические модели

Материалы к Стенфордскому курсу CS-288. И живое обсуждение этой темы на YC

См. также другие публикации по курсам из Стенфорда

Информационное моделирование

Как выглядит информационное моделирование на практике. Компания АСЭ - один мировых лидеров в этом направлении.

См. также другие статьи, посвященные BIM

Friday, August 31, 2018

Facebook-читатель

FastText - библиотека классификации текстов от Facebook. И натренированные шаблоны для 90 языков.

IoT Big Data

Стандарт GSMA для обработки больших данных в IoT. Вот здесь есть информация о запуске проекта. А вот здесь есть проектные онтологии.

Wednesday, August 29, 2018

Что будет?

Стратегия Google (русский перевод аналитического обзора)

Все для пользователей

Как Uber использует искусственный интеллект в поддержке пользователей. Автоматический анализ пользовательских запросов. Вот здесь есть еще о применении AI в customer care: 1 & 2.

См. также другие публикации по теме AI

Весь Гарвард

На одной странице: все лекции курса CS50 - основы программирования. На русском языке.

Tuesday, August 28, 2018

Friday, August 24, 2018

Бордюры 2.0

Это идея, которая должна быть хорошо воспринята в Москве. Изменяемые модульные тротуары. Идея перекладки бордюров, доведенная до технического совершенства.

Обработка временных рядов

Хороший практический пример анализа временных рядов на Python

См. также другие публикации по теме time series

Tuesday, August 21, 2018

Байесовский вывод

Хорошее объяснение: How Bayesian inference works

P.S. Баейс в блоге Abava

Sci-Kit A-Z

Пример использования SciKit. Полный цикл для системы машинного обучения - от очистки данных до сравнения моделей.

Tuesday, August 14, 2018

*SQL

Терминология - это наше все. Был SQL, затем NoSQL, теперь вот NewSQL

Monday, August 13, 2018

Умное г*вно

Именно так. Стартапы, которые оценивают здоровье в Умном городе по отборам образцов из канализации.

100 российских журналов - июль 2018

По данным Google Scholar: самые популярные статьи в журнале INJOIT

А сам журнал INJOIT входит в 100 ведущих российских журналов. Сейчас это позиция 48: Международный журнал открытых информационных технологий

В 2016 году мы были на 62 месте

Sunday, August 12, 2018

Вы пишите

И вам зачтется. Сбербанк предлагает писать стихи. За деньги.

Интересно, что вот здесь, например, описана довольно точная поэтическая модель. Читают ли участники литературу по специальности? Кстати, вполне могут. И сейчас смеются над Сбербанком.

Чужие данные

Friday, August 10, 2018

Каждый так может

Использование машинного обучения для "повседневных" задач. Ну не знаю. Нужно, мне кажется, отметить, что раньше трава была зеленее использованию регрессии не придавалось столько пафоса ...

P.S. Вот и в дискуссии на YC с этим соглашаются

Анализ данных в торговле

Толковое описание Top 10 Data Science Use Cases in Retail

Thursday, August 09, 2018

Monday, August 06, 2018

С трезвым крестьянским рассудком

Почему документооборот на блокчейн лишен смысла. Хотя, на мой взгляд, точка зрения несколько экстремистская. Правильно было бы сказать - юридически-значимый лишен смысла, пока государство это не признает. А если участники договорились признавать, то почему нет.

P.S. другие публикации по теме блокчейн

Велопрокат 2.0

В следующем поколении систем велопроката нет станций. Велосипед можно взять там, где его оставил предыдущий пользователь. Кстати, совсем поменяются и математические модели

Friday, August 03, 2018

Словарь анализа данных

Полезный материал на Kaggle: Glossary of data science models, techniques and tools shared on kaggle kernels. Примеры кода для моделей, подходов и инструментальных средств.

См. также другие публикации, посвященные Kaggle

Анализ логов

Хороший практический пример анализа веб-логов. Что можно извлечь из статистики скачиваний.