Saturday, March 30, 2013

Куда податься?

BBC представляет справочник эмигранта. Интерактивное руководство - в какой стране какие профессии наиболее востребованы.

Python и Data

Как Python используют для обработки данных. Обзор пакетов и применений по материалам конференции PyData

P.S. DARPA выделила $3 млн. на развитие обработки данных в Python

Thursday, March 28, 2013

Шаблоны движения

Интересная статья, в которой описывается исследование шаблонов движения пользователей на большом массиве анонимных данных. По результатам авторов получается, что каждого пользователя можно идентифицировать по 4-м шаблонам. Иными словами, 4 маршрута в истории перемещения скажут, кто это был.

Вот еще на эту тему статья в BBC. Шаблоны, которые можно выделить из истории перемещения мобильных пользователей достаточно ограничены. Вот одна из пионерских работ Barabasi по предсказанию поведения мобильных пользователей.

Карты Google

Если судить про проекту GTV, то Google серьезно обновил свои карты по России. Для многих городов, где показываются местные новости, появились вполне приличные карты, чего раньше не было.

Wednesday, March 27, 2013

Гео-сетка и Wi-Fi

Geo-fencing - это популярный подход в разработке LBS приложений. Основан на определении некоторой географической области (это и есть та самая гео-ограда), к попаданию в которую (или к покиданию которой) и привязываются действия (сообщения). Например, мобильный пользователь появился в некоторой заданной области (в магазине, например), или, наоборот, покидает ее. В следующей статье описывается подход, когда гео-координаты заменяются информацией о сетевой близости. Иными словами, наша "гео"-сетка описывается удалением от точки доступа Wi-Fi, например: Geofence and Network Proximity

Питоно-портал

Начинаем работать с Python. Учебники, курсы, ссылки - все о Python.

Tuesday, March 26, 2013

Винтик и Шпунтик из MIT

Интересный список "самодельных" проектов из MIT. Например, по ссылке - собственный телефон.

Беспроводные сенсоры и социальные сети

Можем мы переопределить понятие check-in? И взять за основу не географические координаты места, а доступную картину сетевого окружения (Wi-Fi fingerprint). Этот подход позволит находить других пользователей социальной сети в локальном окружении. Наша презентация для конференции AINA-2013. Это дальнейшее развитие подхода SpotEx.


Monday, March 25, 2013

О журнале INJOIT

Лаборатория ОИТ факультета ВМК МГУ им. М.В. Ломоносова начинает издавать новый рецензируемый журнал с открытым доступом: INJOIT - International Journal of Open Information Technologies. Это электронный журнал, сайт журнала: http://injoit.org.

Мы предполагаем публиковать оригинальные работы, охватывающие как собственно открытые информационные технологии, так и смежные области. Журнал предполагается двуязычным и будет принимать научные статьи, как на русском, так и на английском языках.

Журнал принимает два типа статей: письма (4 стр.) и полные статьи (6-8 стр.). Шаблоны для подготовки статей могут быть загружены с сайта журнала INJOIT.

Приглашаем авторов и рецензентов регистрироваться на сайте журнала.

Вот еще статья о журнале в блоге лаборатории

Всяческое распространение этой информации более чем приветствуется.

Абавазрение 25.03.2013

Некоторые интересные ссылки:

1. Еще одна коллекция Мобильных веб-фреймворков

2. Коллекция шаблонов для HTML5 сайтов

3. Расширения для Twitter bootstrap. Очень интересные фреймворки для веб-дизайна получаются.

4. Простой сервис организации телеконференций. Пока бесплатно.

5. Примерный бюджет цифрового агентства.

6. На сайте inetique.ru отредактированы новости.

Sunday, March 24, 2013

Хьюстон, у нас проблемы

Старая фотография - Центр Управления Космическими полетами в Хьюстоне. Вендоры на дежурстве :)


Кластеризация и сегментация

Хорошая вводная статья по принципам классификации и сегментации данных. Представляет интерес также приводимый список продуктов.

Friday, March 22, 2013

Не одними координатами

Информация о сетевой близости (network proximity), которой оперируют проекты SpotEx может быть использована для определения траекторий движения мобильных пользователей. Вот статья, в которой приводится алгоритм определения конвоев (то есть, совместно перемещающихся групп мобильных абонентов) по измерениям Wi-Fi proximity.

OpenStack на практике

Устройство и практическое применение Apache OpenStack.

Вот здесь еще можно посмотреть про эту облачную ОС

Thursday, March 21, 2013

Hadoop Summit


Мы продолжаем публиковать ссылки для отслеживания интересных событий в Twitter. На этот раз - Hadoop Summit, Amsterdam 2013



/via Geo Messages

P.S. и то же самое в Twi-газете:   Hadoop Summit 2013

Redis and PostgreSQL на практике

Интересный блог Instagram Engineering. Много материалов по практическому применению PostgreSQL и Redis.

Tuesday, March 19, 2013

JavaScript charts

Коллекция ссылок JavaScript библиотек для построения графиков. Понадобилось для одного проекта. И вот, что нашлось. Довольно богатый выбор:

Chart.js, D3, Google Charts, HighCharts, AmCharts, Raphael.

Ну и еще большая коллекция есть в обзоре ComputerWorld.

Monday, March 18, 2013

Python и Data Science

Что нужно знать, для использования Python при анализе данных. И где эти знания получить.

Лингвистический анализ в Twitter

Интересная статья по анализу слов, употребляющихся в Twitter. Интересны метрики, которые использовали авторы.

Вот анализ результатов, заключающий, что пользователи Twitter используют жаргон. При этом он имеет явные региональные различия.

Sunday, March 17, 2013

$10 000 от Netflix

Конкурс от Netflix с призами по $10 000. Цель - модификация/расширение их Open Source продуктов

Оценка загрузки магазинов

На основе анализа check-in, фото с социальных сетях и т.д. определить возможную загрузку публичных мест прямо сейчас. Стоит туда идти или нет?

Можно найти параллели с сервисом Checkin, например. Но проблема, очевидно, в том, что собирать такую информацию из социальных сетей становится все сложнее. Подход к использованию API поменялся. И Твиттер тому первый пример.

Friday, March 15, 2013

Потоки в Java

Систематизированное учебное изложение по теме Потоки в языке Java. Жизненный цикл потока, синхронизация и т.д.

INJOIT

Открыт новый рецензируемый Open Access журнал: International Journal of Open Information Technologies. Издатель: лаборатория ОИТ ВМК МГУ им. М.В. Ломоносова. Прием статей в первый номер журнала открыт.

Thursday, March 14, 2013

Megastore и Spanner

Интересное сравнительное описание двух big data систем от Google: Megastore и Spanner. Если скорость записи не сильно критична, то можно получить поддержку distributed consistency.

Вот здесь есть еще про Spanner, а здесь - про Megastore.

Абавазрение 14.03.2013

Некоторые интересные ссылки:

1. Изучаем Python. Python программирование на примере обработки текстов

2. Арихтектура данных для использования Hadoop в задачах обработки в реальном времени. Идея - во введении по-шаговой обработки. Где-то я уже это читал :)

3. Иконки для веб-приложения как шрифт.

4. Использование Hadoop для обработки данных веб-лога. Практический пример.

5. NoSQL системы, как просто "попробовать", перед переходом к реальным параллельным базам данных.

6. Java Pi. Реализация Java на Raspberry Pi

Tuesday, March 12, 2013

Мобильный портал

QR code
Обновлен мобильный портал

http://m.linkstore.ru

(это - мобильный сайт). В последней версии обновлен раздел Сервисы. Например, добавлен новый сервис Поиск собеседника. Кстати, раздел Сервис содержит ссылки на все наши мобильные мэшапы (если зайти из мобильного браузера).

Скопировать ссылку на свой телефон можно с помощью приведенного QR-кода. Можно также набрать короткий URL http://bit.ly/dc14q (экономия - 2 символа :)

P.S. a сделать свой мобильный веб-портал можно с помощью сервиса Мобильные страницы.

Теперь ты в армии

IRC в американской армии. Тактический чат.

Sunday, March 10, 2013

AI алгоритмы

100

Кто-то разоряется, кто-то приходит, но количество купонных сайтов продолжает расти. В поисковой системе по скидочным сайтам: поиск по купонам и скидкам уже 100 русскоязычных сайтов. Технически это сделано на базе Google CSE (custom search engine).

А здесь можно скопировать код поисковика по русским Группонам для добавления к своему сайту/блогу.

Безусловный фаворит поиска пока не меняется. Это - желтые ботинки.

Saturday, March 09, 2013

Позиционирование в помещениях

Интересная технология - сенсорная система для самостоятельного позиционирования. Не требует внешней инфраструктуры (GPS, Wi-Fi). Но я так понимаю, что план помещения должен быть. Иначе от чего отсчитывать перемещение? Вот здесь еще есть их презентация:


Open Source и Big Data

Интересный обзор Open Source продуктов в области Big Data. Внутри: Storm, Kafka, Dremel, Drill, язык R, проблемно-оринтерированный язык для обработки графов Gremlin, платформа для работы с графами от Apache - Giraph, in-memory база данных от SAP - Hana и инструментарий для визуализации D3

Friday, March 08, 2013

Математика и жизнь

Интересная история об использовании исследования операций и теории вероятностей во Второй мировой войне.

P.S. Вот здесь еще можно посмотреть похожий материал.

Машинное обучение

Хорошая книга в свободном доступе - машинное обучения для статистиков. Там же на сайте есть ссылка на соответствующий курс в Стенфорде.

Wednesday, March 06, 2013

Data Science. Литература

Несколько новых литературных ссылок:

1. Бесплатная e-book: Data Science with R

2. Бесплатно доступный первый номер журнала Big Data

3. Бесплатная книга Базы данных для графов. Авторы - создатели Neo4J

Tuesday, March 05, 2013

Без водителя

Интересная статья о том, как технически может выполняться оценка дорожной обстановки в автономных машинах

Абавазрение 05.03.2012

Некоторые интересные ссылки:

1. Примеры разработки мобильных веб-приложений, которые реагируют на наличие (отсутствие) сети. То есть, работа с HTML5 в offline.

2. uCheck - интересная идея для мобильного приложения. Предлагает снять тестер (лакмусовую бумажку) на камеру и анализирует изображение для диагностики.

3. На сайте inetique.ru - обновления и новости

4. Интересный глобальный конкурс инноваций от Deutsche Telekom

5. Публичные наборы данных. Важный момент для Data Science - на чем проверять алгоритмы. Вот здесь и собраны ссылки на наборы данных. Вместе с примерами испольхования машинного обучения для их анализа. Это так разработчик machine learning приложения свой продукт рекламирует.

6. Полезные примеры использования HTML5 Canvas

7. Remote control. Управление другими экранами из браузера. В этой связи см. также Web Pairing

Monday, March 04, 2013

Тряскометр

Интересная идея - акселерометр с памятью, который позволяет записать колебания. Выполнен в виде датчика, который покладывают к перемещаемому грузу. По сохраненным записям можно будет судить, как с грузом обращались во время перевозки.

С кем еще поговорить?

Углубленное развитие Internet of Things. Приложение, которое позволяет общаться с предметами, используя существующие для них номерные знаки.

В качестве более приземленной реализации можно упомянуть мобильные форумы для реальных объектов.

Sunday, March 03, 2013

OPC сервер для баз данных

Интересная реализация OPC для ODBC. Шлюз, который позволяет представить базу данных в виде OPC сервера.

CERN для социальных данных

Интересная статья в NYT о том, как big data помогают в анализе поведения сообществ и отдельных людей. Вот презентация Alex Pentland о больших данных в социальных науках.

В связи с этим - одна интересная инициатива в MIT: MIT Center for Connection Science and Engineering. Планы у них громадные. На Workshop в MIT Media Lab обсуждали просто создание ни много ни мало CERN of sociotechnical science and engineering. Это один из проектов в рамках FET Flagships

Saturday, March 02, 2013

Городские данные

Open Data Platform. Как выглядит городской портал открытых данных на примере Palo Alto.

Обучение програмированию

Сайт, посвященный обучению программированию. В первую очередь, школьников. Есть хороший список ресурсов.

Friday, March 01, 2013