Страницы

Thursday, September 08, 2011

Извлечение данных

Интересный проект по анализу информации в веб - извлечение фактографической информации из веб страниц.

Тестовый материал для проекта (сайты) был предоставлен Google, а сам проект анализа - Open Source Java код. Доступен здесь: ReVerb - Open Information Extraction Software. Но это для английского языка.

Другие материалы по обработке текстов на естественных языках см. здесь

No comments:

Post a Comment