Интересный проект по анализу информации в веб - извлечение фактографической информации из веб страниц.
Тестовый материал для проекта (сайты) был предоставлен Google, а сам проект анализа - Open Source Java код. Доступен здесь: ReVerb - Open Information Extraction Software. Но это для английского языка.
Другие материалы по обработке текстов на естественных языках см. здесь
No comments:
Post a Comment