Tuesday, October 28, 2008

Кодировка RSS

Одна из особенностей, например, XML парсеров в Java является проблема в работе с не UTF-8 кодировками. И здесь можно воспользоваться сервисом Feedburner: он автоматически перекодирует потоки в UTF-8. Например, вот исходный RSS поток в кодировке win-1251: http://rabota.mail.ru/vac_search_rss/. А это его feedburner-ский аналог: http://feeds.feedburner.com/mail/VSMc, который оказывается уже в кодировке UTF-8.

P.S. а уже UTF-8 RSS поток можно использовать, например, в MetroMap мэшапе. Вот работы от mail.ru на карте Google: Работа@Mail.Ru metro map

3 comments:

Anonymous said...

Кстати, большое спасибо за напоминание об этой фиче Feedburner'а

PS. У Blogger'а какое-то взаимонедопонимание :) с OpenID LiveJournal: "Your client has issued a malformed or illegal request".

Anonymous said...

Привет. проблема с кодировкой :( Что только не пробовал :(
Валидатором проходит фид 100%

http://feeds2.feedburner.com/aphorism
вот через feedburner
а вот оригинал:
http://aphorismos.ru/_rss/rss.php

кто поможет?

Coldbeans software said...

>кто поможет?
исходный фид - уже в UTF-8
хотя в его заголовке зачем-то написано encoding="windows-1251"