閑古鳥

オールドプログラマの日記。プログラミングとか病気(透析)の話とか。

DUOBLOGのRSSがうまく読み込めない件について

昨日(id:wata_d:20050714)の続き。

はてなRSSで正常にRSSを読み込めていない現象の原因を暇つぶしに追ってみました(いや、もちろん、昼休みにね……)。まず読込もとのRSSを見ると、description要素の中に記事全文が入っていますが、ここにもろにHTML要素ごと突っ込んでしまっているようです。エスケープも何もせずに。どんな実装してるんだろう。DUOBLOGは携帯向けのようだからこの辺りは手を抜いてるんだろうか。

で、それが元凶かとも思ったのですが、しかし次にはてなRSSのソースを見ると、要約の方ではcenterだとかほとんどのHTML要素は消されているので、パースする時に取り除いている様子。しかし、全ては取り除ききれていないようで、こっちはこっちで問題があるっぽい。ここで全て取り除ければ、昨日の問題は解決できるので、はてなにお願いして直してもらうのがいいのかな。

ちなみに「もっと読む」ではHTMLも全て展開しているようですが、これはこれで、元のRSSの中身によってはまずい事になりそうなので、どちらもRSSの中にあるHTMLは消した方が良い気がします(JavaScriptがある場合どうなるかまでは確認してませんが、それができたら普通にやばいかも?)。

うーん、報告した方が良さそうな気がしますね。これはサブアカウントだからはてなアイデアが使えないので、メインアカウントでやってみよう……面倒だな。報告までして上にあることが悉く間違ってたら非常に痛いし。というか実際こんなの誰でも思いつくだろうし、もうどっかにあがってるんじゃなかろうか?先にそれ調べてからにしよう。

続きは家に帰ってからということで。