投稿者 るきお  (社会人) 投稿日時 2013/5/31 21:15:18
RSSは公開されている部分のみが取得でき、公開されていない部分は取得することはできません。
ほとんどのサイトでは一定数より前のRSSは公開されなくなるので、その一定数を超えて過去にさかのぼることはできません。

けれども、Googleリーダーは確かに公開されていない過去の情報もどんどんさかのぼって表示することができるように見えます。
多分、これはGoogleのデータベースの蓄積されている過去のRSSの情報を基にしているのだと私は推理します。Googleは検索エンジンで有名なので多くの情報を蓄積しているのでしょう。

そこで、じおんさんも過去の情報をどこかに蓄積しておいて、その情報を読みに行くようなRSSリーダーを作れば、RSSで公開されなくなった過去の情報も蓄積開始時点まではさかのぼって取得できるようにすることができます。

このプログラムは(あらかじめ指定したRSSだけを対象にすれば)それほど難しくはないと思いますが、過去の情報を蓄積する場所を用意するのと、Googleのように常時情報を監視するようにプログラム(=クローラー)を動かす場所を用意するのが大変です。

たとえば、クローラーを自分のパソコンで動作させると、パソコンをシャットダウンしている間の情報は抜けてしまうかもしれません。
私であれば、蓄積する場所もクローラーもAzure上に構築しますが、この方法だとちょっとお金がかかります。