FANBOX EPUB 化の暫定的な技術的覚え書き FANBOX の EPUB…
jrf> FANBOX EPUB 化の暫定的な技術的覚え書き FANBOX の EPUB 化にあたり、最大の問題点は、FANBOX のページは JavaScript による動的生成を多様しており、Perl から get しても、ブラウザのページで保存したりしても、中身のないデータしか得られないという点である。これを補うため、Firefox のアドオンの Save Page WE というアドオンで保存する。 ただし、Save Page WE はページがまるごと保存できるのがウリだが、決して特定の仕様に沿ったセーブをなすわけではない。そのため、Save Page WE で保存したものから変換作業を行っていくが、その作業は Save Page WE のバージョンアップと共に変更を強いられることとなろう。 次の大きな問題点として、EPUB は HTML のかなり小さいサブセットであるため、情報をかなり削っていかなければ、うまく表示できないという点がある。Save Page WE の特殊な CSS の使い方等を補う必要がある。 EPUB への流れとしては、Save Page WE でセーブ → 変換スクリプトで変換 → Sigil で EPUB にする。…という流れ。Sigil のメタデータの入力や CSS の作成などにもノウハウはないでもないが、これについてはできた EPUB を見てもらったほうが早いのでここでは説明しない。変換についてのみここでは書いていく。