html2dvi (32KB) :
HTML ファイルを TeX ファイルに変換する単純な perl スクリプトです。
最新版は2000年5月29日の Ver 0.7d です
(旧版 0.7c はここ)。
圧縮ファイルもあります:
html2dvi.gz(9KB),
html2dvi.zip(9KB),
html2dvi.lzh(9kB).
この類のツールは、リンクをたどれたり、画像の処理もしたりという、
高機能なものがいろいろあるのですが、自分にとって使い易い
ものがあまりないので、自作しました。
あまりむずかしいことはできません(画像、フレームだとかには対応していません)。
簡単なドキュメントを用意してみました。
最初の部分を御自分の環境にあわせて書き換えてから使って下さい。tex プログラムを
呼び出してコンパイルする途中でエラーがおきるときもありますが、
あまり気にしないで r でも入力してしのいで下さい。
単に html2dvi とやるとヘルプを表示します。DOS ではあまり試していませんが、
Windows の DOS Prompt から実行する時は先頭部分を例えば
$viewer = 'dviout'; # preview command
$unix_flag = 0; # 0 for DOS, 1 for UNIX
$use_japanese = 1; # 0 if you do not use Japanese
.....
$kconv_p = 'nkf -X -e'; # command for conversion to Kanji code for perl
$kconv_t = 'nkf -X -s'; # command for conversion to Kanji code for tex
のように書き換えて、
jperl -Leuc html2dvi.dos -v hogehoge.htm
などのようにやってみてはどうでしょうか? (nkf, ptex, dviout などが
インストールされていると仮定します)
また必要に応じて改行コードの変換などを行わないと実行できないかもしれません。
[sample screenshot]
-
- ぼくは Web ブラウズ中、エッセイなどを読む時に使用しています。
専用のディレクトリにhtml2dvi.stを
用意しておき、ゆっくり読みたいページがあればそれをその
ディレクトリにセーブし、
html2dvi -v hogehoge.html
とやって、読みやすい字で読みます(Xの上でやります)。つまり
ボイジャーと
ひつじ書房の
T-Timeが単にテキスト・ファイル
だけではなくHTMLファイルにも対応しているので、こちらも Txt2dvi だけではなく
Html2dvi を作ってみたという次第です。本業のほうが忙しいので、
縦書きやルビには当分対応しないでしょう。
[sample source html file]
[screenshot of the output]
[output tex file]
[output dvi file (pdf)]
[青空文庫]
他の方の html2tex, html2latex, ... ツールたち: