[Namazu-devel-ja 762] Re: そろそろNama zu 2.0.15 pre3

Tadamasa Teranishi yw3t-trns @ asahi-net.or.jp
2005年 12月 7日 (水) 09:38:51 JST


寺西です。

NOKUBI Takatsugu wrote:
> 
> At Tue, 06 Dec 2005 21:35:42 +0900,
> Tadamasa Teranishi wrote:
> > あれはとてもadhocなのものなので組み込まず、パッチで良いのではないかと
> > 思っています。
> 
>   確かにあんまり筋はよくないのですが、根本的解決はutf-8化だと思います
> のでそれまではなんとかこれでしのぎたいところです。

256以上を削除しましたので、少なくともあそこでは
「Malformed UTF-8 character .... というワーニングや
Wide character in print at mknmz といったワーニングが発生し、
インデックスを壊す」ことはなくなったはずです。
# 他で問題はでるけど...。

Perl 5.6 + Namazu 2.0.14 以前の古い環境で動いたのに、
Perl 5.8 + Namazu 2.0.15 以降の新しい環境で動かないということも
基本的にはないはずです。

本質的にはパッチ程度の修正は入っています。
パッチだと $num >= 127 && $num <= 159 を削除していませんが、
ここはコントロールコードなので削除しないといけません。
http://www.asahi-net.or.jp/~yw3t-trns/code/iso88591.html

足りないのは MHonArc だけISO8859-1の処理を行うかどうかの
ところですが、申し訳ないですがあまりに美しくなかったので
見送っています。
filter/mhonarc.pl にローカルなdecode_entity等を置いた方が良い
でしょう。
ただ、今回は最小限の修正に抑えました。
なお、より安全に使うには util::islang('*.iso88591') みたいなチェック
が必要なんですけど、それを実装するのも面倒なだけなので、放置です。
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns @ asahi-net.or.jp
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E




Namazu-devel-ja メーリングリストの案内