[Namazu-devel-ja 782] Re: File::MMagic::magicMatchStr Re: Re:File::MMagic::checktype_data

Yukio USUDA m6694ha392t @ asahi-net.or.jp
2005年 12月 18日 (日) 00:34:47 JST


臼田です

Tadamasa Teranishi wrote:

> > 【2.File::MMagic::magicMatchStr (pdfファイルの場合)】
> ...
> > $self->{magic}->[]の中身の順番を判定すべきファイルを先頭に持っていくことが
> > できればと思います。
> 
> ですね。
> 
__DATA__ の部分を見ると audio video 系のフォーマットのデータが上の方にあるので
これを html系ファイル や pdf など優先順位の高いものから並べ替えるのが手っ取り
早いのですが File::MMagic は mknmz 専用のツールではないのでちょっとまずい
かもしれませんね。
File::MMagic は 外部の magic ファイルを読み込むこともできるので mknmz 専用に
作り直した magic ファイルを使うように mknmz を直すとよいかもしれません。

> > <!DOCTYPE HTML PUBLIC を magic データに追加するか mknmz の filter/html.pl
> > 側で addSpecials をしておくのが良いと思います。
> 

addSpecials ではなくて addMagicEntry でした。これは、配列の前のほうに
追加してくれるんでしたっけ、後ろに追加されるとあまり効果がでないです。


> > これらの修正で magicMatchStr の呼び出し回数が 80,000回から 8,000回まで減り
> > ました。
> 
> 1割になるのはすごいです。

html (<!doctype 追加)と pdf の magic データを先頭の方に持って行った
だけなのですが、修正のわりに効果が大きいのでうれしいものがあります。

臼田幸生





Namazu-devel-ja メーリングリストの案内