[Kakasi-dev 181] Re: 竹冠のつく「朔」について

NOKUBI Takatsugu knok @ daionet.gr.jp
2014年 3月 6日 (木) 16:44:40 JST


On Fri, 28 Feb 2014 17:26:51 +0900
NOKUBI Takatsugu <knok @ daionet.gr.jp> wrote:

>   Wikipediaの記事を対象に新しいKAKASIDICTを
> 試そうとしていて気づいたのですが、JIS第四水準の
> 竹冠がついた「朔」(EUC-JP: FBA0)が化けてしまう
> ようです。

  よくよく確認したら、これはEUC-JPだと3バイトの文字でした
(0x8f d8 f4)
  0x8fから始まるバイト列はすべて3バイトになるようです。
http://ja.wikipedia.org/wiki/EUC-JP

 まずはEUC-JP3バイト文字が正常に処理できるようにする
方法を考えてみます。


Kakasi-dev メーリングリストの案内