かんな辞書

かんな辞書というページで pubdic, pubdic+, gerodic, ldic, SKK, kakasi の辞書を統合したCanna辞書を発見したので入れた。これまではデフォルトの iroha辞書にrdic(鉄道辞書)を追加してつこてた。鉄道辞書には駅名が含まれて いるので、それで日常的文章にでてくる大抵の地名は変換できたので結構それで 満足していた。かな漢字変換なんてどんなにいいやつでも100%精度はありえない からCannaで全然おっけーなのだ。

がちと、四字熟語に弱いのが気になってはいた。これは正しい漢字で変換し たい。てなわけで今日入れたcannadicは助かりまくり。ためしに「おかめはちも く」を変換したら「岡目八目」になってしもた ^^; とりあえずcanndicのページ の著者に連絡。

チンし木工 沈思黙考、画違反母子 外反拇指、晴天のへ切れ気 青天の霹靂、 葉書琉 端折る、あ賜わり 頭割り、面目や九女 面目躍如、一進動態 一心同体、 御ん御同断 言語道断、化路リング超 カロリング朝、目路便具超 メロビング朝、 対かの会心 大化の改新、目琉背です弁津 メルセデスベンツ、……、 後藤だ湯来た 後藤田幸田、あこりゃ無理か。

でも、なんとなく目琉背です弁津のほうがかわいい気もする(阿呆)。


しばらく使ってると、漢字の(jisx0208な)アルファベットや算用数字が候補 に出てくるのがむっちゃ気になって来た。イライラ。ので、それらの候補を潰した。おお、完璧。

あとこれ、ドキュメントには個人のテキスト形式辞書で使う例しか載ってな いので、みんなに個人辞書で持たれたら管理者は泣く。こんぴうたも泣く。てこ とで、システムのバイナリ辞書として置く方法も書いとくべ。Canna(3.5b2)のシ ステム辞書が /usr/local/Canna/lib/dic/canna にあるとしよう。locate iroha.cbd なんてやるとその場所が分かるぞ。で、辞書ディレクトリが見付かっ たら取り敢えずそこに gpl_canna.t をコピーして以下の手順を行う。

# mkbindic gpl_canna.t
# chown bin.bin gpl_canna*
# vi dics.dir

んで、dics.dir ファイルに以下の行を追加

gpl_canna.cbd(gpl_canna.mwd)	-gpl_canna---
gpl_canna.cld(gpl_canna.mwd)	-gpl_canna---

確かCanna3.2は辞書ファイル名が違ったな。忘れた。今さら3.2なんか使うで ない。3.2じゃ「できねーっす」ってのが変換できねーっす。でも最近「できねーっ す」じゃなくて「できねー素」なので関係ねー素。どうでも良い。さて、 cannaserverを再起動。

# cannakill
# cannaserver

個人の ~/.canna にある use-dictionary 式に "gpl_canna" を追加してから cannacheck -v とするとgpl_canna 辞書が有効になっているか分かる。メデ。あ と、新しい gpl_canna 辞書にたいする学習ファイルを個人で持ちたいときは mkdic -fq gpl_canna しておくよろし。


きまぐれ記
yuuji@example.org
Fingerprint16 = FF F9 FF CC E0 FE 5C F7 19 97 28 24 EC 5D 39 BA
HIROSE Yuuji - ASTROLOGY / BIKE / EPO / GUEST BOOK / YaTeX [Tweet]