hakeの日記

Windows環境でプログラミングの勉強をしています。

Anthy登録単語の調整

ザウルスの日本語入力にはAnthyを使用させていただいています。少々重いという欠点はありますが、ターミナルやOperaで使用可能で変換がそれなりに賢い、dipusさんのところで定期的にアップデートされたパッケージが公開されているといった理由で重宝して使用しています。
単語登録について読みと単語をクリップボード経由でKeyHelperのメニューからできるようにしていたのですが。あくまで簡易的な処理なのでパラメータ調整ができませんでした。そこで一旦ファイルに書き出して調整してみました。
登録単語のファイルへの書きだしと登録は

$ anty-dic-tool --dump > dic.txt        # 書きだし
$ cat dic.txt | anthy-dic-tool --load   # 再登録

で行います。
作成されたdic.txtは名詞について以下の様な形式になっているのでパラメータ調整をします。ちなみに自分は使用していませんが副詞にもパラメータがあります。

# よみ 1 単語
# 品詞 = 名詞
# な接続 = y
# さ接続 = y
# する接続 = y
# 語幹のみで文節 = y
# 格助詞接続 = y
#

読みと単語の間の数値は使用頻度なので、良く使用する単語は1000、普通に使用は100、殆んど使用しない単語は1に設定。これは候補の登場する順番に影響するものだと思う。
顔文字や記号なんかは「語幹のみ文節」のみyに設定。
「な接続」はたぶん形容動詞だと思うので、そのように活用する単語に使用。「さ接続」ってなんだろう? わからないのでとりあえずyにしておきます。
これで変換効率も少しアップします(笑)


ちなみに「な接続」のみyで登録して語幹のみで変換させても登場する順番は下がりますが候補に登場しますね。これは仕様?