hakeの日記

Windows環境でプログラミングの勉強をしています。

ウィキペディアの辞書化

以前からウィキペディアを辞書にしたいと思っていて、Rubyで変換スクリプトでも作ろうかと思いつつそのままになっていましたのですが、最近某所で変換手段があることを知り実行してみました。変換辞書をEeePCにいれて使っています(容量が厳しいですが(^^ゞ)が、ウィキペディアを辞書として持てるのはとても便利ですね。

作成された辞書本体ファイルは約1.7GBで後述のソフトで5段階中3のレベルで圧縮させて約700MBになりました、おおきいなぁ。作成環境はWindowsVISTAノートPC(CPU:Core2Duo T5500?)のUSB外付けHDD上につくったVirtualPC環境上のDebianです。この環境で変換(fpwmake)に約7時間かかりました、寝る前に実行して朝起きたらちょうどいい具合に変換終了してましたね。作業前後の仮想HDDサイズから判断して変換作業に必要なHDD容量は約10GBといったところでしょうか。

    • 追記08/12/20 freepwing-1.5.tar.bz2+wikipedia-fpw-20080616-src.tar.gzにて、本体HDDに構築したUbuntu8.04LTS on VirtualBox2.1.0上の環境では約4時間で変換終了しました。

参考にさせていただいたサイトは以下です。


以下、作業メモ

続きを読む