1 .. highlightlang:: none 2 3 辞書検索ツール 4 ============== 5 6 名前 7 ---- 8 9 groonga辞書検索ツール 10 11 説明 12 ---- 13 14 様々な商用・非商用の辞書ファイルをインポートしてgroongaで検索できるようにします。 15 16 対応している辞書 17 ++++++++++++++++ 18 19 現状では下記の辞書に対応しています。 20 21 * EDICT 22 23 EDICTは、Monash大学Jim Breen教授が提供している和英辞書です。下記から入手できます。 24 25 http://ftp.monash.edu.au/pub/nihongo/edict.gz 26 27 * GENE95 28 29 GENE95は、Kurumiさん(NiftyID: GGD00145)が作成された英和辞書です。下記から入手できます。 30 31 http://www.namazu.org/~tsuchiya/sdic/data/gene95.tar.gz 32 33 * 英辞郎 34 35 英辞郎は、EDPという団体によって編纂されている英和・和英辞書です。 36 37 http://www.eijiro.jp/ 38 39 書店やオンラインショップなどで購入できます。 40 41 データベースの初期化 42 ++++++++++++++++++++ 43 44 本ディレクトリで下記のように実行し、辞書データを格納するデータベースファイルを下記のようにして初期化します。 45 46 ./init-db.sh データベースパス名 47 48 このようにして作成したデータベースについて、様々な辞書のデータをインポートすることができます。 49 50 インポートの方法 51 ++++++++++++++++ 52 53 * EDICT 54 55 edictディレクトリ配下で以下のように実行します。 edict.gzは自動でダウンロードします。 56 57 ./edict-import.sh データベースパス名 58 59 * GENE95 60 61 gene95ディレクトリ配下で下記のように実行します。 gene95.tar.gzは自動でダウンロードします。 62 63 ./gene-import.sh データベースパス名 64 65 * 英辞郎 66 67 英辞郎に付属のPDICツールを用いてCSVファイル形式に辞書をエクスポートします。(このとき「登録項目」ですべての項目を出力するようにします) eijiroディレクトリ配下で下記のように実行します。 68 69 ./eijiro-import.sh データベースパス名 出力したCSVファイルのパス名 70 71 (英辞郎第四版で動作を確認しています)