"Fossies" - the Fresh Open Source Software Archive

Member "groonga-10.0.8/examples/dictionary/readme.txt" (22 Oct 2020, 2126 Bytes) of package /linux/misc/groonga-10.0.8.tar.gz:


As a special service "Fossies" has tried to format the requested text file into HTML format (style: standard) with prefixed line numbers. Alternatively you can here view or download the uninterpreted source code file.

    1 .. highlightlang:: none
    2 
    3 辞書検索ツール
    4 ==============
    5 
    6 名前
    7 ----
    8 
    9 groonga辞書検索ツール
   10 
   11 説明
   12 ----
   13 
   14 様々な商用・非商用の辞書ファイルをインポートしてgroongaで検索できるようにします。
   15 
   16 対応している辞書
   17 ++++++++++++++++
   18 
   19 現状では下記の辞書に対応しています。
   20 
   21 * EDICT
   22 
   23 EDICTは、Monash大学Jim Breen教授が提供している和英辞書です。下記から入手できます。
   24 
   25 http://ftp.monash.edu.au/pub/nihongo/edict.gz
   26 
   27 * GENE95
   28 
   29 GENE95は、Kurumiさん(NiftyID: GGD00145)が作成された英和辞書です。下記から入手できます。
   30 
   31 http://www.namazu.org/~tsuchiya/sdic/data/gene95.tar.gz
   32 
   33 * 英辞郎
   34 
   35 英辞郎は、EDPという団体によって編纂されている英和・和英辞書です。
   36 
   37 http://www.eijiro.jp/
   38 
   39 書店やオンラインショップなどで購入できます。
   40 
   41 データベースの初期化
   42 ++++++++++++++++++++
   43 
   44 本ディレクトリで下記のように実行し、辞書データを格納するデータベースファイルを下記のようにして初期化します。
   45 
   46  ./init-db.sh データベースパス名
   47 
   48 このようにして作成したデータベースについて、様々な辞書のデータをインポートすることができます。
   49 
   50 インポートの方法
   51 ++++++++++++++++
   52 
   53 * EDICT
   54 
   55 edictディレクトリ配下で以下のように実行します。 edict.gzは自動でダウンロードします。
   56 
   57  ./edict-import.sh データベースパス名
   58 
   59 * GENE95
   60 
   61 gene95ディレクトリ配下で下記のように実行します。 gene95.tar.gzは自動でダウンロードします。
   62 
   63  ./gene-import.sh データベースパス名
   64 
   65 * 英辞郎
   66 
   67 英辞郎に付属のPDICツールを用いてCSVファイル形式に辞書をエクスポートします。(このとき「登録項目」ですべての項目を出力するようにします) eijiroディレクトリ配下で下記のように実行します。
   68 
   69  ./eijiro-import.sh データベースパス名 出力したCSVファイルのパス名
   70 
   71 (英辞郎第四版で動作を確認しています)