本記事では、ubuntu 8.04に全文検索エンジンnamazuを導入する方法をまとめる。
インストール
$ apt-get install namazu2 namazu2-index-tools libtext-kakasi-perl libnkf-perl
最初、 namazu2 namazu2-index-toolsだけをインストールしたら、mknmzコマンドを使ってインデックスを作成しているときに、Can't locate NKF.pmとかCan't locate Kakasi.pmなどと怒られた。
したがって、次の2つを追加インストールした。
libtext-kakasi-perl libnkf-perlこれで、インデックスを作成できた。
インデックスの作成
検索を高速化するために、あらかじめ対象ディレクトリにあるファイルのインデックスを作成する。例えば、/usr/local/share/namazu/docにある文書のインデックスを作成するためには
$ mknmz /usr/local/share/namazu/docとすれば良い。mknmzを実行したときのディレクトリに、インデックスファイルが作成されます。
検索
作成したインデックスに対して、キーワードで検索をかけるには次のようにします。
$ namazu キーワード インデックスのあるディレクトリ
参考サイト:「使ってみようNamazu 2.0」
追記
PDFファイルを検索対象に含めるには、pdftotextが必要。デフォルトではうまく動かなかったので、設定が必要(「PDFファイルからテキストを抽出する」)。
また、TEXファイルを検索対象に含めるには、detexが必要。
$ sudo apt-get install texlive-extra-utilsこれでdetexがインストールされる。
0 コメント:
コメントを投稿