このページの2つのバージョン間の差分を表示します。
両方とも前のリビジョン 前のリビジョン 次のリビジョン | 前のリビジョン | ||
mroonga:10.7:config [2020/11/10 11:53] y2sunlight [トークンフィルタ―] |
mroonga:10.7:config [2020/11/11 10:00] y2sunlight [TokenMecab] |
||
---|---|---|---|
行 1: | 行 1: | ||
- | > 編集中 | ||
- | |||
====== Mroonga9.12 全文検索の構成 ====== | ====== Mroonga9.12 全文検索の構成 ====== | ||
Version 9.12 (MariaDB 10.4.12) | Version 9.12 (MariaDB 10.4.12) | ||
行 52: | 行 50: | ||
|リンゴ|りんご|カタカナ < | |リンゴ|りんご|カタカナ < | ||
- | 結論から先に言うと、ノーマライザーとして [[https:// | + | 結論から先に言うと、ノーマライザーとしては [[https:// |
\\ | \\ | ||
行 213: | 行 211: | ||
|none|トークナイズしません。| | |none|トークナイズしません。| | ||
|TokenDelimit|空白区切りでトークナイズします。| | |TokenDelimit|空白区切りでトークナイズします。| | ||
+ | |TokenRegexp|正規表現検索をサポートするトークナイザーです。| | ||
|TokenUnigram|ユニグラム(1-Gram)でトークナイズします。| | |TokenUnigram|ユニグラム(1-Gram)でトークナイズします。| | ||
|TokenBigram|バイグラム(2-Gram)でトークナイズします。| | |TokenBigram|バイグラム(2-Gram)でトークナイズします。| | ||
行 235: | 行 234: | ||
\\ | \\ | ||
- | ===== TokenMecab | + | ==== TokenMecab ==== |
- | 本編で使用している MariaDB with Mroonga (Windows版バイナリ) ではパーサとして形態素解析エンジンの Mecab がバンドルされていて直ぐに利用することができます。Mecab の本体は以下の配置されています: | + | 本編で使用している MariaDB with Mroonga (Windows版バイナリ) ではパーサとして形態素解析エンジンの Mecab がバンドルされていて直ぐに利用することができます。Mecab の本体は以下に配置されています: |
< | < | ||
行 338: | 行 337: | ||
- | ===== トークンフィルタ― ===== | + | ===== トークンフィルター ===== |
- | トークンフィルタリング | + | Mroongaではトークン化の後に、トークンに所定の処理を行うトークンフィルターを指定することができます。トークンフィルターを CREATE TABLE 文の中で指定するには、'' |
- | Groongaにはトークナイズされたトークンに所定の処理を行うトークンフィルターモジュールがあります。 | + | <code sql> |
- | + | FULLTEXT [INDEX] [インデックス名] (カラム1, | |
- | トークンフィルターモジュールはプラグインとして追加できます。 | + | </ |
+ | 以下の3つの組込みフィルターを使用できます。詳しくはGroongaの[[https:// | ||
- | > TODO | + | * [[https:// |
+ | * [[https:// | ||
+ | * [[https:// | ||
\\ | \\ |