[로그스태시] nori_analyzer array 분리 테스트 - forewalk/elastic GitHub Wiki

Logstash

analyzer


analyzer 결과를 10000건 이상 가져오기 위해서, 수정이 필요하다

index.analyze.max_token_count

참고

PUT test_jh4
{
  "mappings": {
    "properties": {
      "nori_array": {
        "type": "text",
        "analyzer": "nori_analyzer"
      },
      "attachment": {
        "properties": {
          "Application-Name": {
            "type": "text",
            "fields": {
              "keyword": {
                "type": "keyword",
                "ignore_above": 256
              }
            }
          },
          "Author": {
            "type": "text",
            "fields": {
              "keyword": {
                "type": "keyword",
                "ignore_above": 256
              }
            }
          },
          "Character Count": {
            "type": "text",
            "fields": {
              "keyword": {
                "type": "keyword",
                "ignore_above": 256
              }
            }
          },
          "Comments": {
            "type": "text",
            "fields": {
              "keyword": {
                "type": "keyword",
                "ignore_above": 256
              }
            }
          },
          "Content-Type": {
            "type": "text",
            "fields": {
              "keyword": {
                "type": "keyword",
                "ignore_above": 256
              }
            }
          },
          "Creation-Date": {
            "type": "date"
          },
          "Last-Author": {
            "type": "text",
            "fields": {
              "keyword": {
                "type": "keyword",
                "ignore_above": 256
              }
            }
          },
          "Last-Modified": {
            "type": "date"
          },
          "Last-Save-Date": {
            "type": "date"
          },
          "Line-Count": {
            "type": "text",
            "fields": {
              "keyword": {
                "type": "keyword",
                "ignore_above": 256
              }
            }
          },
          "Page-Count": {
            "type": "text",
            "fields": {
              "keyword": {
                "type": "keyword",
                "ignore_above": 256
              }
            }
          },
          "Revision-Number": {
            "type": "text",
            "fields": {
              "keyword": {
                "type": "keyword",
                "ignore_above": 256
              }
            }
          },
          "Status": {
            "type": "text",
            "fields": {
              "keyword": {
                "type": "keyword",
                "ignore_above": 256
              }
            }
          },
          "Title": {
            "type": "text",
            "fields": {
              "keyword": {
                "type": "keyword",
                "ignore_above": 256
              }
            }
          },
          "content": {
            "type": "text",
            "fields": {
              "keyword": {
                "type": "keyword",
                "ignore_above": 256
              }
            }
          },
          "content_length": {
            "type": "long"
          },
          "creator": {
            "type": "text",
            "fields": {
              "keyword": {
                "type": "keyword",
                "ignore_above": 256
              }
            }
          },
          "date": {
            "type": "date"
          },
          "doc_parse_count": {
            "type": "long"
          },
          "title": {
            "type": "text",
            "fields": {
              "keyword": {
                "type": "keyword",
                "ignore_above": 256
              }
            }
          }
        }
      }
    }
  },
  "settings": {
    "index": {
      "analysis": {
        "filter": {
          "shingle": {
            "max_shingle_size": "3",
            "token_separator": " ",
            "output_unigrams": "true",
            "type": "shingle"
          }
        },
        "analyzer": {
          "nori_analyzer": {
            "filter": [
              "lowercase",
              "trim",
              "nori_readingform"
            ],
            "type": "custom",
            "tokenizer": "nori_tokenizer"
          }
        },
        "tokenizer": {
          "nori_tokenizer": {
            "mode": "mixed",
            "type": "nori_tokenizer",
            "user_dictionary_rules": [
            ]
          }
        }
      },
      "analyze":{
        "max_token_count": 100000
      }
    }
  }
}