[로그스태시] nori_analyzer array 분리 테스트 - forewalk/elastic GitHub Wiki
Logstash
analyzer
analyzer 결과를 10000건 이상 가져오기 위해서, 수정이 필요하다
index.analyze.max_token_count
PUT test_jh4
{
"mappings": {
"properties": {
"nori_array": {
"type": "text",
"analyzer": "nori_analyzer"
},
"attachment": {
"properties": {
"Application-Name": {
"type": "text",
"fields": {
"keyword": {
"type": "keyword",
"ignore_above": 256
}
}
},
"Author": {
"type": "text",
"fields": {
"keyword": {
"type": "keyword",
"ignore_above": 256
}
}
},
"Character Count": {
"type": "text",
"fields": {
"keyword": {
"type": "keyword",
"ignore_above": 256
}
}
},
"Comments": {
"type": "text",
"fields": {
"keyword": {
"type": "keyword",
"ignore_above": 256
}
}
},
"Content-Type": {
"type": "text",
"fields": {
"keyword": {
"type": "keyword",
"ignore_above": 256
}
}
},
"Creation-Date": {
"type": "date"
},
"Last-Author": {
"type": "text",
"fields": {
"keyword": {
"type": "keyword",
"ignore_above": 256
}
}
},
"Last-Modified": {
"type": "date"
},
"Last-Save-Date": {
"type": "date"
},
"Line-Count": {
"type": "text",
"fields": {
"keyword": {
"type": "keyword",
"ignore_above": 256
}
}
},
"Page-Count": {
"type": "text",
"fields": {
"keyword": {
"type": "keyword",
"ignore_above": 256
}
}
},
"Revision-Number": {
"type": "text",
"fields": {
"keyword": {
"type": "keyword",
"ignore_above": 256
}
}
},
"Status": {
"type": "text",
"fields": {
"keyword": {
"type": "keyword",
"ignore_above": 256
}
}
},
"Title": {
"type": "text",
"fields": {
"keyword": {
"type": "keyword",
"ignore_above": 256
}
}
},
"content": {
"type": "text",
"fields": {
"keyword": {
"type": "keyword",
"ignore_above": 256
}
}
},
"content_length": {
"type": "long"
},
"creator": {
"type": "text",
"fields": {
"keyword": {
"type": "keyword",
"ignore_above": 256
}
}
},
"date": {
"type": "date"
},
"doc_parse_count": {
"type": "long"
},
"title": {
"type": "text",
"fields": {
"keyword": {
"type": "keyword",
"ignore_above": 256
}
}
}
}
}
}
},
"settings": {
"index": {
"analysis": {
"filter": {
"shingle": {
"max_shingle_size": "3",
"token_separator": " ",
"output_unigrams": "true",
"type": "shingle"
}
},
"analyzer": {
"nori_analyzer": {
"filter": [
"lowercase",
"trim",
"nori_readingform"
],
"type": "custom",
"tokenizer": "nori_tokenizer"
}
},
"tokenizer": {
"nori_tokenizer": {
"mode": "mixed",
"type": "nori_tokenizer",
"user_dictionary_rules": [
]
}
}
},
"analyze":{
"max_token_count": 100000
}
}
}
}