[c] ngram function - dsindex/blog GitHub Wiki

  • generate ngrams(minsize=3, maxsize=6) from a given word(utf-8)

  • code snippet from fasttext

$ g++ -g ngram.cc -std=c++0x -o ngram
$ ./ngram
<카카	1387097
<카카오	1620067
<카카오1	1032470
<카카오12	1407148
카카오	1151521
카카오1	815408
카카오12	1371046
카카오12검	1181318
카오1	449865
카오12	1959841
...