[transliteration] m2m aligner - dsindex/blog GitHub Wiki

  • m2m aligner
    • 컴파일 오류 처리
    util.h에서 istringstream 앞에 std::가 없는 오류가 1건 있는데, 이를 수정하면 컴파일 문제는 없어짐
    
  • usage
1. input file
  - 영어단어에 대한 한글독음 데이터가 존재한다고 하자. 
  aachen  아컨
  ab      에이비
  abaca   아바카
  ...
  - 영어와 한글 모두 음절단위로 분리한다. 
  a a c h e n	아 컨
  a b	        애 이 비
  a b a c a	아 바 카
  ...

2. m2m aligner

  ./m2m_aligner --maxX 3 --maxY 3 -i input.txt

3. aligned data
  test.txt.m-mAlign.2-2.1-best.conYX.align

  a|b|	애:이|비|
  a|b:a|c:a|	아|바|카|
  ....