Latent Dirichlet Allocation - clover3/Roland GitHub Wiki
Latent Dirichlet Allocation
LDA λ μ΄λ€ λ¬Έμκ° μ£Όμ΄μ‘μλ λ¬Έμλ΄μ μ μ¬λ μ£Όμ μ λν νλ₯ λͺ¨νμ΄λ€.
μλ₯Ό λ€μ΄μ ν LDA λͺ¨λΈμ΄ 'κ³ μμ΄ κ΄λ ¨' κ³Ό 'κ°μμ§ κ΄λ ¨' μΌλ‘ λΆλ₯λ μ μλ μ£Όμ λ₯Ό κ°λλ€κ³ νμ. κ° μ£Όμ λ λ€μν λ¨μ΄λ₯Ό μμ±ν κ°λ₯μ±μ΄ μλ€. μλ₯Ό λ€μ΄, 'μ°μ ','μΌμΉ','λ₯μ΄' λ±μ 'κ³ μμ΄ κ΄λ ¨' λ¨μ΄λ₯Ό λ§λ€ μ μλ€. κ°μ λ°©μμΌλ‘ 'κ°μμ§ κ΄λ ¨'μ κ²½μ° 'κ°','λ©λ©','λΌλ€κ·' λ±μ λ¨μ΄κ° νλ₯ μ΄ λμ μ μλ€.
Bag-of-word
LDA μμλ λ¨μ΄μ μμλ₯Ό κ³ λ €νμ§ μλ Bag-Of-Word λͺ¨λΈμ μ¬μ©νλ€.
