Deep Q learning - BD-SEARCH/MLtutorial GitHub Wiki
Deep Q-Network(DQN)
- Q learningμ κΈ°μ΄λ‘ ν κ°ννμ΅
- Q learningμμλ μ΅μ νλ κ°μΉ ν¨μλ‘ μ΅μ μΈ νλμ μ ν¨
- μ΄λ¬ν ν¨μλ₯Ό CNNμΌλ‘ λΉμ·νκ² νλ΄ λ΄μ΄ μ¬μ©νλ κ²μ΄ DQN
μ€μ μ¬λ‘
- λΉλμ€ κ²μμ μμ¨ νμ΅μμΌ μ¬λμ λ°μ΄λλ μμ€μ μ‘°μμ μ€ν
- κ·Έλμμ λΉλμ€ κ²μ νμ΅μμλ κ²μμ μνλ₯Ό 미리 μΆμΆνλ κ²μ΄ 보ν΅. κ·Έλ¬λ DQNμμλ μ
λ ₯ λ°μ΄ν°λ λΉλμ€ κ²μμ μμ λΏ.
- κ²μλ§λ€ μ€μ μ λ°κΏ νμ μμ΄ λ¨μν DQNμ κ²μ μμμ 보μ¬μ£ΌκΈ°λ§ νλ©΄ λ¨
- ν©λ§¨, μν리μ κ°μ κ²μμμ λ°μ΄λ μ±μ μ 보μ