DeepLearning_Lec09_1 - 8BitsCoding/RobotMentor GitHub Wiki
기존에는 W, b를 cost함수를 구한 후 Gradient Descent Algo를 이용하여 구했다.
같은 방법으로 W1, W2, b1, b2를 학습 시킬 수 있을까?
그런데 위와 같이 네트워크가 복잡한데 여기서 미분값을 구할 수 있는 건가??
Back Propagation을 사용하면 구할 수 있다. 어떻게 하는지는 아래서 설명!
위 그림과 같이 모든 것을 tensor로 만들어서 간단하게 계산이 가능해진다.