처리율 제한 장치의 설계 - thought-corner/Backend-PlayGround GitHub Wiki
처리율 제한 장치의 설계
API에 처리율 제한 장치를 두면 좋은 점
DOS 공격에 의한 자원 고갈을 방지할 수 있다.
비용을 절감한다. → 추가 요청에 대한 처리를 제한하면 서버를 많이 두지 않아도 되고, 우선순위가 높은 API에 더 많은 자원을 할당할 수 있다.
서버 과부하를 막는다. → 봇(bot)에서 오는 트래픽이나 사용자의 잘못된 이용 패턴으로 유발되는 트래픽을 걸러내는데 처리율 제한 장치를 활용할 수 있다.
처리율 제한 알고리즘 - 토큰 버킷 알고리즘
토큰 버킷은 지정된 용량을 갖는 컨테이너이다.
해당 버킷에는 사전 설정된 양의 토큰이 주기적으로 채워진다.
토큰이 꽉 찬 버킷에는 더 이상의 토큰은 추가되지 않는다.
토큰 공급기는 이 버킷에 매초 2개의 토큰을 추가한다.
버킷이 가득 차면 추가로 공급되는 토큰은 버려진다.
각 요청은 처리될 때마다 하나의 토큰을 사용한다. 요청이 도착하면 버킷에 충분한 토큰이 있는지 검사하게 된다.
충분한 토큰이 있는 경우 버킷에서 토큰 하나를 꺼낸 후 요청을 시스템에 전달한다.
충분한 토큰이 없는 경우 해당 요청은 버려진다.
이 토큰 버킷 알고리즘은 2개 인자를 받는다.
버킷 크기 : 버킷에 담을 수 있는 토큰의 최대 개수
토큰 공급률(refill rate) : 초당 몇 개의 토큰이 버킷에 공급되는지
통상적으로 API 엔드포인트마다 별도의 버킷을 둔다. 예를 들어, 사용자마다 하루에 한 번만 포스팅을 할 수 있고, 친구는 150명까지 추가할 수 있고, 좋아요 버튼은 다섯 번까지만 누를 수 있다면, 사용자마다 3개의 버킷을 두어야 할 것이다. 결국 공급 제한 규칙에 따라서 달라진다.
IP 주소별로 처리율 제한을 적용해야 한다면 IP 주소마다 버킷을 하나씩 할당해야 한다.
시스템의 처리율을 초당 10,000개 요청으로 제한하고 싶다면, 모든 요청이 하나의 버킷을 공유하도록 해야한다.
장점
구현이 쉽다.
메모리 사용 측면에서도 효율적이다.
짧은 시간에 집중되는 트래픽도 처리 가능하다. 버킷에 남은 토큰이 있기만 하면 요청은 시스템에 전달될 것이다.
단점
이 알고리즘은 버킷 크기와 토큰 공급률이라는 2개의 인자를 가지고 있는데 이 값을 적절히 튜닝하는 것이 상당히 까다롭다.
처리율 제한 알고리즘 - 누출 버킷 알고리즘
누출 버킷 알고리즘은 토큰 버킷 알고리즘과 비슷하지만 요청 처리율이 고정되어 있다는 점이 다르다.
누출 버킷 알고리즘은 보통 FIFO 큐로 구현한다.
요청이 도착하면 큐가 가득 차 있는지 본다. 빈자리가 있는 경우에는 큐에 요청을 추가한다.
큐가 가득 차 있는 경우에는 새 요청은 버린다.
지정된 시간마다 큐에서 요청을 꺼내어 처리한다.
누출 버킷 알고리즘은 다음의 두 인자를 사용한다.
버킷 크기 : 큐 사이즈와 같은 값이다. 큐에는 처리될 항목들이 보관된다.
처리율(outflow rate) : 지정된 시간당 몇 개의 항목을 처리할지 지정하는 값이다. 보통 초 단위로 표현된다.
장점
큐의 크기가 제한되어 있어 메모리 사용량 측면에서 효율적이다.
고정된 처리율을 갖고 있기 때문에 안정적 출력이 필요한 경우에 적합하다.
단점
단시간에 많은 트래픽이 몰리는 경우 큐에는 오래된 요청들이 쌓이게 되고, 그 요청들을 제때 처리하지 못하면 최신 요청들이 버려지게 된다.
두 개 인자를 갖고 있는데 이들을 올바르게 튜닝하기가 까다로울 수 있다.
처리율 제한 알고리즘 - 고정 윈도 카운터 알고리즘
타임라인이 고정된 간격의 윈도(window)로 나누고, 각 윈도마다 카운터를 붙인다.
요청이 접수될 때마다 이 카운터의 값은 1씩 증가한다.
이 카운터의 값이 사전에 설정된 임계치(threshold)에 도달하면 새로운 요청이 새 윈도가 열릴 때까지 버려진다.
이 알고리즘의 가장 큰 문제는 윈도의 경계 부근에 순간적으로 많은 트래픽이 몰릴 경우 윈도에 할당된 양보다 더 많은 요청이 처리될 수 있다는 것이다.