AI CPU SERVER 인스턴스 검토 - 100-hours-a-week/5-yeosa-wiki GitHub Wiki
1. 태스크별 리소스 제한 (cgroups 기준)
테스크 그룹 | CPU 제한 (core 수) | 메모리 제한 (MB) | 설명 |
---|---|---|---|
공통 워커 (분류/중복/품질/태깅 등) | 1 core |
1024MB |
메시지 큐 기반 직렬 처리 워커 1개. 여러 작업을 하나의 워커에서 순차적으로 처리하므로 실제 코어 사용량은 낮고, 1코어만 제한 |
CLIP 임베딩 | 2 cores |
2048MB |
이미지 배치 임베딩 태스크. 평균 CPU 사용률이 높아 멀티코어 제한 필요. |
여분 코어 확보 | 1 core (제한 없음) |
OS 및 비제한 작업 | cgroups로 제한되지 않은 나머지 프로세스(FastAPI 서버, 로그 처리, 기타 백그라운드 등)에 자동 분산됨. 안정적 스케줄링 및 예기치 않은 부하 대응을 위해 최소 1코어는 여유로 남겨둠 |
- 필요 조건: vCPU4, mem 8GB
2. 인스턴스 사양 및 비용 비교
- 50GB 디스크
인스턴스 | vCPU(논리 코어) * | MEM(GB) | 한달 예상 비용 (시간당) | 특징 요약 |
---|---|---|---|---|
e2-standard-4 | 4 (물리 코어 2개) | 16GB | US$126.81 | |
(시간당 약 US$0.17) | 가장 저렴, CPU 성능은 보통 | |||
n2-standard-4 | 4 (물리 코어 2개) | 16GB | US$146.97 | |
(시간당 약 US$0.20) | 최고 성능, 비용은 가장 높음 | |||
n2d-standard-4 |
4 (물리 코어 2개) | 16GB | US$128.04 | |
시간당 약 US$0.18 | AMD 기반 고성능, 가성비 좋음 |
- GCP vCPU = 하이퍼스레딩 기반 논리 코어. 일반적으로 2 vCPU = 1 물리 코어 기준
- e2 시리즈는 예측성이 낮다
-
e2
인스턴스는 GCP가 가용성, 비용 최적화를 위해 다양한 CPU 플랫폼을 자동으로 선택항목 설명 CPU 종류 Intel Broadwell, Skylake, Haswell, AMD EPYC 등 섞여 있음 배정 시점 VM을 시작하거나 재시작할 때마다 다른 CPU 플랫폼이 할당될 수 있음 결과 같은 e2-highcpu-8
이라도, 어떤 VM은 최신 Skylake 기반, 어떤 VM은 오래된 Haswell 기반이 될 수 있음 -
같은 코드, 같은 이미지, 같은 환경에서도 CPU 모델이 달라지면 처리 속도나 성능이 달라질 수 있음
-