AI CPU SERVER 인스턴스 검토 - 100-hours-a-week/5-yeosa-wiki GitHub Wiki

1. 태스크별 리소스 제한 (cgroups 기준)

테스크 그룹 CPU 제한 (core 수) 메모리 제한 (MB) 설명
공통 워커 (분류/중복/품질/태깅 등) 1 core 1024MB 메시지 큐 기반 직렬 처리 워커 1개. 여러 작업을 하나의 워커에서 순차적으로 처리하므로 실제 코어 사용량은 낮고, 1코어만 제한
CLIP 임베딩 2 cores 2048MB 이미지 배치 임베딩 태스크. 평균 CPU 사용률이 높아 멀티코어 제한 필요.
여분 코어 확보 1 core (제한 없음) OS 및 비제한 작업 cgroups로 제한되지 않은 나머지 프로세스(FastAPI 서버, 로그 처리, 기타 백그라운드 등)에 자동 분산됨. 안정적 스케줄링 및 예기치 않은 부하 대응을 위해 최소 1코어는 여유로 남겨둠
  • 필요 조건: vCPU4, mem 8GB

2. 인스턴스 사양 및 비용 비교

  • 50GB 디스크
인스턴스 vCPU(논리 코어) * MEM(GB) 한달 예상 비용 (시간당) 특징 요약
e2-standard-4 4 (물리 코어 2개) 16GB US$126.81
(시간당 약 US$0.17) 가장 저렴, CPU 성능은 보통
n2-standard-4 4 (물리 코어 2개) 16GB US$146.97
(시간당 약 US$0.20) 최고 성능, 비용은 가장 높음
n2d-standard-4 4 (물리 코어 2개) 16GB US$128.04
시간당 약 US$0.18 AMD 기반 고성능, 가성비 좋음
  • GCP vCPU = 하이퍼스레딩 기반 논리 코어. 일반적으로 2 vCPU = 1 물리 코어 기준
  • e2 시리즈는 예측성이 낮다
    • e2 인스턴스는 GCP가 가용성, 비용 최적화를 위해 다양한 CPU 플랫폼을 자동으로 선택

      항목 설명
      CPU 종류 Intel Broadwell, Skylake, Haswell, AMD EPYC 등 섞여 있음
      배정 시점 VM을 시작하거나 재시작할 때마다 다른 CPU 플랫폼이 할당될 수 있음
      결과 같은 e2-highcpu-8이라도, 어떤 VM은 최신 Skylake 기반, 어떤 VM은 오래된 Haswell 기반이 될 수 있음
    • 같은 코드, 같은 이미지, 같은 환경에서도 CPU 모델이 달라지면 처리 속도나 성능이 달라질 수 있음