AI CPU SERVER 인스턴스 검토 - 100-hours-a-week/5-yeosa-wiki GitHub Wiki

1. 태스크별 리소스 제한 (cgroups 기준)

테스크 그룹	CPU 제한 (core 수)	메모리 제한 (MB)	설명
공통 워커 (분류/중복/품질/태깅 등)	`1` core	`1024MB`	메시지 큐 기반 직렬 처리 워커 1개. 여러 작업을 하나의 워커에서 순차적으로 처리하므로 실제 코어 사용량은 낮고, 1코어만 제한
CLIP 임베딩	`2` cores	`2048MB`	이미지 배치 임베딩 태스크. 평균 CPU 사용률이 높아 멀티코어 제한 필요.
여분 코어 확보	`1` core (제한 없음)	OS 및 비제한 작업	cgroups로 제한되지 않은 나머지 프로세스(FastAPI 서버, 로그 처리, 기타 백그라운드 등)에 자동 분산됨. 안정적 스케줄링 및 예기치 않은 부하 대응을 위해 최소 1코어는 여유로 남겨둠

필요 조건: vCPU4, mem 8GB

2. 인스턴스 사양 및 비용 비교

50GB 디스크

인스턴스	vCPU(논리 코어) *	MEM(GB)	한달 예상 비용 (시간당)	특징 요약
e2-standard-4	4 (물리 코어 2개)	16GB	US$126.81
(시간당 약 US$0.17)	가장 저렴, CPU 성능은 보통
n2-standard-4	4 (물리 코어 2개)	16GB	US$146.97
(시간당 약 US$0.20)	최고 성능, 비용은 가장 높음
`n2d-standard-4`	4 (물리 코어 2개)	16GB	US$128.04
시간당 약 US$0.18	AMD 기반 고성능, 가성비 좋음

GCP vCPU = 하이퍼스레딩 기반 논리 코어. 일반적으로 2 vCPU = 1 물리 코어 기준

e2 시리즈는 예측성이 낮다

e2 인스턴스는 GCP가 가용성, 비용 최적화를 위해 다양한 CPU 플랫폼을 자동으로 선택

항목	설명
CPU 종류	Intel Broadwell, Skylake, Haswell, AMD EPYC 등 섞여 있음
배정 시점	VM을 시작하거나 재시작할 때마다 다른 CPU 플랫폼이 할당될 수 있음
결과	같은 `e2-highcpu-8`이라도, 어떤 VM은 최신 Skylake 기반, 어떤 VM은 오래된 Haswell 기반이 될 수 있음

같은 코드, 같은 이미지, 같은 환경에서도 CPU 모델이 달라지면 처리 속도나 성능이 달라질 수 있음