AI GPU SERVER 인스턴스 검토 - 100-hours-a-week/5-yeosa-wiki GitHub Wiki

1. 스타일 변환 태스크 기반 리소스 조건

a. 주요 특징 요약

항목	내용
GPU	T4 기준, 최대 Load: 32%, VRAM 약 3GB
CPU	Peak 사용률: 94.5% (2 vCPU 기준) → ≒ 1.9 코어 사용
메모리(RAM)	평균 22.6%, 피크 22.9% (Colab 12.7GB 중) → 약 3GB 사용
디스크	변화 없음, 캐시 중심, I/O 병목 없음

b. 최소 자원 조건 (단일 요청 처리 기준)

자원 종류	최소 조건	설명
vCPU	`2 vCPU`	평균 사용률 50%, 피크 시 2 vCPU 꽉 채움
메모리	`4GB`	3GB 이상 사용하는 순간 존재, 여유 고려
GPU	`1 x T4`	Load 30% 수준, 충분히 대응 가능
GPU 메모리	`≥ 4GB`	2.9~3.0GB peak, ControlNet 모델 포함
디스크	`≥ 50GB SSD`	모델/LoRA/ControlNet 캐시 포함 최소 요구

c. 권장 자원 조건 (여러 요청 처리 고려 시)

자원 종류	권장 조건	설명
vCPU	`4 vCPU`	2코어는 태스크용, 2코어는 여유/서버 대응
메모리	`8GB`	이미지 크기/해상도 커질 때 대비
GPU	`1 x T4 or better (L4, A10G)`	T4로 충분, 추후 성능 개선 여지 있음
GPU 메모리	`≥ 6GB`	여러 ControlNet 병렬 또는 고해상도 대비
디스크	`100GB SSD`	모델 여러 개 & 이미지 저장 고려

d. GCP 기준 예시 인스턴스

항목	스펙
머신타입	`n1-standard-4` (4 vCPU, 15GB RAM)
GPU	`NVIDIA Tesla T4`
디스크	`100GB pd-ssd`
예상 비용 (서울 리전 기준)	US$326.63
(시간당 약 US$0.45)

n1-highcpu-4: vCPU 4, 메모리 3.6GB (시간당 약 US$0.40)
n1-highcpu-8: vCPU 8, 메모리 7.2GB (시간당 약 US$0.53)
n1-standard-4가 가장 적합함