CLIP 성능 테스트 - 100-hours-a-week/5-yeosa-wiki GitHub Wiki

1. 평균값 요약

항목 평균
실행 시간 3.61초
평균 CPU 사용량 590.76%
최대 CPU 사용량 624.62%
평균 메모리 사용량 1496.76MB
최대 메모리 사용량 1518.07MB

2. 분석 요약

a. 처리 시간 (3.61초)

  • 전체 100장을 batch size 1로 순차 처리했을 때 기준
  • 예상보다 꽤 빠름 → 내부적으로 처리 병렬화가 잘 이루어졌다고 볼 수 있음

b. CPU 사용량 (~590%)

  • 시스템이 평균 5.9개 논리 코어를 full load로 활용 중
  • 추론 연산은 대부분 멀티스레드 기반으로 분산 처리되고 있음
  • PyTorch 내부에서 OpenMP 또는 MKL 스레드를 자동 활용하는 것으로 보임

c. 메모리 사용량 (~1.5GB)

  • 모델 자체 + 이미지 100장 + 추론 텐서가 포함된 합리적인 수치
  • 이미지 입력 수는 고정이고 batch가 작기 때문에, 큰 메모리 사용량 변화는 없음
  • 다만 측정 간 최대 200MB 정도의 편차 발생 → 시스템 캐시나 배경 쓰레드 영향 가능성