CLIP 성능 테스트 - 100-hours-a-week/5-yeosa-wiki GitHub Wiki
1. 평균값 요약
항목 |
평균 |
실행 시간 |
3.61초 |
평균 CPU 사용량 |
590.76% |
최대 CPU 사용량 |
624.62% |
평균 메모리 사용량 |
1496.76MB |
최대 메모리 사용량 |
1518.07MB |
2. 분석 요약
a. 처리 시간 (3.61초)
- 전체 100장을 batch size 1로 순차 처리했을 때 기준
- 예상보다 꽤 빠름 → 내부적으로 처리 병렬화가 잘 이루어졌다고 볼 수 있음
b. CPU 사용량 (~590%)
- 시스템이 평균 5.9개 논리 코어를 full load로 활용 중
- 추론 연산은 대부분 멀티스레드 기반으로 분산 처리되고 있음
- PyTorch 내부에서 OpenMP 또는 MKL 스레드를 자동 활용하는 것으로 보임
c. 메모리 사용량 (~1.5GB)
- 모델 자체 + 이미지 100장 + 추론 텐서가 포함된 합리적인 수치
- 이미지 입력 수는 고정이고 batch가 작기 때문에, 큰 메모리 사용량 변화는 없음
- 다만 측정 간 최대 200MB 정도의 편차 발생 → 시스템 캐시나 배경 쓰레드 영향 가능성