CV5‐문제 - waegari/waegari.github.io GitHub Wiki

컴퓨터비전 - Keypoint Detection

1부: 문제

객관식 문제

Harris corner detector에 대한 설명으로 맞는 것을 모두 고르시오.

a) 스케일 변화에 불변(invariant)하다.
b) 회전 변화에 불변(invariant)하다.
c) 밝기 오프셋(brightness offset)에 불변(invariant)하다.
d) 구조 행렬(structure matrix) M의 고유값(eigenvalues)을 사용한다.

Harris corner detector에서 코너(corner)에 해당하는 특성은?

a) 두 고유값(λ₁, λ₂)이 모두 큰 값을 가진다.
b) 한 고유값이 크고 다른 고유값이 작다.
c) 두 고유값이 모두 작은 값을 가진다.
d) 코너 응답 R(corner response)이 음수값을 가진다.

SIFT(Scale Invariant Feature Transform)에 대한 설명으로 틀린 것을 모두 고르시오.

a) DoG(Difference of Gaussian)를 이용해 feature point를 찾는다.
b) 스케일 변화에 불변(invariant)하다.
c) 일반적으로 64차원의 디스크립터(descriptor)를 생성한다.
d) Local extrema detection을 위해 3x3x3 블록 내 26개 이웃과 비교한다.

SIFT 알고리즘의 주요 단계를 순서대로 나열한 것으로 올바른 것은?

a) 스케일 공간 구성 → DoG 계산 → Local extrema 검출 → 디스크립터 생성
b) DoG 계산 → 스케일 공간 구성 → Local extrema 검출 → 방향 할당
c) 스케일 공간 구성 → Local extrema 검출 → 방향 할당 → 디스크립터 생성
d) DoG 계산 → Local extrema 검출 → 스케일 공간 구성 → 디스크립터 생성

SIFT에서 이미지 매칭 시 특징점 간의 유사성을 판단하는 방법으로 올바른 것은?

a) 최근접 거리(d₁)와 차근접 거리(d₂)의 비율이 임계값보다 작을 때
b) 최근접 거리(d₁)가 절대적인 임계값보다 작을 때
c) 최근접 거리(d₁)와 차근접 거리(d₂)의 합이 임계값보다 작을 때
d) 차근접 거리(d₂)가 절대적인 임계값보다 클 때

SURF(Speeded Up Robust Features)에 대한 설명으로 맞는 것을 모두 고르시오.

a) SIFT보다 계산 속도가 빠르다.
b) Hessian 행렬의 결정자(determinant)를 사용한다.
c) Haar 웨이블릿(wavelet)을 이용해 방향을 할당한다.
d) 적분 이미지(integral image)를 사용하지 않는다.

SURF 알고리즘에서 SIFT와 비교하여 속도를 향상시키기 위해 사용하는 기술로 맞는 것을 모두 고르시오.

a) 박스 필터(box filter)를 이용한 가우시안 필터 근사화
b) 적분 이미지(integral image) 사용
c) 스케일 공간(scale space) 구성 생략
d) 이미지 다운샘플링(downsampling) 없이 처리

LIFT(Learned Invariant Feature Transform)에 대한 설명으로 맞는 것을 모두 고르시오.

a) 딥러닝 기반 특징점 추출 방법이다.
b) Detector, Orientation Estimator, Descriptor 세 가지 주요 구성요소가 있다.
c) SIFT보다 계산 속도가 빠르다.
d) 전통적인 컴퓨터 비전 알고리즘만을 사용한다.

Harris corner detector의 코너 응답 함수(Corner Response Function)는 다음 중 어느 것인가?

a) R = det(M) - k × trace(M)²
b) R = det(M) + k × trace(M)²
c) R = det(M) / trace(M)
d) R = trace(M) - k × det(M)

스케일 공간(Scale space)에 대한 설명으로 맞는 것을 모두 고르시오.

a) 이미지를 다양한 스케일에서 표현하기 위해 사용된다.
b) 가우시안 커널(Gaussian kernel)을 이용해 생성된다.
c) 옥타브(octave)별로 구성되며, 각 옥타브는 서로 다른 스케일 σ를 사용한다.
d) 스케일이 커질수록 이미지의 해상도가 증가한다.

DoG(Difference of Gaussian)에 대한 설명으로 틀린 것을 모두 고르시오.

a) 인접한 가우시안 이미지의 차이를 계산한 것이다.
b) LoG(Laplacian of Gaussian)의 근사화로 사용된다.
c) 계산 속도가 빠르기 때문에 SIFT에서 사용된다.
d) 스케일 공간에서 에지(edge)를 제거하는 데 주로 사용된다.

SIFT 디스크립터(descriptor)에 대한 설명으로 맞는 것을 모두 고르시오.

a) 일반적으로 128차원의 벡터로 표현된다.
b) 그래디언트 방향(gradient orientation)과 크기(magnitude)를 이용해 계산된다.
c) 4x4 영역으로 나누고, 각 영역에서 8방향 그래디언트 히스토그램을 계산한다.
d) L1 정규화(normalization)를 적용해 조명 변화에 강인하게 만든다.

SURF에서 Hessian 행렬 근사식으로 올바른 것은?

a) det(Happrox) = Dxx * Dyy - ω * Dxy²
b) det(Happrox) = Dxx + Dyy - ω * Dxy
c) det(Happrox) = (Dxx * Dyy)² - ω * Dxy
d) det(Happrox) = (Dxx + Dyy) - ω * (Dxy)²

다음 중 keypoint detector의 특성에 대한 설명으로 맞는 것을 모두 고르시오.

a) Harris detector는 스케일 변화에 약하다.
b) SIFT는 회전에 불변(invariant)하다.
c) SURF는 SIFT보다 계산 효율이 낮다.
d) LIFT는 학습 데이터에 의존적이다.

키포인트 매칭(keypoint matching)에 대한 설명으로 맞는 것을 모두 고르시오.

a) 서로 다른 이미지에서 유사한 특징점을 찾는 과정이다.
b) 일반적으로 유클리드 거리(Euclidean distance)를 이용해 디스크립터 간 유사도를 측정한다.
c) SIFT는 최근접 거리와 차근접 거리의 비율을 이용한다.
d) 매칭된 키포인트 수가 많을수록 두 이미지의 유사도가 높다고 판단할 수 있다.

다음 중 SURF 알고리즘의 주요 단계를 순서대로 나열한 것으로 올바른 것은?

a) 적분 이미지 계산 → Hessian 행렬 결정자 계산 → 결정자 응답 정규화 → 관심점 방향 계산 → 디스크립터 계산
b) Hessian 행렬 결정자 계산 → 적분 이미지 계산 → 결정자 응답 정규화 → 관심점 방향 계산 → 디스크립터 계산
c) 적분 이미지 계산 → 결정자 응답 정규화 → Hessian 행렬 결정자 계산 → 관심점 방향 계산 → 디스크립터 계산
d) Hessian 행렬 결정자 계산 → 결정자 응답 정규화 → 적분 이미지 계산 → 관심점 방향 계산 → 디스크립터 계산

스케일 불변성(scale invariance)에 대한 설명으로 맞는 것을 모두 고르시오.

a) 이미지 크기가 변해도 동일한 특징점을 검출할 수 있는 특성이다.
b) Harris detector는 스케일 불변성을 가지고 있다.
c) SIFT는 스케일 공간(scale space)을 구성하여 스케일 불변성을 확보한다.
d) SURF는 스케일 불변성을 가지고 있지 않다.

LIFT와 다른 keypoint detector를 비교한 설명으로 틀린 것을 모두 고르시오.

a) LIFT는 딥러닝 기반 접근법으로 SIFT보다 높은 매칭 성능을 보인다.
b) LIFT는 다양한 데이터셋에서 기존 방법들보다 낮은 매칭 점수를 기록했다.
c) LIFT는 전체 특징점 처리 과정을 학습을 통해 최적화한다.
d) LIFT는 검출기, 방향 추정기, 디스크립터 세 가지 주요 구성요소를 갖는다.

Harris detector에서 구조 행렬 M의 고유값(eigenvalues)에 따른 특성 분류로 올바른 것은?

a) λ₁≈0, λ₂≈0: 평평한 영역(flat region)
b) λ₁>>λ₂: 코너(corner)
c) λ₁≈λ₂, 둘 다 큰 값: 에지(edge)
d) λ₁≈λ₂, 둘 다 작은 값: 코너(corner)

다음 중 SIFT와 SURF의 공통점으로 맞는 것을 모두 고르시오.

a) 스케일 불변성(scale invariance)을 가진다.
b) 회전 불변성(rotation invariance)을 가진다.
c) 특징점의 방향(orientation)을 할당한다.
d) 동일한 차원의 디스크립터를 생성한다.

주관식 단답형 문제

Harris corner detector에서 코너 응답 함수 R = det(M) - k × trace(M)²에서 k의 일반적인 값 범위는?
SIFT 디스크립터(descriptor)의 차원은?
SURF 알고리즘에서 계산 속도를 향상시키기 위해 사용하는 이미지 표현 방식은?
SIFT에서 이미지 특징점의 스케일 불변성(scale invariance)을 위해 사용하는 핵심 기술은?
LIFT detector에서 딥러닝 아키텍처의 세 가지 주요 구성요소는?

2부: 정답

객관식 문제 정답

b, c, d
a
c
a
a
a, b, c
a, b
a, b
a
a, b, c
d
a, b, c
a
a, b, d
a, b, c, d
a
a, c
b
a
a, b, c

주관식 단답형 문제 정답

0.04~0.06
128
적분 이미지(integral image)
DoG(Difference of Gaussian)
Detector, Orientation Estimator, Descriptor

3부: 해설

객관식 문제 해설

정답: b, c, d
- Harris detector는 스케일 변화에 불변하지 않음
- 회전과 밝기 오프셋에는 불변함
- 구조 행렬 M의 고유값을 사용하여 코너, 에지, 평평한 영역을 구분함
정답: a
- 코너(corner)는 두 고유값(λ₁, λ₂)이 모두 큰 값을 가짐
- 에지(edge)는 한 고유값이 크고 다른 고유값이 작음
- 평평한 영역(flat region)은 두 고유값이 모두 작음
- 코너 응답 R이 양수일 때 코너로 판단함
정답: c
- SIFT는 일반적으로 128차원(4×4×8)의 디스크립터를 생성함(64차원이 아님)
- 나머지 설명은 모두 맞음
정답: a
- SIFT 알고리즘의 순서는 스케일 공간 구성 → DoG 계산 → Local extrema 검출 → 키포인트 위치 정교화 → 방향 할당 → 디스크립터 생성
정답: a
- SIFT에서는 최근접 거리(d₁)와 차근접 거리(d₂)의 비율이 임계값(보통 0.49)보다 작을 때 매칭된다고 판단함
정답: a, b, c
- SURF는 SIFT보다 계산 속도가 빠름
- Hessian 행렬의 결정자(determinant)를 사용함
- Haar 웨이블릿을 이용해 방향을 할당함
- 적분 이미지를 사용하여 속도를 향상시킴
정답: a, b
- SURF는 박스 필터와 적분 이미지를 사용하여 계산 속도를 향상시킴
- 스케일 공간은 여전히 구성함
- 이미지 다운샘플링을 사용함
정답: a, b
- LIFT는 딥러닝 기반 특징점 추출 방법임
- Detector, Orientation Estimator, Descriptor 세 가지 주요 구성요소가 있음
- 계산 속도가 SIFT보다 빠르다는 것은 언급되지 않음
- 딥러닝을 사용하므로 전통적인 컴퓨터 비전 알고리즘만을 사용하지 않음
정답: a
- Harris corner detector의 코너 응답 함수는 R = det(M) - k × trace(M)²
정답: a, b, c
- 스케일 공간은 다양한 스케일에서 이미지를 표현하기 위해 사용됨
- 가우시안 커널을 이용해 생성됨
- 옥타브별로 구성되며, 각 옥타브는 서로 다른 스케일 σ를 사용함
- 스케일이 커질수록 이미지 해상도는 감소함(다운샘플링)
정답: d
- DoG는 에지를 제거하는 데 주로 사용되지 않고, 특징점(keypoint)을 검출하는 데 사용됨
- 나머지 설명은 모두 맞음
정답: a, b, c
- SIFT 디스크립터는 128차원(4×4×8) 벡터로 표현됨
- 그래디언트 방향과 크기를 이용해 계산됨
- 4x4 영역으로 나누고, 각 영역에서 8방향 그래디언트 히스토그램을 계산함
- L2 정규화를 적용함(L1이 아님)
정답: a
- SURF에서 Hessian 행렬 근사식은 det(Happrox) = Dxx * Dyy - ω * Dxy² (ω = 0.83)
정답: a, b, d
- Harris detector는 스케일 변화에 약함
- SIFT는 회전에 불변함
- SURF는 SIFT보다 계산 효율이 높음(더 빠름)
- LIFT는 학습 데이터에 의존적임
정답: a, b, c, d
- 키포인트 매칭은 서로 다른 이미지에서 유사한 특징점을 찾는 과정임
- 유클리드 거리(L2 거리)를 이용해 디스크립터 간 유사도를 측정함
- SIFT는 최근접 거리와 차근접 거리의 비율을 이용함
- 일반적으로 매칭된 키포인트 수가 많을수록 두 이미지의 유사도가 높다고 판단할 수 있음
정답: a
- SURF 알고리즘의 순서는 적분 이미지 계산 → Hessian 행렬 결정자 계산 → 결정자 응답 정규화 → 관심점 방향 계산 → 디스크립터 계산
정답: a, c
- 스케일 불변성은 이미지 크기가 변해도 동일한 특징점을 검출할 수 있는 특성임
- Harris detector는 스케일 불변성을 가지고 있지 않음
- SIFT는 스케일 공간을 구성하여 스케일 불변성을 확보함
- SURF도 스케일 불변성을 가지고 있음
정답: b
- LIFT는 다양한 데이터셋에서 기존 방법들보다 높은 매칭 점수를 기록함
- 나머지 설명은 모두 맞음
정답: a
- λ₁≈0, λ₂≈0: 평평한 영역(flat region)
- λ₁>>λ₂ 또는 λ₂>>λ₁: 에지(edge)
- λ₁≈λ₂, 둘 다 큰 값: 코너(corner)
정답: a, b, c
- SIFT와 SURF 모두 스케일 불변성을 가짐
- 둘 다 회전 불변성을 가짐
- 둘 다 특징점의 방향을 할당함
- SIFT는 128차원, SURF는 일반적으로 64차원의 디스크립터를 생성함(차원이 다름)

주관식 단답형 문제 해설

정답: 0.04~0.06
- Harris corner detector에서 코너 응답 함수 계산 시 사용되는 k의 일반적인 값 범위는 0.04에서 0.06 사이임
정답: 128
- SIFT 디스크립터는 4×4 영역에서 각각 8방향 히스토그램을 계산하여 128(4×4×8)차원의 벡터로 표현됨
정답: 적분 이미지(integral image)
- SURF는 적분 이미지를 사용하여 박스 필터 연산의 계산 속도를 크게 향상시킴
정답: DoG(Difference of Gaussian)
- SIFT에서는 DoG를 이용해 스케일 공간에서 local extrema를 찾아 스케일 불변성을 확보함
정답: Detector, Orientation Estimator, Descriptor
- LIFT는 Detector(검출기), Orientation Estimator(방향 추정기), Descriptor(디스크립터) 세 가지 주요 구성요소로 이루어진 딥러닝 아키텍처를 사용함