CV5‐문제 - waegari/waegari.github.io GitHub Wiki
컴퓨터비전 - Keypoint Detection
1부: 문제
객관식 문제
- Harris corner detector에 대한 설명으로 맞는 것을 모두 고르시오.
- a) 스케일 변화에 불변(invariant)하다.
- b) 회전 변화에 불변(invariant)하다.
- c) 밝기 오프셋(brightness offset)에 불변(invariant)하다.
- d) 구조 행렬(structure matrix) M의 고유값(eigenvalues)을 사용한다.
- Harris corner detector에서 코너(corner)에 해당하는 특성은?
- a) 두 고유값(λ₁, λ₂)이 모두 큰 값을 가진다.
- b) 한 고유값이 크고 다른 고유값이 작다.
- c) 두 고유값이 모두 작은 값을 가진다.
- d) 코너 응답 R(corner response)이 음수값을 가진다.
- SIFT(Scale Invariant Feature Transform)에 대한 설명으로 틀린 것을 모두 고르시오.
- a) DoG(Difference of Gaussian)를 이용해 feature point를 찾는다.
- b) 스케일 변화에 불변(invariant)하다.
- c) 일반적으로 64차원의 디스크립터(descriptor)를 생성한다.
- d) Local extrema detection을 위해 3x3x3 블록 내 26개 이웃과 비교한다.
- SIFT 알고리즘의 주요 단계를 순서대로 나열한 것으로 올바른 것은?
- a) 스케일 공간 구성 → DoG 계산 → Local extrema 검출 → 디스크립터 생성
- b) DoG 계산 → 스케일 공간 구성 → Local extrema 검출 → 방향 할당
- c) 스케일 공간 구성 → Local extrema 검출 → 방향 할당 → 디스크립터 생성
- d) DoG 계산 → Local extrema 검출 → 스케일 공간 구성 → 디스크립터 생성
- SIFT에서 이미지 매칭 시 특징점 간의 유사성을 판단하는 방법으로 올바른 것은?
- a) 최근접 거리(d₁)와 차근접 거리(d₂)의 비율이 임계값보다 작을 때
- b) 최근접 거리(d₁)가 절대적인 임계값보다 작을 때
- c) 최근접 거리(d₁)와 차근접 거리(d₂)의 합이 임계값보다 작을 때
- d) 차근접 거리(d₂)가 절대적인 임계값보다 클 때
- SURF(Speeded Up Robust Features)에 대한 설명으로 맞는 것을 모두 고르시오.
- a) SIFT보다 계산 속도가 빠르다.
- b) Hessian 행렬의 결정자(determinant)를 사용한다.
- c) Haar 웨이블릿(wavelet)을 이용해 방향을 할당한다.
- d) 적분 이미지(integral image)를 사용하지 않는다.
- SURF 알고리즘에서 SIFT와 비교하여 속도를 향상시키기 위해 사용하는 기술로 맞는 것을 모두 고르시오.
- a) 박스 필터(box filter)를 이용한 가우시안 필터 근사화
- b) 적분 이미지(integral image) 사용
- c) 스케일 공간(scale space) 구성 생략
- d) 이미지 다운샘플링(downsampling) 없이 처리
- LIFT(Learned Invariant Feature Transform)에 대한 설명으로 맞는 것을 모두 고르시오.
- a) 딥러닝 기반 특징점 추출 방법이다.
- b) Detector, Orientation Estimator, Descriptor 세 가지 주요 구성요소가 있다.
- c) SIFT보다 계산 속도가 빠르다.
- d) 전통적인 컴퓨터 비전 알고리즘만을 사용한다.
- Harris corner detector의 코너 응답 함수(Corner Response Function)는 다음 중 어느 것인가?
- a) R = det(M) - k × trace(M)²
- b) R = det(M) + k × trace(M)²
- c) R = det(M) / trace(M)
- d) R = trace(M) - k × det(M)
- 스케일 공간(Scale space)에 대한 설명으로 맞는 것을 모두 고르시오.
- a) 이미지를 다양한 스케일에서 표현하기 위해 사용된다.
- b) 가우시안 커널(Gaussian kernel)을 이용해 생성된다.
- c) 옥타브(octave)별로 구성되며, 각 옥타브는 서로 다른 스케일 σ를 사용한다.
- d) 스케일이 커질수록 이미지의 해상도가 증가한다.
- DoG(Difference of Gaussian)에 대한 설명으로 틀린 것을 모두 고르시오.
- a) 인접한 가우시안 이미지의 차이를 계산한 것이다.
- b) LoG(Laplacian of Gaussian)의 근사화로 사용된다.
- c) 계산 속도가 빠르기 때문에 SIFT에서 사용된다.
- d) 스케일 공간에서 에지(edge)를 제거하는 데 주로 사용된다.
- SIFT 디스크립터(descriptor)에 대한 설명으로 맞는 것을 모두 고르시오.
- a) 일반적으로 128차원의 벡터로 표현된다.
- b) 그래디언트 방향(gradient orientation)과 크기(magnitude)를 이용해 계산된다.
- c) 4x4 영역으로 나누고, 각 영역에서 8방향 그래디언트 히스토그램을 계산한다.
- d) L1 정규화(normalization)를 적용해 조명 변화에 강인하게 만든다.
- SURF에서 Hessian 행렬 근사식으로 올바른 것은?
- a) det(Happrox) = Dxx * Dyy - ω * Dxy²
- b) det(Happrox) = Dxx + Dyy - ω * Dxy
- c) det(Happrox) = (Dxx * Dyy)² - ω * Dxy
- d) det(Happrox) = (Dxx + Dyy) - ω * (Dxy)²
- 다음 중 keypoint detector의 특성에 대한 설명으로 맞는 것을 모두 고르시오.
- a) Harris detector는 스케일 변화에 약하다.
- b) SIFT는 회전에 불변(invariant)하다.
- c) SURF는 SIFT보다 계산 효율이 낮다.
- d) LIFT는 학습 데이터에 의존적이다.
- 키포인트 매칭(keypoint matching)에 대한 설명으로 맞는 것을 모두 고르시오.
- a) 서로 다른 이미지에서 유사한 특징점을 찾는 과정이다.
- b) 일반적으로 유클리드 거리(Euclidean distance)를 이용해 디스크립터 간 유사도를 측정한다.
- c) SIFT는 최근접 거리와 차근접 거리의 비율을 이용한다.
- d) 매칭된 키포인트 수가 많을수록 두 이미지의 유사도가 높다고 판단할 수 있다.
- 다음 중 SURF 알고리즘의 주요 단계를 순서대로 나열한 것으로 올바른 것은?
- a) 적분 이미지 계산 → Hessian 행렬 결정자 계산 → 결정자 응답 정규화 → 관심점 방향 계산 → 디스크립터 계산
- b) Hessian 행렬 결정자 계산 → 적분 이미지 계산 → 결정자 응답 정규화 → 관심점 방향 계산 → 디스크립터 계산
- c) 적분 이미지 계산 → 결정자 응답 정규화 → Hessian 행렬 결정자 계산 → 관심점 방향 계산 → 디스크립터 계산
- d) Hessian 행렬 결정자 계산 → 결정자 응답 정규화 → 적분 이미지 계산 → 관심점 방향 계산 → 디스크립터 계산
- 스케일 불변성(scale invariance)에 대한 설명으로 맞는 것을 모두 고르시오.
- a) 이미지 크기가 변해도 동일한 특징점을 검출할 수 있는 특성이다.
- b) Harris detector는 스케일 불변성을 가지고 있다.
- c) SIFT는 스케일 공간(scale space)을 구성하여 스케일 불변성을 확보한다.
- d) SURF는 스케일 불변성을 가지고 있지 않다.
- LIFT와 다른 keypoint detector를 비교한 설명으로 틀린 것을 모두 고르시오.
- a) LIFT는 딥러닝 기반 접근법으로 SIFT보다 높은 매칭 성능을 보인다.
- b) LIFT는 다양한 데이터셋에서 기존 방법들보다 낮은 매칭 점수를 기록했다.
- c) LIFT는 전체 특징점 처리 과정을 학습을 통해 최적화한다.
- d) LIFT는 검출기, 방향 추정기, 디스크립터 세 가지 주요 구성요소를 갖는다.
- Harris detector에서 구조 행렬 M의 고유값(eigenvalues)에 따른 특성 분류로 올바른 것은?
- a) λ₁≈0, λ₂≈0: 평평한 영역(flat region)
- b) λ₁>>λ₂: 코너(corner)
- c) λ₁≈λ₂, 둘 다 큰 값: 에지(edge)
- d) λ₁≈λ₂, 둘 다 작은 값: 코너(corner)
- 다음 중 SIFT와 SURF의 공통점으로 맞는 것을 모두 고르시오.
- a) 스케일 불변성(scale invariance)을 가진다.
- b) 회전 불변성(rotation invariance)을 가진다.
- c) 특징점의 방향(orientation)을 할당한다.
- d) 동일한 차원의 디스크립터를 생성한다.
주관식 단답형 문제
-
Harris corner detector에서 코너 응답 함수 R = det(M) - k × trace(M)²에서 k의 일반적인 값 범위는?
-
SIFT 디스크립터(descriptor)의 차원은?
-
SURF 알고리즘에서 계산 속도를 향상시키기 위해 사용하는 이미지 표현 방식은?
-
SIFT에서 이미지 특징점의 스케일 불변성(scale invariance)을 위해 사용하는 핵심 기술은?
-
LIFT detector에서 딥러닝 아키텍처의 세 가지 주요 구성요소는?
2부: 정답
객관식 문제 정답
- b, c, d
- a
- c
- a
- a
- a, b, c
- a, b
- a, b
- a
- a, b, c
- d
- a, b, c
- a
- a, b, d
- a, b, c, d
- a
- a, c
- b
- a
- a, b, c
주관식 단답형 문제 정답
- 0.04~0.06
- 128
- 적분 이미지(integral image)
- DoG(Difference of Gaussian)
- Detector, Orientation Estimator, Descriptor
3부: 해설
객관식 문제 해설
-
정답: b, c, d
- Harris detector는 스케일 변화에 불변하지 않음
- 회전과 밝기 오프셋에는 불변함
- 구조 행렬 M의 고유값을 사용하여 코너, 에지, 평평한 영역을 구분함
-
정답: a
- 코너(corner)는 두 고유값(λ₁, λ₂)이 모두 큰 값을 가짐
- 에지(edge)는 한 고유값이 크고 다른 고유값이 작음
- 평평한 영역(flat region)은 두 고유값이 모두 작음
- 코너 응답 R이 양수일 때 코너로 판단함
-
정답: c
- SIFT는 일반적으로 128차원(4×4×8)의 디스크립터를 생성함(64차원이 아님)
- 나머지 설명은 모두 맞음
-
정답: a
- SIFT 알고리즘의 순서는 스케일 공간 구성 → DoG 계산 → Local extrema 검출 → 키포인트 위치 정교화 → 방향 할당 → 디스크립터 생성
-
정답: a
- SIFT에서는 최근접 거리(d₁)와 차근접 거리(d₂)의 비율이 임계값(보통 0.49)보다 작을 때 매칭된다고 판단함
-
정답: a, b, c
- SURF는 SIFT보다 계산 속도가 빠름
- Hessian 행렬의 결정자(determinant)를 사용함
- Haar 웨이블릿을 이용해 방향을 할당함
- 적분 이미지를 사용하여 속도를 향상시킴
-
정답: a, b
- SURF는 박스 필터와 적분 이미지를 사용하여 계산 속도를 향상시킴
- 스케일 공간은 여전히 구성함
- 이미지 다운샘플링을 사용함
-
정답: a, b
- LIFT는 딥러닝 기반 특징점 추출 방법임
- Detector, Orientation Estimator, Descriptor 세 가지 주요 구성요소가 있음
- 계산 속도가 SIFT보다 빠르다는 것은 언급되지 않음
- 딥러닝을 사용하므로 전통적인 컴퓨터 비전 알고리즘만을 사용하지 않음
-
정답: a
- Harris corner detector의 코너 응답 함수는 R = det(M) - k × trace(M)²
-
정답: a, b, c
- 스케일 공간은 다양한 스케일에서 이미지를 표현하기 위해 사용됨
- 가우시안 커널을 이용해 생성됨
- 옥타브별로 구성되며, 각 옥타브는 서로 다른 스케일 σ를 사용함
- 스케일이 커질수록 이미지 해상도는 감소함(다운샘플링)
-
정답: d
- DoG는 에지를 제거하는 데 주로 사용되지 않고, 특징점(keypoint)을 검출하는 데 사용됨
- 나머지 설명은 모두 맞음
-
정답: a, b, c
- SIFT 디스크립터는 128차원(4×4×8) 벡터로 표현됨
- 그래디언트 방향과 크기를 이용해 계산됨
- 4x4 영역으로 나누고, 각 영역에서 8방향 그래디언트 히스토그램을 계산함
- L2 정규화를 적용함(L1이 아님)
-
정답: a
- SURF에서 Hessian 행렬 근사식은 det(Happrox) = Dxx * Dyy - ω * Dxy² (ω = 0.83)
-
정답: a, b, d
- Harris detector는 스케일 변화에 약함
- SIFT는 회전에 불변함
- SURF는 SIFT보다 계산 효율이 높음(더 빠름)
- LIFT는 학습 데이터에 의존적임
-
정답: a, b, c, d
- 키포인트 매칭은 서로 다른 이미지에서 유사한 특징점을 찾는 과정임
- 유클리드 거리(L2 거리)를 이용해 디스크립터 간 유사도를 측정함
- SIFT는 최근접 거리와 차근접 거리의 비율을 이용함
- 일반적으로 매칭된 키포인트 수가 많을수록 두 이미지의 유사도가 높다고 판단할 수 있음
-
정답: a
- SURF 알고리즘의 순서는 적분 이미지 계산 → Hessian 행렬 결정자 계산 → 결정자 응답 정규화 → 관심점 방향 계산 → 디스크립터 계산
-
정답: a, c
- 스케일 불변성은 이미지 크기가 변해도 동일한 특징점을 검출할 수 있는 특성임
- Harris detector는 스케일 불변성을 가지고 있지 않음
- SIFT는 스케일 공간을 구성하여 스케일 불변성을 확보함
- SURF도 스케일 불변성을 가지고 있음
-
정답: b
- LIFT는 다양한 데이터셋에서 기존 방법들보다 높은 매칭 점수를 기록함
- 나머지 설명은 모두 맞음
-
정답: a
- λ₁≈0, λ₂≈0: 평평한 영역(flat region)
- λ₁>>λ₂ 또는 λ₂>>λ₁: 에지(edge)
- λ₁≈λ₂, 둘 다 큰 값: 코너(corner)
-
정답: a, b, c
- SIFT와 SURF 모두 스케일 불변성을 가짐
- 둘 다 회전 불변성을 가짐
- 둘 다 특징점의 방향을 할당함
- SIFT는 128차원, SURF는 일반적으로 64차원의 디스크립터를 생성함(차원이 다름)
주관식 단답형 문제 해설
-
정답: 0.04~0.06
- Harris corner detector에서 코너 응답 함수 계산 시 사용되는 k의 일반적인 값 범위는 0.04에서 0.06 사이임
-
정답: 128
- SIFT 디스크립터는 4×4 영역에서 각각 8방향 히스토그램을 계산하여 128(4×4×8)차원의 벡터로 표현됨
-
정답: 적분 이미지(integral image)
- SURF는 적분 이미지를 사용하여 박스 필터 연산의 계산 속도를 크게 향상시킴
-
정답: DoG(Difference of Gaussian)
- SIFT에서는 DoG를 이용해 스케일 공간에서 local extrema를 찾아 스케일 불변성을 확보함
-
정답: Detector, Orientation Estimator, Descriptor
- LIFT는 Detector(검출기), Orientation Estimator(방향 추정기), Descriptor(디스크립터) 세 가지 주요 구성요소로 이루어진 딥러닝 아키텍처를 사용함