CV5‐문제 - waegari/waegari.github.io GitHub Wiki

컴퓨터비전 - Keypoint Detection

1부: 문제

객관식 문제

  1. Harris corner detector에 대한 설명으로 맞는 것을 모두 고르시오.
  • a) 스케일 변화에 불변(invariant)하다.
  • b) 회전 변화에 불변(invariant)하다.
  • c) 밝기 오프셋(brightness offset)에 불변(invariant)하다.
  • d) 구조 행렬(structure matrix) M의 고유값(eigenvalues)을 사용한다.
  1. Harris corner detector에서 코너(corner)에 해당하는 특성은?
  • a) 두 고유값(λ₁, λ₂)이 모두 큰 값을 가진다.
  • b) 한 고유값이 크고 다른 고유값이 작다.
  • c) 두 고유값이 모두 작은 값을 가진다.
  • d) 코너 응답 R(corner response)이 음수값을 가진다.
  1. SIFT(Scale Invariant Feature Transform)에 대한 설명으로 틀린 것을 모두 고르시오.
  • a) DoG(Difference of Gaussian)를 이용해 feature point를 찾는다.
  • b) 스케일 변화에 불변(invariant)하다.
  • c) 일반적으로 64차원의 디스크립터(descriptor)를 생성한다.
  • d) Local extrema detection을 위해 3x3x3 블록 내 26개 이웃과 비교한다.
  1. SIFT 알고리즘의 주요 단계를 순서대로 나열한 것으로 올바른 것은?
  • a) 스케일 공간 구성 → DoG 계산 → Local extrema 검출 → 디스크립터 생성
  • b) DoG 계산 → 스케일 공간 구성 → Local extrema 검출 → 방향 할당
  • c) 스케일 공간 구성 → Local extrema 검출 → 방향 할당 → 디스크립터 생성
  • d) DoG 계산 → Local extrema 검출 → 스케일 공간 구성 → 디스크립터 생성
  1. SIFT에서 이미지 매칭 시 특징점 간의 유사성을 판단하는 방법으로 올바른 것은?
  • a) 최근접 거리(d₁)와 차근접 거리(d₂)의 비율이 임계값보다 작을 때
  • b) 최근접 거리(d₁)가 절대적인 임계값보다 작을 때
  • c) 최근접 거리(d₁)와 차근접 거리(d₂)의 합이 임계값보다 작을 때
  • d) 차근접 거리(d₂)가 절대적인 임계값보다 클 때
  1. SURF(Speeded Up Robust Features)에 대한 설명으로 맞는 것을 모두 고르시오.
  • a) SIFT보다 계산 속도가 빠르다.
  • b) Hessian 행렬의 결정자(determinant)를 사용한다.
  • c) Haar 웨이블릿(wavelet)을 이용해 방향을 할당한다.
  • d) 적분 이미지(integral image)를 사용하지 않는다.
  1. SURF 알고리즘에서 SIFT와 비교하여 속도를 향상시키기 위해 사용하는 기술로 맞는 것을 모두 고르시오.
  • a) 박스 필터(box filter)를 이용한 가우시안 필터 근사화
  • b) 적분 이미지(integral image) 사용
  • c) 스케일 공간(scale space) 구성 생략
  • d) 이미지 다운샘플링(downsampling) 없이 처리
  1. LIFT(Learned Invariant Feature Transform)에 대한 설명으로 맞는 것을 모두 고르시오.
  • a) 딥러닝 기반 특징점 추출 방법이다.
  • b) Detector, Orientation Estimator, Descriptor 세 가지 주요 구성요소가 있다.
  • c) SIFT보다 계산 속도가 빠르다.
  • d) 전통적인 컴퓨터 비전 알고리즘만을 사용한다.
  1. Harris corner detector의 코너 응답 함수(Corner Response Function)는 다음 중 어느 것인가?
  • a) R = det(M) - k × trace(M)²
  • b) R = det(M) + k × trace(M)²
  • c) R = det(M) / trace(M)
  • d) R = trace(M) - k × det(M)
  1. 스케일 공간(Scale space)에 대한 설명으로 맞는 것을 모두 고르시오.
  • a) 이미지를 다양한 스케일에서 표현하기 위해 사용된다.
  • b) 가우시안 커널(Gaussian kernel)을 이용해 생성된다.
  • c) 옥타브(octave)별로 구성되며, 각 옥타브는 서로 다른 스케일 σ를 사용한다.
  • d) 스케일이 커질수록 이미지의 해상도가 증가한다.
  1. DoG(Difference of Gaussian)에 대한 설명으로 틀린 것을 모두 고르시오.
  • a) 인접한 가우시안 이미지의 차이를 계산한 것이다.
  • b) LoG(Laplacian of Gaussian)의 근사화로 사용된다.
  • c) 계산 속도가 빠르기 때문에 SIFT에서 사용된다.
  • d) 스케일 공간에서 에지(edge)를 제거하는 데 주로 사용된다.
  1. SIFT 디스크립터(descriptor)에 대한 설명으로 맞는 것을 모두 고르시오.
  • a) 일반적으로 128차원의 벡터로 표현된다.
  • b) 그래디언트 방향(gradient orientation)과 크기(magnitude)를 이용해 계산된다.
  • c) 4x4 영역으로 나누고, 각 영역에서 8방향 그래디언트 히스토그램을 계산한다.
  • d) L1 정규화(normalization)를 적용해 조명 변화에 강인하게 만든다.
  1. SURF에서 Hessian 행렬 근사식으로 올바른 것은?
  • a) det(Happrox) = Dxx * Dyy - ω * Dxy²
  • b) det(Happrox) = Dxx + Dyy - ω * Dxy
  • c) det(Happrox) = (Dxx * Dyy)² - ω * Dxy
  • d) det(Happrox) = (Dxx + Dyy) - ω * (Dxy)²
  1. 다음 중 keypoint detector의 특성에 대한 설명으로 맞는 것을 모두 고르시오.
  • a) Harris detector는 스케일 변화에 약하다.
  • b) SIFT는 회전에 불변(invariant)하다.
  • c) SURF는 SIFT보다 계산 효율이 낮다.
  • d) LIFT는 학습 데이터에 의존적이다.
  1. 키포인트 매칭(keypoint matching)에 대한 설명으로 맞는 것을 모두 고르시오.
  • a) 서로 다른 이미지에서 유사한 특징점을 찾는 과정이다.
  • b) 일반적으로 유클리드 거리(Euclidean distance)를 이용해 디스크립터 간 유사도를 측정한다.
  • c) SIFT는 최근접 거리와 차근접 거리의 비율을 이용한다.
  • d) 매칭된 키포인트 수가 많을수록 두 이미지의 유사도가 높다고 판단할 수 있다.
  1. 다음 중 SURF 알고리즘의 주요 단계를 순서대로 나열한 것으로 올바른 것은?
  • a) 적분 이미지 계산 → Hessian 행렬 결정자 계산 → 결정자 응답 정규화 → 관심점 방향 계산 → 디스크립터 계산
  • b) Hessian 행렬 결정자 계산 → 적분 이미지 계산 → 결정자 응답 정규화 → 관심점 방향 계산 → 디스크립터 계산
  • c) 적분 이미지 계산 → 결정자 응답 정규화 → Hessian 행렬 결정자 계산 → 관심점 방향 계산 → 디스크립터 계산
  • d) Hessian 행렬 결정자 계산 → 결정자 응답 정규화 → 적분 이미지 계산 → 관심점 방향 계산 → 디스크립터 계산
  1. 스케일 불변성(scale invariance)에 대한 설명으로 맞는 것을 모두 고르시오.
  • a) 이미지 크기가 변해도 동일한 특징점을 검출할 수 있는 특성이다.
  • b) Harris detector는 스케일 불변성을 가지고 있다.
  • c) SIFT는 스케일 공간(scale space)을 구성하여 스케일 불변성을 확보한다.
  • d) SURF는 스케일 불변성을 가지고 있지 않다.
  1. LIFT와 다른 keypoint detector를 비교한 설명으로 틀린 것을 모두 고르시오.
  • a) LIFT는 딥러닝 기반 접근법으로 SIFT보다 높은 매칭 성능을 보인다.
  • b) LIFT는 다양한 데이터셋에서 기존 방법들보다 낮은 매칭 점수를 기록했다.
  • c) LIFT는 전체 특징점 처리 과정을 학습을 통해 최적화한다.
  • d) LIFT는 검출기, 방향 추정기, 디스크립터 세 가지 주요 구성요소를 갖는다.
  1. Harris detector에서 구조 행렬 M의 고유값(eigenvalues)에 따른 특성 분류로 올바른 것은?
  • a) λ₁≈0, λ₂≈0: 평평한 영역(flat region)
  • b) λ₁>>λ₂: 코너(corner)
  • c) λ₁≈λ₂, 둘 다 큰 값: 에지(edge)
  • d) λ₁≈λ₂, 둘 다 작은 값: 코너(corner)
  1. 다음 중 SIFT와 SURF의 공통점으로 맞는 것을 모두 고르시오.
  • a) 스케일 불변성(scale invariance)을 가진다.
  • b) 회전 불변성(rotation invariance)을 가진다.
  • c) 특징점의 방향(orientation)을 할당한다.
  • d) 동일한 차원의 디스크립터를 생성한다.

주관식 단답형 문제

  1. Harris corner detector에서 코너 응답 함수 R = det(M) - k × trace(M)²에서 k의 일반적인 값 범위는?

  2. SIFT 디스크립터(descriptor)의 차원은?

  3. SURF 알고리즘에서 계산 속도를 향상시키기 위해 사용하는 이미지 표현 방식은?

  4. SIFT에서 이미지 특징점의 스케일 불변성(scale invariance)을 위해 사용하는 핵심 기술은?

  5. LIFT detector에서 딥러닝 아키텍처의 세 가지 주요 구성요소는?

2부: 정답

객관식 문제 정답

  1. b, c, d
  2. a
  3. c
  4. a
  5. a
  6. a, b, c
  7. a, b
  8. a, b
  9. a
  10. a, b, c
  11. d
  12. a, b, c
  13. a
  14. a, b, d
  15. a, b, c, d
  16. a
  17. a, c
  18. b
  19. a
  20. a, b, c

주관식 단답형 문제 정답

  1. 0.04~0.06
  2. 128
  3. 적분 이미지(integral image)
  4. DoG(Difference of Gaussian)
  5. Detector, Orientation Estimator, Descriptor

3부: 해설

객관식 문제 해설

  1. 정답: b, c, d

    • Harris detector는 스케일 변화에 불변하지 않음
    • 회전과 밝기 오프셋에는 불변함
    • 구조 행렬 M의 고유값을 사용하여 코너, 에지, 평평한 영역을 구분함
  2. 정답: a

    • 코너(corner)는 두 고유값(λ₁, λ₂)이 모두 큰 값을 가짐
    • 에지(edge)는 한 고유값이 크고 다른 고유값이 작음
    • 평평한 영역(flat region)은 두 고유값이 모두 작음
    • 코너 응답 R이 양수일 때 코너로 판단함
  3. 정답: c

    • SIFT는 일반적으로 128차원(4×4×8)의 디스크립터를 생성함(64차원이 아님)
    • 나머지 설명은 모두 맞음
  4. 정답: a

    • SIFT 알고리즘의 순서는 스케일 공간 구성 → DoG 계산 → Local extrema 검출 → 키포인트 위치 정교화 → 방향 할당 → 디스크립터 생성
  5. 정답: a

    • SIFT에서는 최근접 거리(d₁)와 차근접 거리(d₂)의 비율이 임계값(보통 0.49)보다 작을 때 매칭된다고 판단함
  6. 정답: a, b, c

    • SURF는 SIFT보다 계산 속도가 빠름
    • Hessian 행렬의 결정자(determinant)를 사용함
    • Haar 웨이블릿을 이용해 방향을 할당함
    • 적분 이미지를 사용하여 속도를 향상시킴
  7. 정답: a, b

    • SURF는 박스 필터와 적분 이미지를 사용하여 계산 속도를 향상시킴
    • 스케일 공간은 여전히 구성함
    • 이미지 다운샘플링을 사용함
  8. 정답: a, b

    • LIFT는 딥러닝 기반 특징점 추출 방법임
    • Detector, Orientation Estimator, Descriptor 세 가지 주요 구성요소가 있음
    • 계산 속도가 SIFT보다 빠르다는 것은 언급되지 않음
    • 딥러닝을 사용하므로 전통적인 컴퓨터 비전 알고리즘만을 사용하지 않음
  9. 정답: a

    • Harris corner detector의 코너 응답 함수는 R = det(M) - k × trace(M)²
  10. 정답: a, b, c

    • 스케일 공간은 다양한 스케일에서 이미지를 표현하기 위해 사용됨
    • 가우시안 커널을 이용해 생성됨
    • 옥타브별로 구성되며, 각 옥타브는 서로 다른 스케일 σ를 사용함
    • 스케일이 커질수록 이미지 해상도는 감소함(다운샘플링)
  11. 정답: d

    • DoG는 에지를 제거하는 데 주로 사용되지 않고, 특징점(keypoint)을 검출하는 데 사용됨
    • 나머지 설명은 모두 맞음
  12. 정답: a, b, c

    • SIFT 디스크립터는 128차원(4×4×8) 벡터로 표현됨
    • 그래디언트 방향과 크기를 이용해 계산됨
    • 4x4 영역으로 나누고, 각 영역에서 8방향 그래디언트 히스토그램을 계산함
    • L2 정규화를 적용함(L1이 아님)
  13. 정답: a

    • SURF에서 Hessian 행렬 근사식은 det(Happrox) = Dxx * Dyy - ω * Dxy² (ω = 0.83)
  14. 정답: a, b, d

    • Harris detector는 스케일 변화에 약함
    • SIFT는 회전에 불변함
    • SURF는 SIFT보다 계산 효율이 높음(더 빠름)
    • LIFT는 학습 데이터에 의존적임
  15. 정답: a, b, c, d

    • 키포인트 매칭은 서로 다른 이미지에서 유사한 특징점을 찾는 과정임
    • 유클리드 거리(L2 거리)를 이용해 디스크립터 간 유사도를 측정함
    • SIFT는 최근접 거리와 차근접 거리의 비율을 이용함
    • 일반적으로 매칭된 키포인트 수가 많을수록 두 이미지의 유사도가 높다고 판단할 수 있음
  16. 정답: a

    • SURF 알고리즘의 순서는 적분 이미지 계산 → Hessian 행렬 결정자 계산 → 결정자 응답 정규화 → 관심점 방향 계산 → 디스크립터 계산
  17. 정답: a, c

    • 스케일 불변성은 이미지 크기가 변해도 동일한 특징점을 검출할 수 있는 특성임
    • Harris detector는 스케일 불변성을 가지고 있지 않음
    • SIFT는 스케일 공간을 구성하여 스케일 불변성을 확보함
    • SURF도 스케일 불변성을 가지고 있음
  18. 정답: b

    • LIFT는 다양한 데이터셋에서 기존 방법들보다 높은 매칭 점수를 기록함
    • 나머지 설명은 모두 맞음
  19. 정답: a

    • λ₁≈0, λ₂≈0: 평평한 영역(flat region)
    • λ₁>>λ₂ 또는 λ₂>>λ₁: 에지(edge)
    • λ₁≈λ₂, 둘 다 큰 값: 코너(corner)
  20. 정답: a, b, c

    • SIFT와 SURF 모두 스케일 불변성을 가짐
    • 둘 다 회전 불변성을 가짐
    • 둘 다 특징점의 방향을 할당함
    • SIFT는 128차원, SURF는 일반적으로 64차원의 디스크립터를 생성함(차원이 다름)

주관식 단답형 문제 해설

  1. 정답: 0.04~0.06

    • Harris corner detector에서 코너 응답 함수 계산 시 사용되는 k의 일반적인 값 범위는 0.04에서 0.06 사이임
  2. 정답: 128

    • SIFT 디스크립터는 4×4 영역에서 각각 8방향 히스토그램을 계산하여 128(4×4×8)차원의 벡터로 표현됨
  3. 정답: 적분 이미지(integral image)

    • SURF는 적분 이미지를 사용하여 박스 필터 연산의 계산 속도를 크게 향상시킴
  4. 정답: DoG(Difference of Gaussian)

    • SIFT에서는 DoG를 이용해 스케일 공간에서 local extrema를 찾아 스케일 불변성을 확보함
  5. 정답: Detector, Orientation Estimator, Descriptor

    • LIFT는 Detector(검출기), Orientation Estimator(방향 추정기), Descriptor(디스크립터) 세 가지 주요 구성요소로 이루어진 딥러닝 아키텍처를 사용함