CV ‐ 5. Keypoints - waegari/waegari.github.io GitHub Wiki

Keypoint Detection

Keypoint(키포인트): 이미지에서 특징적인 위치를 나타내는 점으로, 특정 위치(산봉우리, 건물 모서리, 입구 등)나 독특한 패턴이 있는 지점
활용 분야:
- 서로 다른 이미지에서 상응하는 위치 찾기(카메라 포즈 계산 선행 작업)
- 다른 이미지 정렬(image mosaics 생성, 비디오 안정화)
- 객체 인식 및 분류
장점: 잡음(clutter)이나 가림(occlusion), 큰 스케일과 방향 변화에도 매칭이 가능함

스케일 공간 구성(Scale space construction)
- 가우시안 커널을 이용해 여러 스케일에서의 이미지 생성
- 옥타브(octave)별로 구성: 각 옥타브는 다른 스케일 σ 사용
DoG(Difference of Gaussian) 계산
- 인접한 가우시안 이미지 간의 차이 계산
- 에지 검출에 사용되는 방법으로, 스케일 공간에서 픽셀 값 변화 탐지
Local Extrema 검출
- 3x3x3 블록 내에서 DoG 이미지의 극값(local extrema) 찾기
- 주변 26개 이웃 픽셀과 비교하여 최대값 또는 최소값인 픽셀을 특징점 후보로 선정
불안정한 키포인트 제거
- 대비(contrast)가 낮은 점이나 에지 위의 점 제거
방향(Orientation) 할당
- 각 키포인트에 지역 이미지 그래디언트를 기반으로 방향 할당
- 회전 불변성 확보
디스크립터(Descriptor) 생성
- 키포인트 주변 영역을 4x4 영역으로 나누고, 각 영역에서 8방향 그래디언트 히스토그램 계산
- 128(8x4x4) 차원의 디스크립터 벡터 생성

적분 이미지 계산
- 효율적인 박스 필터 연산을 위한 전처리
Hessian 행렬 결정자(Determinant) 계산
- 2차 가우스 커널 대신 박스 필터로 근사화
- det(Happrox) = Dxx * Dyy - ω * Dxy² (ω = 0.83)
결정자 응답 정규화
- 스케일에 따른 응답 정규화
Non-maximal Suppression과 임계값 적용
- 26개 이웃 내에서 최대값 찾기
- 임계값으로 필터링
관심점(interest point) 방향 계산
- 하르 웨이블릿(Haar wavelet) 응답을 이용한 방향 할당
관심점 디스크립터 계산
- 주요 방향을 따라 20σ 크기의 영역에서 계산

탐지기	기본 원리	특징	장단점
Harris	구조 행렬 M의 고유값	코너 응답 R = det(M) - k×trace(M)²	+ 회전, 이동 불변- 스케일 변화에 취약
SIFT	DoG와 스케일 공간	128차원 디스크립터	+ 스케일, 회전, 밝기 변화에 강인- 계산 비용 높음
SURF	Hessian 행렬과 박스 필터	Haar 웨이블릿 사용	+ SIFT보다 빠름+ 스케일, 회전 불변- 복잡한 변형에 SIFT보다 약함
LIFT	딥러닝 기반	전체 파이프라인 학습	+ 높은 매칭 성능- 학습 데이터에 의존적

Harris detector
- 코너 응답: R = det(M) - k×trace(M)²
- 평평한 영역(flat): 모든 방향으로 변화 없음 (λ₁≈λ₂≈0)
- 에지(edge): 에지 방향으로 변화 없음 (λ₁>>λ₂ 또는 λ₂>>λ₁)
- 코너(corner): 모든 방향으로 상당한 변화 (λ₁, λ₂ 모두 큼)
- 회전, 이동에는 불변하지만 스케일 변화에는 불변하지 않음
SIFT detector
- 스케일 공간: σ는 가우시안 커널의 표준편차
- DoG(Difference of Gaussian): 인접 가우시안 이미지의 차이
- 로컬 익스트리마(Local Extrema): 3x3x3 블록 내 최대/최소값
- 디스크립터: 8방향 그래디언트 히스토그램(8×4×4=128차원)
- 매칭 기준: d₁/d₂ < 0.49 (최근접 거리/차근접 거리)
SURF detector
- 적분 이미지와 박스 필터로 속도 개선
- Hessian 행렬 결정자: det(Happrox) = Dxx * Dyy - ω * Dxy²
- Haar 웨이블릿을 이용한 방향 및 디스크립터 계산
- 일반적으로 64차원 디스크립터 사용
LIFT detector
- 딥러닝 기반 접근법
- 검출기, 방향 추정기, 디스크립터 세 가지 주요 구성요소
- 전체 특징점 처리 과정을 학습을 통해 최적화