CV3‐문제 - waegari/waegari.github.io GitHub Wiki

Edge Detection

1부: 문제 (객관식 20개, 주관식 단답형 5개)

객관식 문제

객관식 1: 엣지(edge)에 대한 설명으로 옳은 것을 모두 고르시오.

엣지는 이미지에서 강도(intensity)가 급격하게 변하는 지점이다.
엣지 방향(edge direction)은 그래디언트 방향과 동일하다.
엣지는 객체 인식과 기하학적 정보 복구에 활용된다.
모든 엣지는 항상 객체의 경계를 나타낸다.

객관식 2: 다음 중 엣지가 발생하는 원인으로 옳은 것을 모두 고르시오.

Surface normal discontinuity
Depth discontinuity
Surface color discontinuity
Continuity preservation

객관식 3: 엣지 설명자(edge descriptor)에 관한 설명으로 옳은 것을 모두 고르시오.

Edge direction은 강도 변화가 최대인 방향에 수직이다.
Edge strength는 그래디언트 크기(magnitude)와 관련이 있다.
Edge position은 엣지가 위치한 이미지 지점이다.
Edge normal은 엣지 방향과 평행하다.

객관식 4: 이미지 그래디언트(gradient)에 관한 설명으로 틀린 것을 모두 고르시오.

그래디언트 벡터는 강도가 가장 빠르게 감소하는 방향을 가리킨다.
그래디언트 방향은 θ = tan⁻¹(∂f/∂y / ∂f/∂x)로 계산한다.
그래디언트 크기는 ||∇f|| = √[(∂f/∂x)² + (∂f/∂y)²]로 계산한다.
그래디언트 방향은 엣지 방향과 수직이다.

객관식 5: 노이즈가 있는 이미지에서 엣지를 탐지할 때 문제점과 해결책으로 옳은 것을 모두 고르시오.

미분 연산은 노이즈에 민감하게 반응한다.
가우시안 필터로 이미지를 스무딩 후 미분하면 노이즈 문제를 줄일 수 있다.
스무딩을 강하게 할수록 엣지 위치의 정확도가 항상 높아진다.
Convolution의 미분 정리는 d/dx(f * g) = f * (d/dx g)로 표현된다.

객관식 6: Prewitt 연산자에 대한 설명으로 옳은 것을 모두 고르시오.

x방향 마스크는 [[-1, 0, 1], [-1, 0, 1], -1, 0, 1]이다.
y방향 마스크는 [[-1, -1, -1], [0, 0, 0], 1, 1, 1]이다.
Sobel 연산자보다 대각선 방향 엣지에 더 민감하다.
3x3 크기의 마스크를 사용한다.

객관식 7: Sobel 연산자에 대한 설명으로 틀린 것을 모두 고르시오.

x방향 마스크는 [[-1, 0, 1], [-2, 0, 2], -1, 0, 1]이다.
y방향 마스크의 중앙값은 0이다.
Prewitt 연산자와 마스크 크기가 다르다.
중앙 픽셀에 더 큰 가중치를 부여한다.

객관식 8: 엣지 탐지 과정의 4단계를 순서대로 올바르게 나열한 것은?

가우시안 필터링 → 그래디언트 계산 → 비최대 억제 → 임계값 처리와 연결
그래디언트 계산 → 가우시안 필터링 → 비최대 억제 → 임계값 처리와 연결
가우시안 필터링 → 비최대 억제 → 그래디언트 계산 → 임계값 처리와 연결
그래디언트 계산 → 비최대 억제 → 가우시안 필터링 → 임계값 처리와 연결

객관식 9: Canny edge detector의 특성으로 옳은 것을 모두 고르시오.

가우시안 필터의 1차 미분은 신호 대 잡음비와 위치화의 곱을 최적화한다.
비최대 억제(non-maximum suppression)를 통해 엣지를 세선화한다.
이중 임계값(hysteresis thresholding)을 사용한다.
이론적 모델은 가우시안 노이즈가 있는 스텝 엣지(step edge)이다.

객관식 10: 가우시안 필터 크기(σ)가 엣지 탐지에 미치는 영향으로 옳은 것을 모두 고르시오.

σ가 클수록 큰 스케일의 엣지를 탐지한다.
σ가 작을수록 세밀한 특징(fine features)을 더 잘 탐지한다.
σ가 클수록 노이즈에 민감해진다.
σ가 클수록 위치 정확도가 향상된다.

객관식 11: 비최대 억제(Non-maximum suppression)에 대한 설명으로 옳은 것을 모두 고르시오.

그래디언트 방향을 따라 로컬 최대값만 유지한다.
다중 픽셀 폭의 "ridge"를 단일 픽셀 폭으로 줄인다.
픽셀 위치(q)에서 그래디언트 방향에 수직인 두 이웃 값을 비교한다.
그래디언트 크기 이미지에 직접 적용한다.

객관식 12: 이중 임계값(Hysteresis thresholding)에 대한 설명으로 틀린 것을 모두 고르시오.

높은 임계값과 낮은 임계값, 두 가지를 사용한다.
높은 임계값으로 약한 엣지 픽셀을 식별한다.
낮은 임계값으로 강한 엣지 픽셀과 연결된 약한 엣지 픽셀을 유지한다.
단일 임계값보다 효과적으로 노이즈를 제거한다.

객관식 13: 최적 엣지 탐지기(optimal edge detector)의 세 가지 기준으로 옳은 것을 모두 고르시오.

Good detection: 거짓 양성과 거짓 음성 최소화
Good localization: 탐지된 엣지가 실제 엣지에 최대한 가깝게 위치
Maximum response: 각 엣지 포인트에서 최대 응답 생성
Single response: 하나의 실제 엣지에 대해 하나의 응답만 생성

객관식 14: atan2 함수에 대한 설명으로 옳은 것을 모두 고르시오.

double atan2(double y, double x) 형태로 호출한다.
결과는 -π ~ π 범위의 값을 반환한다.
각 인자의 부호를 고려하여 사분면을 정확히 결정한다.
atan2(-1, -1)는 -135° 값을 반환한다.

객관식 15: 다음 중 엣지 탐지 기법의 역사적 순서로 옳은 것은?

Roberts → Sobel → Prewitt → Canny
Prewitt → Roberts → Sobel → Canny
Sobel → Prewitt → Roberts → Canny
Roberts → Prewitt → Sobel → Canny

객관식 16: 스무딩과 위치화(localization) 사이의 trade-off에 대한 설명으로 옳은 것을 모두 고르시오.

스무딩은 노이즈를 제거하지만 엣지를 흐릿하게 만든다.
큰 마스크 크기는 노이즈를 줄이지만 위치 정확도를 저하시킨다.
작은 마스크 크기는 위치 정확도가 높지만 노이즈에 취약하다.
완벽한 스무딩과 완벽한 위치화를 동시에 달성할 수 있다.

객관식 17: 엣지 연결(Edge linking)에 관한 설명으로 옳은 것을 모두 고르시오.

그래디언트 방향을 이용하여 다음 엣지 포인트를 예측한다.
엣지 방향에 수직인 접선을 구성한다.
높은 임계값으로 시작하여 낮은 임계값의 포인트로 연결을 확장한다.
모든 엣지 포인트는 항상 서로 8-연결(8-connected)되어 있다.

객관식 18: F-measure를 계산하는 공식으로 옳은 것은?

F = (precision + recall) / 2
F = precision × recall
F = 2 × (precision × recall) / (precision + recall)
F = √(precision² + recall²)

객관식 19: 딥러닝 기반 경계 탐지 방법으로 알려진 것을 모두 고르시오.

CASENet
DexiNed
MobileNet
RefineContourNet

객관식 20: 엣지 탐지 성능을 평가하는 방법으로 옳은 것을 모두 고르시오.

ODS(Optimal Dataset Scale): 데이터셋 전체에 고정 임계값 적용
OIS(Optimal Image Scale): 각 이미지마다 최적 임계값 선택
Precision: 탐지된 엣지 중 실제 엣지의 비율
Recall: 실제 엣지 중 탐지된 엣지의 비율

주관식 단답형 문제

주관식 1: 이미지에서 강도(intensity)가 급격하게 변하는 지점을 무엇이라고 하는가?

주관식 2: Canny edge detector에서 다중 픽셀 폭의 "ridge"를 단일 픽셀 폭으로 줄이는 과정을 무엇이라고 하는가?

주관식 3: 아래 마스크는 어떤 연산자의 x방향 마스크인가?

[[-1, 0, 1],
 [-2, 0, 2],
 [-1, 0, 1]]

주관식 4: 그래디언트 방향(gradient direction)과 엣지 방향(edge direction)의 관계는?

주관식 5: Canny edge detector에서 높은 임계값과 낮은 임계값을 사용하는 기법을 무엇이라고 하는가?

2부: 정답

객관식 정답

1, 3
1, 2, 3
1, 2, 3
1
1, 2, 4
1, 2, 4
3
1
1, 2, 3, 4
1, 2
1, 2, 4
2
1, 2, 4
1, 2, 3, 4
1
1, 2, 3
1, 2, 3
3
1, 2, 4
1, 2, 3, 4

주관식 정답

Edge(엣지)
Non-maximum suppression(비최대 억제)
Sobel operator(소벨 연산자)
Perpendicular(수직) 또는 Orthogonal(직교)
Hysteresis thresholding(이중 임계값 처리)

3부: 해설

객관식 해설

객관식 1: 엣지는 이미지에서 강도가 급격하게 변하는 지점이며(1), 객체 인식과 기하학적 정보 복구에 활용됩니다(3). 하지만 엣지 방향은 그래디언트 방향과 수직이며(2 오답), 모든 엣지가 객체의 경계를 나타내는 것은 아닙니다(4 오답). 일부 엣지는 텍스처나 그림자에 의해 발생할 수 있습니다.

객관식 2: 엣지가 발생하는 원인으로는 표면 법선 불연속성(1), 깊이 불연속성(2), 표면 색상 불연속성(3)이 있습니다. '연속성 보존'(4)은 엣지의 원인이 아닙니다.

객관식 3: Edge direction은 강도 변화가 최대인 방향에 수직이고(1), Edge strength는 그래디언트 크기와 관련이 있으며(2), Edge position은 엣지가 위치한 이미지 지점입니다(3). Edge normal은 엣지 방향과 수직이 아니라 엣지 방향 자체가 normal입니다(4 오답).

객관식 4: 그래디언트 벡터는 강도가 가장 빠르게 증가하는 방향을 가리키며, 가장 빠르게 감소하는 방향이 아닙니다(1 오답). 나머지 설명(2,3,4)은 모두 옳습니다.

객관식 5: 미분 연산은 노이즈에 민감하게 반응하며(1), 가우시안 필터로 이미지를 스무딩 후 미분하면 노이즈 문제를 줄일 수 있습니다(2). Convolution의 미분 정리는 d/dx(f * g) = f * (d/dx g)로 정확합니다(4). 하지만 스무딩을 강하게 할수록 엣지 위치의 정확도가 감소하며, 항상 높아지는 것이 아닙니다(3 오답).

객관식 6: Prewitt 연산자의 x방향 마스크는 [[-1, 0, 1], [-1, 0, 1], -1, 0, 1] (1), y방향 마스크는 [[-1, -1, -1], [0, 0, 0], 1, 1, 1] (2)이며, 3x3 크기의 마스크를 사용합니다(4). 하지만 Sobel 연산자보다 대각선 방향 엣지에 더 민감한 것은 아닙니다(3 오답).

객관식 7: Sobel 연산자의 x방향 마스크는 [[-1, 0, 1], [-2, 0, 2], -1, 0, 1] (1)이며, y방향 마스크의 중앙값은 0입니다(2). 중앙 픽셀에 더 큰 가중치를 부여하는 것은 맞습니다(4). 하지만 Prewitt 연산자와 마스크 크기가 같습니다(둘 다 3x3)(3 오답).

객관식 8: 엣지 탐지의 올바른 순서는 가우시안 필터링 → 그래디언트 계산 → 비최대 억제 → 임계값 처리와 연결입니다(1).

객관식 9: Canny edge detector의 모든 특성이 옳습니다. 가우시안 필터의 1차 미분은 신호 대 잡음비와 위치화의 곱을 최적화하며(1), 비최대 억제를 통해 엣지를 세선화하고(2), 이중 임계값을 사용합니다(3). 그리고 이론적 모델은 가우시안 노이즈가 있는 스텝 엣지입니다(4).

객관식 10: 가우시안 필터 크기(σ)가 클수록 큰 스케일의 엣지를 탐지하며(1), 작을수록 세밀한 특징을 더 잘 탐지합니다(2). 하지만 σ가 작을수록 노이즈에 민감해지며(3 오답), σ가 클수록 위치 정확도가 감소합니다(4 오답).

객관식 11: 비최대 억제는 그래디언트 방향을 따라 로컬 최대값만 유지하고(1), 다중 픽셀 폭의 "ridge"를 단일 픽셀 폭으로 줄이며(2), 그래디언트 크기 이미지에 직접 적용합니다(4). 하지만 그래디언트 방향에 수직이 아니라 그래디언트 방향을 따라 두 이웃 값을 비교합니다(3 오답).

객관식 12: 이중 임계값은 높은 임계값과 낮은 임계값, 두 가지를 사용하며(1), 낮은 임계값으로 강한 엣지 픽셀과 연결된 약한 엣지 픽셀을 유지하고(3), 단일 임계값보다 효과적으로 노이즈를 제거합니다(4). 하지만 높은 임계값으로 강한 엣지 픽셀을 식별하고, 약한 엣지 픽셀은 낮은 임계값으로 식별합니다(2 오답).

객관식 13: 최적 엣지 탐지기의 세 가지 기준은 Good detection(1), Good localization(2), Single response(4)입니다. Maximum response(3 오답)는 기준이 아닙니다.

객관식 14: atan2 함수에 대한 모든 설명이 옳습니다. double atan2(double y, double x) 형태로 호출하며(1), -π ~ π 범위의 값을 반환하고(2), 각 인자의 부호를 고려하여 사분면을 정확히 결정합니다(3). 그리고 atan2(-1, -1)는 -135° 값을 반환합니다(4).

객관식 15: 엣지 탐지 기법의 역사적 순서는 Roberts(1965) → Sobel(1968) → Prewitt(1970) → Canny(1986)입니다(1).

객관식 16: 스무딩은 노이즈를 제거하지만 엣지를 흐릿하게 만들며(1), 큰 마스크 크기는 노이즈를 줄이지만 위치 정확도를 저하시킵니다(2). 작은 마스크 크기는 위치 정확도가 높지만 노이즈에 취약합니다(3). 하지만 완벽한 스무딩과 완벽한 위치화를 동시에 달성할 수 없습니다(4 오답).

객관식 17: 엣지 연결은 그래디언트 방향을 이용하여 다음 엣지 포인트를 예측하고(1), 엣지 방향에 수직인 접선을 구성합니다(2). 높은 임계값으로 시작하여 낮은 임계값의 포인트로 연결을 확장합니다(3). 하지만 모든 엣지 포인트가 항상 서로 8-연결되어 있는 것은 아닙니다(4 오답).

객관식 18: F-measure를 계산하는 공식은 F = 2 × (precision × recall) / (precision + recall)입니다(3).

객관식 19: 딥러닝 기반 경계 탐지 방법으로는 CASENet(1), DexiNed(2), RefineContourNet(4)이 있습니다. MobileNet(3 오답)은 주로 이미지 분류에 사용되는 네트워크입니다.

객관식 20: 엣지 탐지 성능을 평가하는 모든 방법이 옳습니다. ODS(1)와 OIS(2)는 임계값 설정 방법이며, Precision(3)과 Recall(4)은 탐지 성능 측정 지표입니다.

주관식 해설

주관식 1: 이미지에서 강도가 급격하게 변하는 지점을 Edge(엣지)라고 합니다.

주관식 2: Canny edge detector에서 다중 픽셀 폭의 "ridge"를 단일 픽셀 폭으로 줄이는 과정을 Non-maximum suppression(비최대 억제)이라고 합니다.

주관식 3: 주어진 마스크 [[-1, 0, 1], [-2, 0, 2], -1, 0, 1]은 Sobel operator(소벨 연산자)의 x방향 마스크입니다.

주관식 4: 그래디언트 방향(gradient direction)과 엣지 방향(edge direction)은 서로 Perpendicular(수직) 또는 Orthogonal(직교) 관계입니다.

주관식 5: Canny edge detector에서 높은 임계값과 낮은 임계값을 사용하는 기법을 Hysteresis thresholding(이중 임계값 처리)이라고 합니다.