CV1‐문제 - waegari/waegari.github.io GitHub Wiki
컴퓨터 비전 개요
1부: 문제
객관식 문제 (각 문제당 4개의 선택지)
- Computer Vision과 Image Processing의 차이점으로 맞는 것을 모두 고르시오.
- a) Computer Vision은 이미지 입력을 받아 이미지를 출력한다.
- b) Image Processing은 이미지에서 의미적 정보를 추출하는 데 중점을 둔다.
- c) Computer Vision의 출력은 장면에 대한 지식이다.
- d) Image Processing은 필터링이나 FFT와 같은 방법을 사용한다.
- 컴퓨터 비전의 1970년대 발전 특성으로 맞는 것을 모두 고르시오.
- a) 인공지능의 시각적 인식 구성 요소로 발전했다.
- b) 3D 구조 복구를 시도했다.
- c) 대규모 레이블 데이터셋을 활용했다.
- d) 신경망 기반 학습 알고리즘이 주로 사용되었다.
- Homogeneous Coordinates에 대한 설명으로 틀린 것을 모두 고르시오.
- a) 기존 좌표계에 1을 추가하여 표현한다.
- b) 회전, 스케일링, 전단변형만 표현 가능하다.
- c) (x, y)는 (x, y, 1)로 표현된다.
- d) 행렬 곱셈을 통해 이동(translation)을 표현할 수 있다.
- 컴퓨터 비전의 산업 응용으로 맞는 것을 모두 고르시오.
- a) Optical Character Recognition (OCR)
- b) 자율주행 차량
- c) Image Morphing
- d) Video Match Move
- 컴퓨터 비전의 2010년대 발전 특성으로 맞는 것을 모두 고르시오.
- a) 대규모 레이블 데이터셋 사용 (ImageNet, MS COCO)
- b) 비전과 그래픽 분야의 상호작용 심화
- c) 신경망 기반 학습 알고리즘 도입
- d) 텍스트-이미지 생성 기술 발전
- 이미지를 함수로 표현할 때 맞는 것을 모두 고르시오.
- a) 그레이스케일 이미지는 f: [a,b] × [c,d] → [0,255]로 표현된다.
- b) 컬러 이미지는 각 픽셀마다 하나의 값만 가진다.
- c) 도메인 지원 범위는 이미지가 정의되는 직사각형 영역이다.
- d) 컬러 이미지는 RGB, HSV, Lab 등 다양한 색 공간으로 표현 가능하다.
- OpenCV에서 이미지 표현에 대한 설명으로 맞는 것을 모두 고르시오.
- a) 이미지의 좌상단 코너가 (0,0) 좌표이다.
- b) 그레이스케일 이미지는 m × n 행렬로 표현된다.
- c) 컬러 이미지는 m × n × 3 행렬로 표현된다.
- d) 이미지의 우하단 코너가 (0,0) 좌표이다.
- 2D 회전 변환 행렬에 대한 설명으로 맞는 것을 모두 고르시오.
- a) 시계 방향 회전을 표현한다.
- b) 동차좌표계에서는 3×3 행렬로 표현된다.
- c) 반시계 방향 회전을 표현한다.
- d) 회전 행렬의 요소로 cosθ, sinθ가 사용된다.
- 다음 중 바이오메트릭스 응용으로 맞는 것을 모두 고르시오.
- a) 얼굴 인식
- b) 지문 인식
- c) 홍채 인식
- d) 자율주행 차량
- 다음 중 Hubel & Wiesel의 연구 성과로 맞는 것을 모두 고르시오.
- a) 시각 시스템에서의 정보 처리 발견
- b) 인간의 동물/비동물 이미지 분류가 150ms 내에 이루어짐을 증명
- c) 1981년 노벨의학상 수상
- d) 대규모 레이블 데이터셋 개발
- 컴퓨터 비전에서 픽셀의 표현으로 맞는 것을 모두 고르시오.
- a) 그레이스케일 이미지의 픽셀은 보통 0-255 범위의 값을 가진다.
- b) RGB 컬러 이미지의 픽셀은 3개의 값을 가진다.
- c) 픽셀은 이미지의 최소 단위이다.
- d) 픽셀 값은 항상 정수로만 표현된다.
- 다음 중 Structure from Motion에 대한 설명으로 맞는 것을 모두 고르시오.
- a) 부분적으로 겹치는 수백 장의 사진에서 3D 포인트 모델을 복원한다.
- b) 1970년대에 개발된 기술이다.
- c) 단일 이미지에서만 작동한다.
- d) 3D 복원 및 모델링 기술의 한 종류이다.
- 컴퓨터 비전의 소비자 응용으로 틀린 것을 모두 고르시오.
- a) 이미지 스티칭(Stitching)
- b) 노출 브라케팅(Exposure Bracketing)
- c) 기계 검사(Mechanical Inspection)
- d) 모핑(Morphing)
- 다음 중 컴퓨터 비전의 정의로 가장 적절한 것을 모두 고르시오.
- a) 이미지 입력을 받아 장면에 대한 지식을 출력하는 분야
- b) 이미지를 변환하고 향상시키는 기술
- c) 이미지에서 픽셀과 의미 사이의 간극을 메우는 것
- d) 이미지 입력을 받아 이미지를 출력하는 분야
- 다음 중 컴퓨터 비전에서 발생하는 문제에 대한 설명으로 맞는 것을 모두 고르시오.
- a) 동일한 물체가 다른 각도에서 매우 다르게 보일 수 있다.
- b) 조명 조건에 따라 물체의 외관이 크게 변할 수 있다.
- c) 이미지는 항상 노이즈가 없고 완벽하다.
- d) 2D 이미지에서 3D 정보를 복원하는 것은 간단하다.
- 다음 중 인간 시각 시스템에 관한 설명으로 맞는 것을 모두 고르시오.
- a) Muller-Lyer 착시는 원근감 효과 때문에 발생한다.
- b) Pop-out 효과는 뇌의 병렬 인식 경로에 대한 정보를 제공한다.
- c) 인간의 시각 시스템은 모든 착시 현상을 즉시 인식하고 수정할 수 있다.
- d) Hermann grid 착시는 격자 교차점에서 회색 점이 나타나는 현상이다.
- 동차좌표계(Homogeneous Coordinates)를 사용하는 이유로 맞는 것을 모두 고르시오.
- a) 회전, 스케일링, 전단변형과 함께 이동도 표현 가능하다.
- b) 연산 속도가 일반 좌표계보다 느리다.
- c) 행렬 곱셈으로 모든 변환을 표현할 수 있다.
- d) 3D 공간에서만 사용 가능하다.
- 컴퓨터 비전의 역사적 발전에서 2000년대의 특징으로 맞는 것을 모두 고르시오.
- a) 대규모 레이블 데이터셋 도입
- b) 비전과 그래픽 분야의 상호작용 심화
- c) 데이터 기반 및 기계학습 접근법 발전
- d) 텍스트-이미지 생성 기술 발전
- 컴퓨터 비전에서 이미지 행렬 표현에 대한 설명으로 맞는 것을 모두 고르시오.
- a) 그레이스케일 이미지는 2차원 행렬로 표현된다.
- b) RGB 컬러 이미지는 3차원 행렬로 표현된다.
- c) 행렬의 각 요소는 픽셀 값을 나타낸다.
- d) 이미지 행렬은 항상 정방행렬(square matrix)이다.
- 다음 중 컴퓨터 비전의 현대적 응용으로 틀린 것을 모두 고르시오.
- a) Google Lens와 같은 모바일 비주얼 검색
- b) Mobileye의 자동차 안전 시스템
- c) 완전 자율주행 차량
- d) 전통적인 비디오 감시 시스템
주관식 단답형 문제
-
이미지 입력을 받아 장면에 대한 지식을 출력하는 분야는 무엇인가?
-
1981년 시각 시스템에서의 정보 처리 발견으로 노벨의학상을 받은 연구자들의 이름은?
-
이미지의 최소 단위로, 보통 0-255 범위의 값을 갖는 것은 무엇인가?
-
기존 좌표계에 1을 추가하여 표현하는, 이동(translation)을 포함한 모든 변환을 행렬 곱셈으로 표현할 수 있게 하는 좌표계는?
-
부분적으로 겹치는 수백 장의 사진에서 3D 포인트 모델을 복원하는 기술은?
2부: 정답
객관식 문제 정답
- c, d
- a, b
- b
- a, b
- a, c
- a, c, d
- a, b, c
- b, c, d
- a, b, c
- a, c
- a, b, c
- a, d
- c
- a, c
- a, b
- a, b, d
- a, c
- b, c
- a, b, c
- d
주관식 단답형 정답
- Computer Vision
- Hubel & Wiesel
- pixel
- Homogeneous Coordinates
- Structure from Motion
3부: 해설
객관식 문제 해설
-
Computer Vision은 이미지에서 장면에 대한 지식을 출력하고(c), Image Processing은 필터링이나 FFT와 같은 방법을 사용한다(d). a와 b는 각각 반대의 개념이다.
-
1970년대 컴퓨터 비전은 인공지능의 시각적 인식 구성 요소로 발전했고(a), 3D 구조 복구를 시도했다(b). c와 d는 2010년대의 특징이다.
-
Homogeneous Coordinates은 회전, 스케일링, 전단변형과 함께 이동(translation)도 표현 가능하다. 따라서 b만 틀린 설명이다.
-
OCR(a)과 자율주행 차량(b)은 산업 응용이다. c와 d는 소비자 응용에 해당한다.
-
2010년대에는 ImageNet, MS COCO와 같은 대규모 레이블 데이터셋 사용(a)과 신경망 기반 학습 알고리즘 도입(c)이 특징이다. b는 2000년대, d는 2020년대의 특징이다.
-
그레이스케일 이미지는 f: [a,b] × [c,d] → [0,255]로 표현되고(a), 도메인 지원 범위는 이미지가 정의되는 직사각형 영역이며(c), 컬러 이미지는 다양한 색 공간으로 표현 가능하다(d). b는 틀린 설명으로, 컬러 이미지는 각 픽셀마다 여러 값을 가진다.
-
OpenCV에서 이미지의 좌상단 코너는 (0,0) 좌표이고(a), 그레이스케일 이미지는 m × n 행렬(b), 컬러 이미지는 m × n × 3 행렬로 표현된다(c). d는 틀린 설명이다.
-
2D 회전 변환 행렬은 동차좌표계에서 3×3 행렬로 표현되고(b), 반시계 방향 회전을 표현하며(c), cosθ, sinθ를 사용한다(d). a는 틀린 설명이다.
-
얼굴 인식(a), 지문 인식(b), 홍채 인식(c)은 모두 바이오메트릭스 응용이다. 자율주행 차량(d)은 다른 응용 분야이다.
-
Hubel & Wiesel은 시각 시스템에서의 정보 처리를 발견하고(a) 1981년 노벨의학상을 수상했다(c). b는 Thorpe의 연구이며, d는 관련이 없다.
-
그레이스케일 이미지의 픽셀은 0-255 범위의 값을 가지고(a), RGB 컬러 이미지의 픽셀은 3개의 값을 가지며(b), 픽셀은 이미지의 최소 단위이다(c). d는 틀린 설명으로, 픽셀 값은 실수로도 표현될 수 있다.
-
Structure from Motion은 부분적으로 겹치는 사진에서 3D 모델을 복원하고(a), 3D 복원 기술의 한 종류이다(d). b와 c는 틀린 설명이다.
-
소비자 응용은 이미지 스티칭(a), 노출 브라케팅(b), 모핑(d)이다. 기계 검사(c)는 산업 응용이므로 틀린 것이다.
-
컴퓨터 비전은 이미지 입력을 받아 장면에 대한 지식을 출력하는 분야(a)이며, 픽셀과 의미 사이의 간극을 메우는 것(c)이다. b와 d는 이미지 처리의 정의에 가깝다.
-
동일한 물체가 다른 각도에서 다르게 보이고(a), 조명 조건에 따라 외관이 변할 수 있다(b). c와 d는 틀린 설명이다.
-
Muller-Lyer 착시는 원근감 효과 때문에 발생하고(a), Pop-out 효과는 병렬 인식 경로 정보를 제공하며(b), Hermann grid 착시는 격자 교차점에 회색 점이 나타난다(d). c는 틀린 설명이다.
-
동차좌표계는 모든 변환을 행렬 곱셈으로 표현할 수 있고(c), 이동도 표현 가능하다(a). b와 d는 틀린 설명이다.
-
2000년대는 비전과 그래픽의 상호작용 심화(b)와 데이터 기반/기계학습 접근법 발전(c)이 특징이다. a는 2010년대, d는 2020년대의 특징이다.
-
그레이스케일 이미지는 2차원 행렬(a), RGB 이미지는 3차원 행렬(b)로 표현되며, 각 요소는 픽셀 값이다(c). d는 틀린 설명으로, 이미지 행렬은 정방행렬이 아닐 수 있다.
-
현대적 응용은 모바일 비주얼 검색(a), 자동차 안전 시스템(b), 자율주행 차량(c)이다. 전통적인 비디오 감시 시스템(d)은 오래된 기술이므로 틀린 것이다.
주관식 단답형 해설
-
Computer Vision은 이미지 입력을 받아 장면에 대한 지식(객체, 사람, 활동 등)을 출력하는 분야이다.
-
Hubel & Wiesel은 시각 시스템에서의 정보 처리 발견으로 1981년 노벨의학상을 수상했다.
-
Pixel은 이미지의 최소 단위로, 그레이스케일 이미지에서는 보통 0-255 범위의 값을 갖는다.
-
Homogeneous Coordinates는 기존 좌표계에 1을 추가하여 이동을 포함한 모든 변환을 행렬 곱셈으로 표현할 수 있게 한다.
-
Structure from Motion은 부분적으로 겹치는 수백 장의 사진에서 3D 포인트 모델을 복원하는 기술이다.