CV1‐문제 - waegari/waegari.github.io GitHub Wiki

컴퓨터 비전 개요

1부: 문제

객관식 문제 (각 문제당 4개의 선택지)

  1. Computer Vision과 Image Processing의 차이점으로 맞는 것을 모두 고르시오.
  • a) Computer Vision은 이미지 입력을 받아 이미지를 출력한다.
  • b) Image Processing은 이미지에서 의미적 정보를 추출하는 데 중점을 둔다.
  • c) Computer Vision의 출력은 장면에 대한 지식이다.
  • d) Image Processing은 필터링이나 FFT와 같은 방법을 사용한다.
  1. 컴퓨터 비전의 1970년대 발전 특성으로 맞는 것을 모두 고르시오.
  • a) 인공지능의 시각적 인식 구성 요소로 발전했다.
  • b) 3D 구조 복구를 시도했다.
  • c) 대규모 레이블 데이터셋을 활용했다.
  • d) 신경망 기반 학습 알고리즘이 주로 사용되었다.
  1. Homogeneous Coordinates에 대한 설명으로 틀린 것을 모두 고르시오.
  • a) 기존 좌표계에 1을 추가하여 표현한다.
  • b) 회전, 스케일링, 전단변형만 표현 가능하다.
  • c) (x, y)는 (x, y, 1)로 표현된다.
  • d) 행렬 곱셈을 통해 이동(translation)을 표현할 수 있다.
  1. 컴퓨터 비전의 산업 응용으로 맞는 것을 모두 고르시오.
  • a) Optical Character Recognition (OCR)
  • b) 자율주행 차량
  • c) Image Morphing
  • d) Video Match Move
  1. 컴퓨터 비전의 2010년대 발전 특성으로 맞는 것을 모두 고르시오.
  • a) 대규모 레이블 데이터셋 사용 (ImageNet, MS COCO)
  • b) 비전과 그래픽 분야의 상호작용 심화
  • c) 신경망 기반 학습 알고리즘 도입
  • d) 텍스트-이미지 생성 기술 발전
  1. 이미지를 함수로 표현할 때 맞는 것을 모두 고르시오.
  • a) 그레이스케일 이미지는 f: [a,b] × [c,d] → [0,255]로 표현된다.
  • b) 컬러 이미지는 각 픽셀마다 하나의 값만 가진다.
  • c) 도메인 지원 범위는 이미지가 정의되는 직사각형 영역이다.
  • d) 컬러 이미지는 RGB, HSV, Lab 등 다양한 색 공간으로 표현 가능하다.
  1. OpenCV에서 이미지 표현에 대한 설명으로 맞는 것을 모두 고르시오.
  • a) 이미지의 좌상단 코너가 (0,0) 좌표이다.
  • b) 그레이스케일 이미지는 m × n 행렬로 표현된다.
  • c) 컬러 이미지는 m × n × 3 행렬로 표현된다.
  • d) 이미지의 우하단 코너가 (0,0) 좌표이다.
  1. 2D 회전 변환 행렬에 대한 설명으로 맞는 것을 모두 고르시오.
  • a) 시계 방향 회전을 표현한다.
  • b) 동차좌표계에서는 3×3 행렬로 표현된다.
  • c) 반시계 방향 회전을 표현한다.
  • d) 회전 행렬의 요소로 cosθ, sinθ가 사용된다.
  1. 다음 중 바이오메트릭스 응용으로 맞는 것을 모두 고르시오.
  • a) 얼굴 인식
  • b) 지문 인식
  • c) 홍채 인식
  • d) 자율주행 차량
  1. 다음 중 Hubel & Wiesel의 연구 성과로 맞는 것을 모두 고르시오.
  • a) 시각 시스템에서의 정보 처리 발견
  • b) 인간의 동물/비동물 이미지 분류가 150ms 내에 이루어짐을 증명
  • c) 1981년 노벨의학상 수상
  • d) 대규모 레이블 데이터셋 개발
  1. 컴퓨터 비전에서 픽셀의 표현으로 맞는 것을 모두 고르시오.
  • a) 그레이스케일 이미지의 픽셀은 보통 0-255 범위의 값을 가진다.
  • b) RGB 컬러 이미지의 픽셀은 3개의 값을 가진다.
  • c) 픽셀은 이미지의 최소 단위이다.
  • d) 픽셀 값은 항상 정수로만 표현된다.
  1. 다음 중 Structure from Motion에 대한 설명으로 맞는 것을 모두 고르시오.
  • a) 부분적으로 겹치는 수백 장의 사진에서 3D 포인트 모델을 복원한다.
  • b) 1970년대에 개발된 기술이다.
  • c) 단일 이미지에서만 작동한다.
  • d) 3D 복원 및 모델링 기술의 한 종류이다.
  1. 컴퓨터 비전의 소비자 응용으로 틀린 것을 모두 고르시오.
  • a) 이미지 스티칭(Stitching)
  • b) 노출 브라케팅(Exposure Bracketing)
  • c) 기계 검사(Mechanical Inspection)
  • d) 모핑(Morphing)
  1. 다음 중 컴퓨터 비전의 정의로 가장 적절한 것을 모두 고르시오.
  • a) 이미지 입력을 받아 장면에 대한 지식을 출력하는 분야
  • b) 이미지를 변환하고 향상시키는 기술
  • c) 이미지에서 픽셀과 의미 사이의 간극을 메우는 것
  • d) 이미지 입력을 받아 이미지를 출력하는 분야
  1. 다음 중 컴퓨터 비전에서 발생하는 문제에 대한 설명으로 맞는 것을 모두 고르시오.
  • a) 동일한 물체가 다른 각도에서 매우 다르게 보일 수 있다.
  • b) 조명 조건에 따라 물체의 외관이 크게 변할 수 있다.
  • c) 이미지는 항상 노이즈가 없고 완벽하다.
  • d) 2D 이미지에서 3D 정보를 복원하는 것은 간단하다.
  1. 다음 중 인간 시각 시스템에 관한 설명으로 맞는 것을 모두 고르시오.
  • a) Muller-Lyer 착시는 원근감 효과 때문에 발생한다.
  • b) Pop-out 효과는 뇌의 병렬 인식 경로에 대한 정보를 제공한다.
  • c) 인간의 시각 시스템은 모든 착시 현상을 즉시 인식하고 수정할 수 있다.
  • d) Hermann grid 착시는 격자 교차점에서 회색 점이 나타나는 현상이다.
  1. 동차좌표계(Homogeneous Coordinates)를 사용하는 이유로 맞는 것을 모두 고르시오.
  • a) 회전, 스케일링, 전단변형과 함께 이동도 표현 가능하다.
  • b) 연산 속도가 일반 좌표계보다 느리다.
  • c) 행렬 곱셈으로 모든 변환을 표현할 수 있다.
  • d) 3D 공간에서만 사용 가능하다.
  1. 컴퓨터 비전의 역사적 발전에서 2000년대의 특징으로 맞는 것을 모두 고르시오.
  • a) 대규모 레이블 데이터셋 도입
  • b) 비전과 그래픽 분야의 상호작용 심화
  • c) 데이터 기반 및 기계학습 접근법 발전
  • d) 텍스트-이미지 생성 기술 발전
  1. 컴퓨터 비전에서 이미지 행렬 표현에 대한 설명으로 맞는 것을 모두 고르시오.
  • a) 그레이스케일 이미지는 2차원 행렬로 표현된다.
  • b) RGB 컬러 이미지는 3차원 행렬로 표현된다.
  • c) 행렬의 각 요소는 픽셀 값을 나타낸다.
  • d) 이미지 행렬은 항상 정방행렬(square matrix)이다.
  1. 다음 중 컴퓨터 비전의 현대적 응용으로 틀린 것을 모두 고르시오.
  • a) Google Lens와 같은 모바일 비주얼 검색
  • b) Mobileye의 자동차 안전 시스템
  • c) 완전 자율주행 차량
  • d) 전통적인 비디오 감시 시스템

주관식 단답형 문제

  1. 이미지 입력을 받아 장면에 대한 지식을 출력하는 분야는 무엇인가?

  2. 1981년 시각 시스템에서의 정보 처리 발견으로 노벨의학상을 받은 연구자들의 이름은?

  3. 이미지의 최소 단위로, 보통 0-255 범위의 값을 갖는 것은 무엇인가?

  4. 기존 좌표계에 1을 추가하여 표현하는, 이동(translation)을 포함한 모든 변환을 행렬 곱셈으로 표현할 수 있게 하는 좌표계는?

  5. 부분적으로 겹치는 수백 장의 사진에서 3D 포인트 모델을 복원하는 기술은?

2부: 정답

객관식 문제 정답

  1. c, d
  2. a, b
  3. b
  4. a, b
  5. a, c
  6. a, c, d
  7. a, b, c
  8. b, c, d
  9. a, b, c
  10. a, c
  11. a, b, c
  12. a, d
  13. c
  14. a, c
  15. a, b
  16. a, b, d
  17. a, c
  18. b, c
  19. a, b, c
  20. d

주관식 단답형 정답

  1. Computer Vision
  2. Hubel & Wiesel
  3. pixel
  4. Homogeneous Coordinates
  5. Structure from Motion

3부: 해설

객관식 문제 해설

  1. Computer Vision은 이미지에서 장면에 대한 지식을 출력하고(c), Image Processing은 필터링이나 FFT와 같은 방법을 사용한다(d). a와 b는 각각 반대의 개념이다.

  2. 1970년대 컴퓨터 비전은 인공지능의 시각적 인식 구성 요소로 발전했고(a), 3D 구조 복구를 시도했다(b). c와 d는 2010년대의 특징이다.

  3. Homogeneous Coordinates은 회전, 스케일링, 전단변형과 함께 이동(translation)도 표현 가능하다. 따라서 b만 틀린 설명이다.

  4. OCR(a)과 자율주행 차량(b)은 산업 응용이다. c와 d는 소비자 응용에 해당한다.

  5. 2010년대에는 ImageNet, MS COCO와 같은 대규모 레이블 데이터셋 사용(a)과 신경망 기반 학습 알고리즘 도입(c)이 특징이다. b는 2000년대, d는 2020년대의 특징이다.

  6. 그레이스케일 이미지는 f: [a,b] × [c,d] → [0,255]로 표현되고(a), 도메인 지원 범위는 이미지가 정의되는 직사각형 영역이며(c), 컬러 이미지는 다양한 색 공간으로 표현 가능하다(d). b는 틀린 설명으로, 컬러 이미지는 각 픽셀마다 여러 값을 가진다.

  7. OpenCV에서 이미지의 좌상단 코너는 (0,0) 좌표이고(a), 그레이스케일 이미지는 m × n 행렬(b), 컬러 이미지는 m × n × 3 행렬로 표현된다(c). d는 틀린 설명이다.

  8. 2D 회전 변환 행렬은 동차좌표계에서 3×3 행렬로 표현되고(b), 반시계 방향 회전을 표현하며(c), cosθ, sinθ를 사용한다(d). a는 틀린 설명이다.

  9. 얼굴 인식(a), 지문 인식(b), 홍채 인식(c)은 모두 바이오메트릭스 응용이다. 자율주행 차량(d)은 다른 응용 분야이다.

  10. Hubel & Wiesel은 시각 시스템에서의 정보 처리를 발견하고(a) 1981년 노벨의학상을 수상했다(c). b는 Thorpe의 연구이며, d는 관련이 없다.

  11. 그레이스케일 이미지의 픽셀은 0-255 범위의 값을 가지고(a), RGB 컬러 이미지의 픽셀은 3개의 값을 가지며(b), 픽셀은 이미지의 최소 단위이다(c). d는 틀린 설명으로, 픽셀 값은 실수로도 표현될 수 있다.

  12. Structure from Motion은 부분적으로 겹치는 사진에서 3D 모델을 복원하고(a), 3D 복원 기술의 한 종류이다(d). b와 c는 틀린 설명이다.

  13. 소비자 응용은 이미지 스티칭(a), 노출 브라케팅(b), 모핑(d)이다. 기계 검사(c)는 산업 응용이므로 틀린 것이다.

  14. 컴퓨터 비전은 이미지 입력을 받아 장면에 대한 지식을 출력하는 분야(a)이며, 픽셀과 의미 사이의 간극을 메우는 것(c)이다. b와 d는 이미지 처리의 정의에 가깝다.

  15. 동일한 물체가 다른 각도에서 다르게 보이고(a), 조명 조건에 따라 외관이 변할 수 있다(b). c와 d는 틀린 설명이다.

  16. Muller-Lyer 착시는 원근감 효과 때문에 발생하고(a), Pop-out 효과는 병렬 인식 경로 정보를 제공하며(b), Hermann grid 착시는 격자 교차점에 회색 점이 나타난다(d). c는 틀린 설명이다.

  17. 동차좌표계는 모든 변환을 행렬 곱셈으로 표현할 수 있고(c), 이동도 표현 가능하다(a). b와 d는 틀린 설명이다.

  18. 2000년대는 비전과 그래픽의 상호작용 심화(b)와 데이터 기반/기계학습 접근법 발전(c)이 특징이다. a는 2010년대, d는 2020년대의 특징이다.

  19. 그레이스케일 이미지는 2차원 행렬(a), RGB 이미지는 3차원 행렬(b)로 표현되며, 각 요소는 픽셀 값이다(c). d는 틀린 설명으로, 이미지 행렬은 정방행렬이 아닐 수 있다.

  20. 현대적 응용은 모바일 비주얼 검색(a), 자동차 안전 시스템(b), 자율주행 차량(c)이다. 전통적인 비디오 감시 시스템(d)은 오래된 기술이므로 틀린 것이다.

주관식 단답형 해설

  1. Computer Vision은 이미지 입력을 받아 장면에 대한 지식(객체, 사람, 활동 등)을 출력하는 분야이다.

  2. Hubel & Wiesel은 시각 시스템에서의 정보 처리 발견으로 1981년 노벨의학상을 수상했다.

  3. Pixel은 이미지의 최소 단위로, 그레이스케일 이미지에서는 보통 0-255 범위의 값을 갖는다.

  4. Homogeneous Coordinates는 기존 좌표계에 1을 추가하여 이동을 포함한 모든 변환을 행렬 곱셈으로 표현할 수 있게 한다.

  5. Structure from Motion은 부분적으로 겹치는 수백 장의 사진에서 3D 포인트 모델을 복원하는 기술이다.