CNN 만들기 - BD-SEARCH/MLtutorial GitHub Wiki

폭풍수정예정...

목표

  • CNN으로 간단한 학습 모델을 만들어 training set, test set 을 통해 evaluate해본다.
  • 적은 data set을 부풀려 overfitting을 만든다.
  • 간단한 이미지(circle, rec, tri)를 학습한다.
  • 복잡한 이미지를 학습한다. : 컴퓨터가 견딜까?
  • 동영상 베이스로 학습한다. : 목표 ㅋㅅㅋ
  • 문서를 학습한다.

환경설정

사용 언어 : python3.6.1, tensorflow(keras 필요)

Tutorial

1. 파일 구성

app.py
dataset
- test_set
  - circle
  - rectangular
  - triangle
- training_set
  - circle
  - rectangular
  - triangle

2. 음

1. 데이터 생성

# 랜덤시드 고정
np.random.seed(3)

train_datagen = ImageDataGenerator(rescale=1./255,
                                  rotation_range=15,
                                  width_shift_range=0.1,
                                  height_shift_range=0.1,
                                  shear_range=0.5,
                                  zoom_range=[0.8, 2.0],
                                  horizontal_flip=True,
                                  vertical_flip=True,
                                  fill_mode='nearest')
train_generator = train_datagen.flow_from_directory('./dataset/training_set',
                                                    target_size=(500, 500),
                                                    batch_size=3,
                                                    class_mode='categorical')

test_datagen = ImageDataGenerator(rescale=1./255)
test_generator = test_datagen.flow_from_directory('./dataset/test_set',
                                                  target_size=(500, 500),
                                                  batch_size=3,
                                                  class_mode='categorical')

training generator, test generator

ImageDataGenerator와 flow_from_directory를 사용해 generator 각각 생성.

ImageDataGenerator

  • training data가 부족할 때 임의로 변형을 하여 다양한 데이터셋을 얻을 수 있다.

  • 객체를 생성한다

    • rotation_range = n : 0~n 각도 내에서 임의로 이미지를 회전시킨다.
    • width_shift_range = 0.1 : 수평방향 내에서 이미지를 이동시킨다. 전체 넓이가 100일 경우 100*0.1=10 만큼 좌우 이동한다.
    • height_shift_range = 0.1 : 수직방향 내에서 이미지를 이동시킨다. 전체 넓이가 100일 경우 100*0.1=10 만큼 상하 이동한다.
    • shear_range = 0.5 : 밀림 강도. 시계 반대 방향으로 0.5라디안 만큼 변형시킨다.
    • zoom_range = [a,b] : 확대/축소를 한다. zoom_range=a 라면 1-a ~ 1+a 만큼 확대, 축소를 한다.
    • horizontal_flip = True : 수평뒤집기를 한다.
    • vertical_flip = True : 수직뒤집기를 한다.

flow_from_directory

  • generator를 생성한다

    • 첫번째 인자 : 이미지 경로
    • target_size=(x,y) : 패치 이미지 크기를 설정한다. 원본 이미지와 상관 없이 target_size에 맞춰 수정된다.
    • batch_size : 한번에 사용하는 training data의 수
    • class_mode : 분류 방식.
      • categorical : 2차원 one-hot 부호화된 라벨 반환
      • binary : 1차원 이진 라벨 반환
      • sparse : 1차원 정수 라벨 반환
      • None : 라벨을 반환하지 않는다

batch 크기의 설정

training class의 데이터 수로 batch_size * batch실행수 설정

2. 모델 구성

model = Sequential()
model.add(Conv2D(32, kernel_size=(3, 3), activation='relu', input_shape=(500,500,3)))
model.add(Conv2D(64, (3, 3), activation='relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Flatten())
model.add(Dense(128, activation='relu'))
model.add(Dense(3, activation='softmax'))

Convolution layer (위 함수에선 2개)

  • 32 : 필터 수
  • kernel_size = (3,3) : 필터 크기 3*3
  • activation = 'relu' : activation 함수 ReLu
  • input_shape(500,500,3) : 입력 이미지 크기 500*500, 입력 이미지 채널 3개

Maxpooling layer

  • pool_size(2,2) : pool크기 2*2

Flatten layer

  • Flatten layer추가

Dense layer

  • 128 : 출력 뉴런 수 128개
  • activation : activation function

3. 모델 학습과정 설정

model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])
  • 모델 정의 후 손실함수와 최적화 알고리즘으로 엮는다.
    • loss : 가중치 세트를 평가하는데 쓰이는 손실 함수. 다중 클래스에선 categorical_crossentropy
    • optimizer : 최적의 가중치를 검색하는 데 사용되는 최적 알고리즘 중 하나인 아담 사용
    • metrics : 평가 척도. 분류 문제는 일반적으로 accuracy 사용

4. 모델 학습시키기

model.fit_generator(train_generator, steps_per_epoch=15, epochs=50, 
                    validation_data=test_generator, validation_steps=5)
  • keras에서 모델 학습시킬 때는 주로 fit()를 사용한다.
  • generate로 생성된 batch로 학습시킬 때는 fit_gerator()를 사용한다.
    • 첫번째 인자 : training data set을 제공할 generator 지정. 위에서 만든 train_generator 사용
    • steps_per_epoch : 한 epoch에 사용한 step 수. (여기선 샘플 45개일 때 batch_size 5라서 15step으로 임시 사용)
    • epochs : 전체 dataset 반복 학습 횟수
    • validation_data : validate data set을 제공할 generator 지정. 위에서 만든 test_generator 사용
    • validation_steps : 한 epochs 종료 시마다 검증할 때 사용되는 검증 스텝 수. (test data set 15개, batch_size 3라서 5step 사용)

5. 모델 평가하기

print("-- Evaluate(정확도) --")
scores = model.evaluate_generator(test_generator, steps=5)
print("%s: %.2f%%" %(model.metrics_names[1], scores[1]*100))
  • evaluate_generator 사용

6. 모델 사용하기

print("-- Predict --")
output = model.predict_generator(test_generator, steps=5)
np.set_printoptions(formatter={'float': lambda x: "{0:0.3f}".format(x)})
print(test_generator.class_indices)
print(output)
print(test_generator.filenames)
  • 예측 결과는 클래스(폴더) 별 확률 벡터로 나타난다.