Spring Batch ‐ FlatFileItemReader - dnwls16071/Backend_Summary GitHub Wiki

📚 Spring Batch - FlatFileItemReader

  • 플랫 파일이란, 단순하게 행렬로 구성된 파일이다.
  • 각 라인이 하나의 데이터다 - 파일의 한 줄은 독립적인 하나의 레코드로 취급, 줄 바꿈(\n)이 레코드의 끝을 의미한다 구분자나 고정 길이로 각 필드를 구분할 수 있다.
  • 다양한 구분자를 지원한다.
  • 강력한 호환성과 범용성 - 엑셀, 데이터베이스 등 다양한 도구와 호환된다 사람도 쉽게 읽을 수 있어 디버깅이 용이하다 대용량 데이터 처리에도 적합한 단순한 구조

FlatFileItemReader의 read() 메서드

  • FlatFileItemReader의 read() 메서드의 핵심 동작은 크게 두 단계로 이루어진다.
1. 파일에서 한 줄을 읽어온다.
2. 읽어온 한 줄의 문자열을 우리가 사용할 객체로 변환해 리턴한다.
  • LineMapper는 파일의 한 줄을 우리가 사용할 객체로 변환한다.

토큰화: 텍스트 한 줄을 의미있는 필드(token)으로 나누기

  • DelimitedLineTokenizer : 쉼표(,)와 같은 구분자로 구분된 데이터를 토큰화
  • FixedLengthTokenizer : 고정 길이로 구분된 데이터를 토큰화

객체 매핑: 토큰화된 필드들(FieldSet)을 객체에 매핑

public interface FieldSetMapper<T> {
    T mapFieldSet(FieldSet fieldSet) throws BindException;
}
  • mapFieldSet()는 LineTokenizer가 만든 FieldSet 객체를 입력 받아 우리가 원하는 자바 객체(SystemFailure)로 최종 변환한다.
  • 별도 설정이 없다면 BeanWrapperFieldSetMapper가 기본 FieldSetMapper로 사용된다.

FlatFileItemReader 전체 구조

📚 FlatItemReader 관련 공식문서 레퍼런스