Java ‐ File, Files - thought-corner/Backend-PlayGround GitHub Wiki

File

  • 자바에서 파일 또는 디렉터리를 다룰 때는 File, Files, Path 클래스를 사용하면 된다.

Files

  • Files, PathFile를 대체하기 위해 등장했다.

Files의 특징

  • 성능과 편의성이 모두 개선되었다.
  • File은 과거 호환을 유지하기 위헤 남겨둔 기능이다.
  • 수많은 유틸리티 기능이 있다.

파일 복사 최적화

  • Files.copy() → 자바에 파일 데이터를 불러오지 않고 운영체제의 파일 복사 기능을 사용한다.
  • 파일 전체를 메모리로 불러와 새로운 파일을 생성해야하는 중간 과정이 생략된다.

📚File Copy

  • 자바 어플리케이션으로 데이터를 일일이 퍼올리는 것보다 운영체제(Kernel Scope) 수준에서 직접 처리하도록 명령하는 것이 훨씬 효율적이다.

1. 데이터 복사 비용의 절감(Zero-Copy)

  • 일반적인 자바 I/O 방식(FileInputStream 등)은 데이터가 전달될 때 여러 번의 복사 과정을 거친다.
  • Disk → Kernel Buffer : 하드디스크에서 커널 메모리로 복사
  • Kernel Buffer → Java Application : 커널에서 자바 애플리케이션의 힙 메모리로 다시 복사
  • 이 과정에서 CPU 자원이 소모되고, 자바 힙 메모리에 데이터가 쌓이면서 GC 부하가 커진다. 반면 운영체제에 맡기는 방식은 데이터를 자바 영역으로 가져오지 않고 커널 안에서 바로 네트워크 전송이나 다른 파일로 쏴버린다.

2. 컨텍스트 스위칭(Context Switching) 감소

  • 자바가 데이터를 직접 제어하려면 Application - Kernel을 왔다 갔다 해야 한다. 이 과정이 컨텍스트 스위칭이며 이 전환 비용은 상당하다.
  • 운영체제에 권한을 위임하면 이런 컨텍스트 스위칭 횟수가 획기적으로 줄면서 레이턴시가 낮아진다.

3. 커널 캐시(Page Cache)의 효율적 활용

  • 운영체제는 자주 쓰이는 파일 데이터를 메모리에 미리 올려둔다.(=Page Cache)
  • 자바 애플리케이션이 직접 데이터를 관리하려고 들면 OS의 최적화 기능을 제대로 활용하지 못하거나, 메모리만 이중으로 낭비(OS 캐시 + Java Application Heap)하게 될 가능성이 크다.