2021.07.01 | 기획 회의 | 기업 미팅 - woowacourse-teams/2021-gpu-is-mine GitHub Wiki
📅 210701(목)
◻ 데일리
- 각자 시나리오 준비 확인하기
- 오디오 물릴 때, 손들고 발언권 얻기 (개발 문화)
- 서기 결정하기
서기는 다음주 회고장이 하는 것으로 룰로 정함 VS 서기는 회고장이 지정함
- 서기는 다음주 회고장이 진행하고 + 서기장은 다른 크루에게 도움을 요청할 수 있다.
- 그 날의 이슈들에 대해서 위키에 남긴다
- (완태) 씨유가 미팅 관련해서 잘 대응해줬는데, 우리 단에서 커뮤니케이션 하는 방법에 대해서 익혀야함
- (코기) 모이는 비용 관련 => 오전 10시에 바로바로 모이기 in 백엔드 강의실
◻ 오전 및 오후 기획 회의
- 여러가지 방면을 고려하며 토론 진행
- [결론] 모든 전반적인 과정을 이해하려고 노력하기 보다는, 우선 집중해야 할 부분부터 지식을 붙여나가는 방식으로
- 1차 main job =>
GPU Job 예약
◻ 뉴럴웍스 미팅
DB
에 total epoch
과 current epoch
에 대한 정보를 갖고 있으면 좋겠다.
GPU내껀데(APP)
⇒ 소스 코드 + 학습 데이터는 알 수 없음. 학습 이름 정보만 등록하는 방식으로 설계
GPU 서버 현황
관련
- CPU, GPU 사용률 , 메모리 사용률은 시시각각 변하는 값입니다만, 일단 고정값으로 보여주면 되겠습니다. 백엔드에서 고정값 또는 랜덤값으로 구현.
실제 Job
? job은 docker container 로 실행되는 부분. docker관련 정보, job내부의 실제 딥러닝 소스코드 관련 부분은 이번 구현에서 굳이 다루지 않기
Job 시각화
: job 대기열 상태를 보여주는 것은 아주 좋습니다. 각 job이 누구의 job인지 보여주면 더 좋겠네요
- job은 정확히는 하나의 서버가 아니라, 서버내의 하나의 GPU 보드에 할당이 됩니다.
- 동일 서버내의 여러 보드는 모두 같은 성능(스펙)이라고 가정
- 서비스 컨셉: 순서에 대한 예약. 은행창구 대기열이라고 보시면 되겠습니다.
- 도커 이미지 내에 모든 정보가 포함됨(학습 코드 / 데이터 셋)