2021.07.01 | 기획 회의 | 기업 미팅 - woowacourse-teams/2021-gpu-is-mine GitHub Wiki

📅 210701(목)

◻ 데일리

  1. 각자 시나리오 준비 확인하기
  2. 오디오 물릴 때, 손들고 발언권 얻기 (개발 문화)
  3. 서기 결정하기
    • 서기는 다음주 회고장이 하는 것으로 룰로 정함 VS 서기는 회고장이 지정함
    • 서기는 다음주 회고장이 진행하고 + 서기장은 다른 크루에게 도움을 요청할 수 있다.
  4. 그 날의 이슈들에 대해서 위키에 남긴다
  5. (완태) 씨유가 미팅 관련해서 잘 대응해줬는데, 우리 단에서 커뮤니케이션 하는 방법에 대해서 익혀야함
  6. (코기) 모이는 비용 관련 => 오전 10시에 바로바로 모이기 in 백엔드 강의실
    • 온라인 => 구글 미트 진행 or 준줌방

◻ 오전 및 오후 기획 회의

  1. 여러가지 방면을 고려하며 토론 진행
  2. [결론] 모든 전반적인 과정을 이해하려고 노력하기 보다는, 우선 집중해야 할 부분부터 지식을 붙여나가는 방식으로
    • 1차 main job => GPU Job 예약

◻ 뉴럴웍스 미팅

  • DBtotal epochcurrent epoch에 대한 정보를 갖고 있으면 좋겠다.
  • GPU내껀데(APP) ⇒ 소스 코드 + 학습 데이터는 알 수 없음. 학습 이름 정보만 등록하는 방식으로 설계
  • GPU 서버 현황 관련
    • CPU, GPU 사용률 , 메모리 사용률은 시시각각 변하는 값입니다만, 일단 고정값으로 보여주면 되겠습니다. 백엔드에서 고정값 또는 랜덤값으로 구현.
  • 실제 Job? job은 docker container 로 실행되는 부분. docker관련 정보, job내부의 실제 딥러닝 소스코드 관련 부분은 이번 구현에서 굳이 다루지 않기
  • Job 시각화: job 대기열 상태를 보여주는 것은 아주 좋습니다. 각 job이 누구의 job인지 보여주면 더 좋겠네요
  • job은 정확히는 하나의 서버가 아니라, 서버내의 하나의 GPU 보드에 할당이 됩니다.
  • 동일 서버내의 여러 보드는 모두 같은 성능(스펙)이라고 가정
  • 서비스 컨셉: 순서에 대한 예약. 은행창구 대기열이라고 보시면 되겠습니다.
  • 도커 이미지 내에 모든 정보가 포함됨(학습 코드 / 데이터 셋)