회고0708 - steelbear/HMG_Softeer_DE GitHub Wiki

개인 회고

  • small start의 중요성
    • tweet 텍스트를 분석하기 위해 전처리 코드 작성
    • 알고보니 WordCloud 라이브러리 자체에 텍스트 전처리 작업을 진행함
      • 심지어 내가 작성한 전처리 코드 결과보다 좋음
    • 먼저 결과를 볼 수 있는 매우 작은 것부터 테스트하고 나중에 기능을 추가하는 방법으로 개발하자
  • 서로 빠르게 코드와 결과 공유하기
    • Word cloud를 그렸는데 결과가 예시와 다름
    • 팀원과 코드를 공유하며 어디서 달라지는지 같이 찾아봄
      • 그 결과, 한 tweet마다 단어 빈도 수를 계산해 누적하는 방법과 여러 tweet을 한 string으로 묶고 빈도 수 계산하는 방법에서 기인함
      • 얼핏보면 두 방법으로 구한 빈도 수는 동일해야 할 것 같지만, 서로 다른 결과
      • 원인은 아직 밝혀내지 못했지만 두 방법에 결과 차이가 있음을 빠르게 발견할 수 있었음
  • Dano는 채점자가 아니다
    • 물어보는게 절대로 Cheating이 아니다
    • 좋은 질문이 아니라 그냥 질문을 하는게 중요하다
  • Data Product
    • Monolithic Architecture와 Microservice Architecture가 떠오름
      • Microservice도 High availability와 Fault Tolerance라는 장점을 가짐
      • 하지만 Microservice도 경우에 따라 Monolithic보다 관리가 복잡해지거나 비용이 커질 수 있다
        • Data Product 또한 무분별하게 만들어서는 안될 것
        • 미리 걱정할 바에 문제를 발견했을때 해결하는게 낫다
    • Data Product와 Versioning
      • AI를 활용한 Project에서도 데이터셋에 대한 versioning이 중요함
      • 이는 AI 뿐만 아니라 Data Product에서도 지속적인 관리와 versioning이 필요할 것 같다
        • 유지보수 단계가 존재하는 어떤 것이든 필수

팀 회고

Keep

  • 다른 방식으로 구현해보고 서로의 구현 방식의 장단점 논의
  • 서로의 중간결과물 자주 보여주기

Problem

  • 팀원 한명이 취업 이슈로 인해 캠프 퇴소. 인력 상실난

Try

  • 1.5인분씩 앞으로 수행해야할 노력과 의지가 요구됨.
  • Dano에게 자주 물어보기
  • 팀원끼리 단계별로 수행 후 피드백 해주기.
  • 코드 정리 잘하기. (주석,함수 가독성 높게 작성)
  • 먼저 작게 만들어서 빠르게 테스트해보기 (프로토타입)
  • 내일부터 어떤 데이터셋을 선택할지 집에서 생각해오기.