회고0708 - steelbear/HMG_Softeer_DE GitHub Wiki

개인 회고

small start의 중요성
- tweet 텍스트를 분석하기 위해 전처리 코드 작성
- 알고보니 WordCloud 라이브러리 자체에 텍스트 전처리 작업을 진행함
  - 심지어 내가 작성한 전처리 코드 결과보다 좋음
- 먼저 결과를 볼 수 있는 매우 작은 것부터 테스트하고 나중에 기능을 추가하는 방법으로 개발하자
서로 빠르게 코드와 결과 공유하기
- Word cloud를 그렸는데 결과가 예시와 다름
- 팀원과 코드를 공유하며 어디서 달라지는지 같이 찾아봄
  - 그 결과, 한 tweet마다 단어 빈도 수를 계산해 누적하는 방법과 여러 tweet을 한 string으로 묶고 빈도 수 계산하는 방법에서 기인함
  - 얼핏보면 두 방법으로 구한 빈도 수는 동일해야 할 것 같지만, 서로 다른 결과
  - 원인은 아직 밝혀내지 못했지만 두 방법에 결과 차이가 있음을 빠르게 발견할 수 있었음
Dano는 채점자가 아니다
- 물어보는게 절대로 Cheating이 아니다
- 좋은 질문이 아니라 그냥 질문을 하는게 중요하다
Data Product
- Monolithic Architecture와 Microservice Architecture가 떠오름
  - Microservice도 High availability와 Fault Tolerance라는 장점을 가짐
  - 하지만 Microservice도 경우에 따라 Monolithic보다 관리가 복잡해지거나 비용이 커질 수 있다
    - Data Product 또한 무분별하게 만들어서는 안될 것
    - 미리 걱정할 바에 문제를 발견했을때 해결하는게 낫다
- Data Product와 Versioning
  - AI를 활용한 Project에서도 데이터셋에 대한 versioning이 중요함
  - 이는 AI 뿐만 아니라 Data Product에서도 지속적인 관리와 versioning이 필요할 것 같다
    - 유지보수 단계가 존재하는 어떤 것이든 필수

팀 회고

Keep

다른 방식으로 구현해보고 서로의 구현 방식의 장단점 논의
서로의 중간결과물 자주 보여주기

Problem

팀원 한명이 취업 이슈로 인해 캠프 퇴소. 인력 상실난

Try

1.5인분씩 앞으로 수행해야할 노력과 의지가 요구됨.
Dano에게 자주 물어보기
팀원끼리 단계별로 수행 후 피드백 해주기.
코드 정리 잘하기. (주석,함수 가독성 높게 작성)
먼저 작게 만들어서 빠르게 테스트해보기 (프로토타입)
내일부터 어떤 데이터셋을 선택할지 집에서 생각해오기.